메뉴

#파이썬

MP
MarkTechPost 1일 전
IMP 8

파이썬으로 170만 건 AI 에이전트 데이터셋 구축하기

에이전트 상호작용 기록(Trace) 170만 건을 포함한 역대 최대 규모의 오픈소스 데이터셋인 'AgentTrove'를 활용하는 파이썬 실전 튜토리얼을 소개합니다. 이 튜토리얼은 대용량 데이터를 전체 다운로드 없이 스트리밍하고, 성공적인 기록만 추출해 고품질 SFT(Supervised Fine-Tuning) 데이터셋으로 변환하는 방법을 다룹니다. AI 에이전트의 파인튜닝을 위한 대규모 학습 데이터를 효율적으로 구축하려는 실무자들에게 매우 유용한 가이드입니다.

데이터셋 에이전트 파인튜닝
HN
Hacker News 11일 전
IMP 8

8B 모델 에이전트 성능 53%→99% 끌어올린 가드레일 'Forge'

자체 호스팅되는 소형 LLM(8B)의 도구 호출 및 에이전트 성능을 극적으로 끌어올려주는 'Forge' 라이브러리가 소개되었습니다. 파싱 오류 복구, 재시도 넛지, 컨텍스트 관리 등의 가드레일 기술을 통해 소형 모델로도 복잡한 다단계 에이전트 워크플로우에서 99%에 육박하는 높은 성공률을 기록할 수 있습니다. OpenAI 호환 프록시 서버 모드를 지원하여 기존 클라이언트(예: Cursor, Continue 등)에 쉽게 통합해 성능을 높일 수 있는 것이 큰 장점입니다.

오픈소스 로컬-LLM 에이전트
MP
MarkTechPost 22일 전
IMP 7

Scanpy를 활용한 단일세포 RNA-seq 분석 파이프라인 구축

본 튜토리얼은 생물정보학의 핵심 기술인 단일세포 RNA 시퀀싱(scRNA-seq) 데이터를 분석하는 전체 파이프라인을 다룹니다. Python의 대표적인 라이브러리인 Scanpy를 활용하여 PBMC-3k 벤치마크 데이터셋을 전처리하고, Leiden 알고리즘으로 세포를 클러스터링하며, 세포 주기를 교정한 뒤 주요 마커를 통해 세포 유형을 주석(annotation) 달아냅니다. 나아가 PAGA와 확산 의사시간(diffusion pseudotime)을 통해 세포의 발달 궤적을 탐색하는 고급 실무 기법까지 제공하므로 데이터 사이언티스트와 생물학 연구자에게 매우 유용합니다.

데이터-사이언스 생물정보학 파이썬
MP
MarkTechPost 23일 전
IMP 6

클로크브라우저 자동화 실습 가이드

클로크브라우저(CloakBrowser)를 활용해 탐지를 우회하는 스텔스(Stealth) 크롬 환경에서 브라우저 자동화를 구축하는 튜토리얼입니다. 구글 코랩(Colab)과 같은 비동기 루프 환경에서 발생하는 오류를 스레드 분리로 해결하고, 세션 상태 저장 및 브라우저 신호 검출 등 핵심 실습 과정을 다룹니다. 웹 스크래핑 및 자동화 실무자들이 계정 보호와 안정적인 작업 수행을 위해 참고할 만한 내용입니다.

브라우저 자동화 웹 스크래핑 파이썬
MP
MarkTechPost 25일 전
IMP 7

NiceGUI 실시간 대시보드 멀티페이지 앱 만들기

파이썬 기반 웹 프레임워크인 NiceGUI를 활용해 실시간 대시보드, CRUD, 파일 업로드, 비동기 채팅이 가능한 멀티페이지 앱을 구축하는 튜토리얼입니다. 다크 모드와 반응형 바인딩을 지원하며, 재사용 가능한 레이아웃 설계 방법도 다룹니다. 파이썬으로 빠르고 인터랙티브한 웹 앱을 만들고자 하는 실무자에게 유용한 가이드입니다.

nicegui 파이썬 웹개발
MP
MarkTechPost 30일 전
IMP 8

에이전트 UI 및 상태 동기화 심층 튜토리얼

순수 파이썬만을 사용해 외부 프레임워크에 의존하지 않고 전체 에이전트 UI(Agentic UI) 스택을 밑바닥부터 구축하는 심층 튜토리얼입니다. AG-UI 이벤트 스트림과 A2UI 선언형 레이어를 도입하여 자연어 기반 UI 생성, JSON Patch를 활용한 상태 동기화, 그리고 안전한 인간 개입(Human-in-the-loop) 승인 흐름을 구현하는 과정을 다룹니다.

에이전트 UI 생성형 UI 상태 동기화
HN
Hacker News 47일 전
IMP 7

클로드가 비행기를 조종할 수 있을까?

한 사용자가 앤스로픽의 AI 모델 '클로드'에게 X-Plane 12 비행 시뮬레이터 API를 검색하게 하고, Cessna 172 항공기를 이륙시켜 인근 공항으로 비행 및 착륙을 시도하게 했습니다. 클로드는 비행에 필요한 파이썬 제어 스크립트를 스스로 작성하고 실시간으로 수정했지만, 데이터 처리 지연과 급격한 자세 제어로 인해 두 차례 비행기가 추락하는 결과를 낳았습니다. 이 실험은 대규모 언어 모델이 복잡하고 역동적인 시스템 제어 환경에서 어떻게 대응하고 코드를 개선해 나가는지 보여주는 인상적인 사례입니다.

에이전트 시뮬레이션 클로드
MP
MarkTechPost 47일 전
IMP 7

구글 ADK 다중 에이전트 파이프라인 튜토리얼

이번 튜토리얼에서는 구글 ADK(Google ADK)를 활용하여 고급 데이터 분석 파이프라인을 구축하고, 실제 분석 업무에 투입할 수 있는 실용적인 다중 에이전트(Multi-Agent) 시스템으로 구성하는 방법을 소개합니다. 환경 설정부터 보안 API 액세스 구성, 중앙 집중식 데이터 저장소 생성을 거쳐 데이터 로딩, 통계적 검정, 시각화 등의 전문 도구를 정의합니다. 이를 통해 복잡한 데이터 분석 및 보고서 생성 과정을 자동화하고 효율화할 수 있어 개발 및 데이터 실무자들에게 중요한 참고 자료가 됩니다.

구글 ADK 다중 에이전트 데이터 분석
MP
MarkTechPost 48일 전
IMP 7

DuckDB-파이썬 분석 파이프라인 실전 구축 가이드

본 튜토리얼은 DuckDB와 파이썬을 활용하여 고성능 데이터 분석 파이프라인을 구축하는 방법을 다룹니다. SQL, 데이터프레임, Parquet 포맷 통합부터 대용량 데이터 삽입 및 병렬 처리 등 실무적인 성능 최적화 기법까지 코드와 함께 상세히 설명합니다. 데이터 엔지니어와 과학자들에게 빠르고 효율적인 인메모리 분석 엔진인 DuckDB의 활용법을 심도 있게 제공합니다.

데이터 분석 파이썬 DuckDB
HN
Hacker News 53일 전
IMP 7

에이전트 실행 환경으로 활용 가능한 반응형 파이썬 노트북

AI 에이전트를 실행 중인 marimo 노트북 환경에 연결하여, 에이전트가 작업 기억 공간과 파이썬 런타임으로 이를 활용할 수 있게 해주는 'marimo pair' 툴킷이 공개되었습니다. 이를 통해 에이전트가 코드를 실행하고 변수를 검사하며 UI를 제어할 수 있어, 인간과 에이전트 간의 원활한 데이터 작업 및 연구 협업이 가능해집니다. 기존 REPL과 달리 데이터플로우 그래프를 기반으로 실행되어 재현 가능한 프로그램을 점진적으로 구축할 수 있다는 것이 핵심 기술적 차별점입니다.

오픈소스 코딩 에이전트 파이썬