메뉴

#웹 자동화

MP
MarkTechPost 7일 전
IMP 8

마이크로소프트, 코드로 브라우저 제어하는 오픈소스 웹 에이전트 '웹라이트' 공개

마이크로소프트 리서치가 기존의 스크린샷이나 DOM 기반의 단편적인 클릭 방식을 벗어나, 에이전트가 터미널 환경에서 직접 코드를 작성해 브라우저를 제어하는 새로운 프레임워크 '웹라이트(Webwright)'를 오픈소스로 공개했습니다. 이 방식은 자동화 스크립트를 작성하는 개발자의 방식과 유사하며, 복잡한 다단계 웹 상호작용을 압축적인 코드로 처리할 수 있게 해줍니다. 오디세이(Odysseys) 벤치마크에서 기존 기본 GPT-4o 대비 성능을 크게 끌어올리며, 코드 생성 및 디버깅 능력이 뛰어난 최신 LLM의 강점을 극대화한 접근법으로 주목받습니다.

마이크로소프트 리서치 웹라이트 웹 자동화
MP
MarkTechPost 9일 전
IMP 8

마이크로소프트, 오픈AI·구글 능가하는 웹 브라우저 에이전트 'Fara 1.5' 공개

마이크로소프트 리서치가 4B, 9B, 27B 크기의 웹 브라우저 컴퓨터 사용 에이전트 모델군인 Fara 1.5를 공개했습니다. Fara 1.5-27B 모델은 Online-Mind2Web 벤치마크에서 72%의 점수를 기록하며 오픈AI의 Operator, 구글의 Gemini 2.5 Computer Use 등 기존 최고 수준 모델들을 뛰어넘는 성능을 입증했습니다. 또한, 제한된 데이터를 활용해 에이전트를 훈련시키는 합성 데이터 파이프라인인 FaraGen1.5도 함께 발표되었습니다.

에이전트 마이크로소프트 오픈소스
HN
Hacker News 36일 전
IMP 7

브라우저 하니스: LLM에 완전한 자유를 주는 도구

LLM이 브라우저 작업을 자율적으로 수행하도록 돕는 오픈소스 도구 'Browser Harness'가 공개되었습니다. 프레임워크나 고정된 규칙 없이 크롬 CDP에 직접 연결되며, 에이전트가 작업 중 필요한 기능을 스스로 작성합니다. 실무자에게는 반복적인 웹 자동화를 간소화하고, 에이전트가 직접 도메인 스킬을 학습·공유하는 구조가 특징입니다.

웹 자동화 LLM 에이전트 오픈소스
HN
Hacker News 39일 전
IMP 7

Zig 기반 AI 에이전트용 브라우저 자동화 도구 'Kuri'

Node.js 의존성 없이 Zig 언어로 작성된 초경량 브라우저 자동화 및 웹 크롤링 도구인 Kuri가 소개되었습니다. AI 에이전트 루프에 최적화되어 기존 도구(agent-browser) 대비 토큰 사용량을 16% 줄이고, 464KB 크기의 단일 바이너리로 3ms의 매우 빠른 콜드 스타트를 자랑합니다. 복잡한 자바스크립트(JS) 렌더링이 필요 없는 독립 실행형 페처(Fetcher) 및 대화형 터미널 브라우저 모드도 내장하고 있습니다.

오픈소스 AI 에이전트 웹 자동화
HN
Hacker News 43일 전
IMP 8

AI 서브루틴: 브라우저 내부에서 자동화 스크립트 실행

이 글은 기존 웹 자동화 에이전트의 경제성과 인증(Auth) 문제를 해결하기 위해, 브라우저 확장 프로그램이 웹페이지 내부에서 직접 네트워크 요청을 녹화하고 재생하는 'AI 서브루틴(AI Subroutines)' 아키텍처를 소개합니다. 복잡한 인증 토큰이나 세션을 외부에서 강제로 재구성할 필요 없이 브라우저의 고유 실행 환경을 그대로 활용하여 안정성을 높이는 것이 핵심입니다. 또한 수많은 노이즈 요청 중 실제 의미 있는 API 호출만 추출하기 위해 요청을 평가하고 필터링하는 정교한 점수 기반 랭킹 시스템을 제공합니다.

웹 자동화 브라우저 확장 프로그램 API 최적화
HN
Hacker News 45일 전
IMP 7

Libretto: AI 브라우저 자동화를 안정적으로 만드는 오픈소스

Libretto는 코딩 에이전트가 브라우저 및 네트워크 트래픽을 실시간으로 분석하고, 사용자의 행동을 자동화 스크립트로 녹화/재생할 수 있게 돕는 도구입니다. UI 자동화 대신 안전하고 빠른 직접 네트워크 API 호출 스크립트로 변환하거나 깨진 자동화를 손쉽게 디버깅할 수 있어, 신뢰성 높은 웹 통합 구축에 필수적입니다.

웹 자동화 오픈소스 코딩 에이전트
MP
MarkTechPost 46일 전
IMP 7

타니피시 AI, AI 에이전트용 통합 웹 인프라 플랫폼 출시

타니피시 AI(TinyFish AI)가 검색, 데이터 추출, 브라우저 자동화, 에이전트 기능을 하나의 API 키로 통합 제공하는 웹 인프라 플랫폼을 출시했습니다. 실시간 웹 상호작용 및 다중 단계 워크플로우 자동화에 필요했던 파편화된 도구들을 하나로 묶어 개발팀의 구현 부담을 크게 줄여줍니다.

웹 자동화 API 에이전트