메뉴
HN
Hacker News 36일 전

브라우저 하니스: LLM에 완전한 자유를 주는 도구

IMP
7/10
핵심 요약

LLM이 브라우저 작업을 자율적으로 수행하도록 돕는 오픈소스 도구 'Browser Harness'가 공개되었습니다. 프레임워크나 고정된 규칙 없이 크롬 CDP에 직접 연결되며, 에이전트가 작업 중 필요한 기능을 스스로 작성합니다. 실무자에게는 반복적인 웹 자동화를 간소화하고, 에이전트가 직접 도메인 스킬을 학습·공유하는 구조가 특징입니다.

번역된 본문

Browser Harness ♞

가장 단순하고 가벼운, 자가 치유(self-healing) 하니스로, LLM에 모든 브라우저 작업을 완수할 완전한 자유를 부여합니다. CDP 위에 직접 구축되었습니다. 에이전트는 작업 중 필요한 기능이 없으면 직접 작성합니다. 프레임워크도, 레시피도, 가이드 레일도 없습니다. 크롬과 하나의 웹소켓으로 연결되며, 그 사이에 아무것도 없습니다.

● 에이전트: 파일을 업로드하고 싶음 │ ● helpers.py → upload_file() 없음 │ ● 에이전트가 하니스를 수정해 작성함 helpers.py 192 → 199줄 │ + upload_file() ✓ 파일 업로드 완료

다시는 브라우저를 직접 사용하지 않게 될 것입니다.

설정 프롬프트 Claude Code 또는 Codex에 다음을 붙여넣으세요:

"https://github.com/browser-use/browser-harness 를 설정해줘. 먼저 install.md를 읽고 이 저장소를 내 실제 브라우저에 설치하고 연결해줘. 그 다음 일반적인 사용법은 SKILL.md를 읽어줘. 함수들은 helpers.py에 있으니 항상 먼저 읽어줘. 설정이나 확인 탭을 열면, 활성화해서 내가 활성 브라우저 탭을 볼 수 있게 해줘. 설치가 끝나면, 내 브라우저에서 이 저장소를 열고, GitHub에 로그인되어 있다면 인터랙션이 잘 되는지 빠른 데모로 스타를 누를지 물어봐 — 내가 예라고 하면 스타만 클릭해. 로그인되어 있지 않으면 그냥 browser-use.com으로 가줘."

이 페이지가 나타나면, 에이전트가 브라우저에 연결할 수 있도록 체크박스를 체크하세요:

예시 작업은 domain-skills/를 참고하세요.

무료 원격 브라우저 은밀함, 서브 에이전트, 배포에 유용합니다. 무료 티어: 3개 동시 브라우저, 프록시, 캡차 해결 등 포함. 카드 불필요. cloud.browser-use.com/new-api-key에서 키를 받으세요. 또는 에이전트가 docs.browser-use.com/llms.txt를 통해 직접 가입하게 할 수도 있습니다(설정 흐름 + 챌린지 컨텍스트 포함).

얼마나 단순한가요? (~592줄의 파이썬) install.md — 최초 설치 및 브라우저 부트스트랩 SKILL.md — 일상적 사용법 run.py (~36줄) — helpers가 프리로드된 상태로 일반 파이썬 실행 helpers.py (~195줄) — 기본 도구 호출; 에이전트가 이를 편집 admin.py + daemon.py (~361줄) — 데몬 부트스트랩 및 CDP 웹소켓과 소켓 브릿지

기여 PR과 개선은 언제나 환영합니다. 가장 좋은 기여 방법: 자주 사용하는 사이트나 작업(LinkedIn 리아웃, Amazon 주문, 경비 처리 등)에 대한 새로운 도메인 스킬을 domain-skills/에 기여하세요. 각 스킬은 에이전트에게 선택자(selector), 흐름, 엣지 케이스를 알려줍니다. 그렇지 않으면 에이전트가 매번 새로 발견해야 합니다. 스킬은 당신이 아니라 하니스가 작성합니다. 에이전트로 작업을 실행하세요 — 에이전트가 명확하지 않은 것을 파악하면, 스킬을 직접 파일로 저장합니다(SKILL.md 참고). 스킬 파일을 수동으로 작성하지 마세요; 에이전트가 생성한 스킬이 브라우저에서 실제로 작동하는 것을 반영합니다. 생성된 domain-skills// 폴더로 PR을 열어주세요 — 작고 집중적일수록 좋습니다. 버그 수정, 문서 수정, 헬퍼 개선도 환영합니다. 기존 스킬(github/, linkedin/, amazon/ 등)을 살펴보면 형태를 알 수 있습니다. 시작할 곳을 모르겠다면 이슈를 열어주세요. 유용한 방향을 안내해 드리겠습니다.

에이전트 하니스의 쓰디쓴 교훈 · 실제로 학습하는 웹 에이전트

원문 보기
원문 보기 (영어)
Browser Harness ♞ The simplest, thinnest, self-healing harness that gives LLM complete freedom to complete any browser task. Built directly on CDP. The agent writes what's missing, mid-task. No framework, no recipes, no rails. One websocket to Chrome, nothing between. ● agent: wants to upload a file │ ● helpers.py → upload_file() missing │ ● agent edits the harness and writes it helpers.py 192 → 199 lines │ + upload_file() ✓ file uploaded You will never use the browser again. Setup prompt Paste into Claude Code or Codex: Set up https://github.com/browser-use/browser-harness for me. Read `install.md` first to install and connect this repo to my real browser. Then read `SKILL.md` for normal usage. Always read `helpers.py` because that is where the functions are. When you open a setup or verification tab, activate it so I can see the active browser tab. After it is installed, open this repository in my browser and, if I am logged in to GitHub, ask me whether you should star it for me as a quick demo that the interaction works — only click the star if I say yes. If I am not logged in, just go to browser-use.com. When this page appears, tick the checkbox so the agent can connect to your browser: See domain-skills/ for example tasks. Free remote browsers Useful for stealth, sub-agents, or deployment. Free tier: 3 concurrent browsers, proxies, captcha solving, and more. No card required. Grab a key at cloud.browser-use.com/new-api-key Or let the agent sign up itself via docs.browser-use.com/llms.txt (setup flow + challenge context included). How simple is it? (~592 lines of Python) install.md — first-time install and browser bootstrap SKILL.md — day-to-day usage run.py (~36 lines) — runs plain Python with helpers preloaded helpers.py (~195 lines) — starting tool calls; the agent edits these admin.py + daemon.py (~361 lines) — daemon bootstrap plus the CDP websocket and socket bridge Contributing PRs and improvements welcome. The best way to help: contribute a new domain skill under domain-skills/ for a site or task you use often (LinkedIn outreach, ordering on Amazon, filing expenses, etc.). Each skill teaches the agent the selectors, flows, and edge cases it would otherwise have to rediscover. Skills are written by the harness, not by you. Just run your task with the agent — when it figures something non-obvious out, it files the skill itself (see SKILL.md ). Please don't hand-author skill files; agent-generated ones reflect what actually works in the browser. Open a PR with the generated domain-skills/<site>/ folder — small and focused is great. Bug fixes, docs tweaks, and helper improvements are equally welcome. Browse existing skills ( github/ , linkedin/ , amazon/ , ...) to see the shape. If you're not sure where to start, open an issue and we'll point you somewhere useful. The Bitter Lesson of Agent Harnesses · Web Agents That Actually Learn