브라우저 하니스: LLM에 완전한 자유를 주는 도구
LLM이 브라우저 작업을 자율적으로 수행하도록 돕는 오픈소스 도구 'Browser Harness'가 공개되었습니다. 프레임워크나 고정된 규칙 없이 크롬 CDP에 직접 연결되며, 에이전트가 작업 중 필요한 기능을 스스로 작성합니다. 실무자에게는 반복적인 웹 자동화를 간소화하고, 에이전트가 직접 도메인 스킬을 학습·공유하는 구조가 특징입니다.
Browser Harness ♞
가장 단순하고 가벼운, 자가 치유(self-healing) 하니스로, LLM에 모든 브라우저 작업을 완수할 완전한 자유를 부여합니다. CDP 위에 직접 구축되었습니다. 에이전트는 작업 중 필요한 기능이 없으면 직접 작성합니다. 프레임워크도, 레시피도, 가이드 레일도 없습니다. 크롬과 하나의 웹소켓으로 연결되며, 그 사이에 아무것도 없습니다.
● 에이전트: 파일을 업로드하고 싶음 │ ● helpers.py → upload_file() 없음 │ ● 에이전트가 하니스를 수정해 작성함 helpers.py 192 → 199줄 │ + upload_file() ✓ 파일 업로드 완료
다시는 브라우저를 직접 사용하지 않게 될 것입니다.
설정 프롬프트 Claude Code 또는 Codex에 다음을 붙여넣으세요:
"https://github.com/browser-use/browser-harness 를 설정해줘. 먼저 install.md를 읽고 이 저장소를 내 실제 브라우저에 설치하고 연결해줘. 그 다음 일반적인 사용법은 SKILL.md를 읽어줘. 함수들은 helpers.py에 있으니 항상 먼저 읽어줘. 설정이나 확인 탭을 열면, 활성화해서 내가 활성 브라우저 탭을 볼 수 있게 해줘. 설치가 끝나면, 내 브라우저에서 이 저장소를 열고, GitHub에 로그인되어 있다면 인터랙션이 잘 되는지 빠른 데모로 스타를 누를지 물어봐 — 내가 예라고 하면 스타만 클릭해. 로그인되어 있지 않으면 그냥 browser-use.com으로 가줘."
이 페이지가 나타나면, 에이전트가 브라우저에 연결할 수 있도록 체크박스를 체크하세요:
예시 작업은 domain-skills/를 참고하세요.
무료 원격 브라우저 은밀함, 서브 에이전트, 배포에 유용합니다. 무료 티어: 3개 동시 브라우저, 프록시, 캡차 해결 등 포함. 카드 불필요. cloud.browser-use.com/new-api-key에서 키를 받으세요. 또는 에이전트가 docs.browser-use.com/llms.txt를 통해 직접 가입하게 할 수도 있습니다(설정 흐름 + 챌린지 컨텍스트 포함).
얼마나 단순한가요? (~592줄의 파이썬) install.md — 최초 설치 및 브라우저 부트스트랩 SKILL.md — 일상적 사용법 run.py (~36줄) — helpers가 프리로드된 상태로 일반 파이썬 실행 helpers.py (~195줄) — 기본 도구 호출; 에이전트가 이를 편집 admin.py + daemon.py (~361줄) — 데몬 부트스트랩 및 CDP 웹소켓과 소켓 브릿지
기여
PR과 개선은 언제나 환영합니다.
가장 좋은 기여 방법: 자주 사용하는 사이트나 작업(LinkedIn 리아웃, Amazon 주문, 경비 처리 등)에 대한 새로운 도메인 스킬을 domain-skills/에 기여하세요.
각 스킬은 에이전트에게 선택자(selector), 흐름, 엣지 케이스를 알려줍니다. 그렇지 않으면 에이전트가 매번 새로 발견해야 합니다.
스킬은 당신이 아니라 하니스가 작성합니다. 에이전트로 작업을 실행하세요 — 에이전트가 명확하지 않은 것을 파악하면, 스킬을 직접 파일로 저장합니다(SKILL.md 참고).
스킬 파일을 수동으로 작성하지 마세요; 에이전트가 생성한 스킬이 브라우저에서 실제로 작동하는 것을 반영합니다.
생성된 domain-skills/
에이전트 하니스의 쓰디쓴 교훈 · 실제로 학습하는 웹 에이전트