에이펌(Affirm), 1주일 만에 AI 에이전트 개발 조직 개편
핀테크 기업 Affirm은 800명 이상의 엔지니어를 대상으로 업무를 일주일간 중단하고 'AI 리툴링 위크'를 진행하여 60% 이상의 PR이 에이전트의 도움을 받는 체제를 단기간에 구축했습니다. Anthropic의 Claude Code를 기본 도구로 채택하고 반복 가능한 에이전트 워크플로우를 표준화하여 소수 선도 개발자의 생산성을 전체 조직으로 빠르게 전파하는 데 성공했습니다. 이 사례는 성숙해진 에이전트 AI를 실무에 도입할 때 체계적인 조직적 훈련과 인프라 재설계가 필수적임을 보여줍니다.
제목: Affirm이 1주일 만에 에이전트 기반 소프트웨어 개발을 위해 엔지니어링 조직을 개편한 방법 소스: hackernews
저자: Daniel Martin, 엔지니어링 수석 책임자, 개발자 생산성 부서
2026년 2월, 우리는 정상적인 엔지니어링 업무를 일주일간 중단하고 800명 이상의 엔지니어에게 에이전트 AI(Agentic AI)를 사용하여 아이디어 도출부터 구현, 테스트 및 코드 리뷰에 이르는 실제 작업을 수행하도록 요청했습니다. 우리는 에이전트 도구가 우리의 업무 방식을 변화시킬 만큼 충분히 성숙했으며, 이를 잘 도입하려면 도구를 둘러싼 시스템 전반을 재고해야 한다는 신중한 베팅을 했습니다. 이 글에서는 우리의 풀 리퀘스트(PR) 중 60% 이상이 어떻게 에이전트의 지원을 받게 되었는지, 즉 왜 이런 일을 했는지, 어떻게 준비했는지, 그 주은 어땠는지, 무엇이 문제였는지, 그리고 그 결과로 지금 무엇에 투자하고 있는지 다룹니다.
우리가 이 일을 한 이유 Affirm은 연간 1억 3천만 건 이상의 거래 규모로 투명한 금융 상품을 제공하는 신용 네트워크를 구축했습니다. 이 네트워크의 추가적인 확장은 양질의 소프트웨어를 출시하는 능력에 달려 있지만, 우리는 속도 측면에서 여러 제약 조건하에 운영되고 있습니다. 우리는 자금을 이동시키는 역할을 하므로 실수의 대가가 크고 품질은 계약상 타협할 수 없습니다. 우리는 구조적 병목 현상(비대한 테스트 스위트, 수동 코드 리뷰, 불안정한 CI, 그리고 우리에게 필요한 속도에 맞지 않는 배포 인프라)을 가진 12년 된 모노레포(monorepo) 위에 시스템을 구축합니다. 저는 이러한 병목 현상을 해결하기 위해 존재하는 조직인 개발자 생산성 부서를 이끌고 있습니다.
2025년 내내 우리는 이미 AI 지원 개발에 투자해 왔고, 12월까지 엔지니어링 팀의 80% 이상이 AI 지원 개발자 도구의 주간 활성 사용자가 되었습니다. 하지만 그 무렵 새로운 클래스의 도구가 중요한 분기점을 넘었습니다. Anthropic의 Opus 4.5와 같은 모델들은 에이전트 AI 개발을 실용적으로 만들었습니다. 즉, 코딩 에이전트가 이제 최소한의 인간 개입만으로 코드베이스를 검색하고, 접근 방식을 계획하고, 코드를 작성하고, 테스트를 실행하고, 실패 시 개선 작업을 반복할 수 있게 된 것입니다. 당사의 데이터와 인터뷰에 따르면 수십 명의 엔지니어가 이미 우리의 코드베이스에서 이러한 도구를 효과적으로 사용하고 있었으며, 이것이 그들의 업무 방식을 혁신하고 있었습니다. 문제는 이와 같은 가속화를 Affirm의 다른 800명의 개발자에게 어떻게 가져올 것인가였습니다.
1월 중순, 우리 사장은 전사적인 메시지를 보냈습니다. 에이전트 AI 개발은 우리가 소프트웨어를 구축하는 핵심 방식이 될 것이라고 선언한 것입니다. 이 메시지는 'AI 리툴링 주간(AI Retooling Week)'의 날짜도 설정했습니다. 모든 불필요한 회의는 연기되고, 제품 출시일은 지연되었으며, 모든 엔지니어와 매니저는 그 주가 끝날 때까지 완전히 에이전트에 의한 워크플로우(작업 할당부터 PR 제출까지)를 완료하도록 요청받았습니다. 우리가 점진적인 도입 대신 일주일간의 전담 기간을 선택한 이유는 이러한 도구를 이미 효과적으로 사용하고 있는 엔지니어와 동료들 사이의 격차가 커지고 있었고, 이를 빠르게 좁히고 싶었기 때문입니다.
기반 구축 리툴링을 준비하면서 우리는 9명의 엔지니어로 구성된 실무 그룹을 구성했습니다. 그들의 임무는 2주 안에 맞춤형 설정이나 전문 지식 없이도 일반 개발자가 대부분의 코딩 작업을 자동화할 수 있는 반복 가능한 에이전트 워크플로우를 만드는 것이었습니다. 이 그룹은 이후의 모든 과정을 형성한 세 가지 결정을 내렸습니다. 첫째, 단일 기본 툴체인입니다. 우리는 Claude Code를 기본 에이전트 코딩 도구로 선택하고 그 기본 요소에 맞춰 전체 워크플로우를 작성했으므로, 엔지니어들은 첫날부터 명확한 출발점을 가질 수 있었습니다. 둘째, 로컬 우선(local-first) 개발이었습니다. 툴링 환경이 중앙 집중식 플랫폼으로 수렴되지 않았고 우리는 엔지니어들이 즉시 생산성을 낼 수 있기를 원했기 때문입니다. 셋째, 판단이 중요한 명시적인 인간 체크포인트였습니다. 의도 제공, 계획 승인, 코드 검토 및 병합(merge) 단계가 그것입니다. 이러한 체크포인트를 제외한 나머지 지루하고 반복적인 작업은 안전하게 제거할 수 있는 만큼 자동화했습니다.
'기본' 도구가 '의무'를 의미하지는 않았습니다. 그것은 시작하는 데 따르는 마찰을 줄인다는 뜻이었습니다. 다른 도구를 선호하는 엔지니어들도 약간의 수정을 거치면 대부분의 동일한 결과물을 재사용할 수 있었습니다. 기본값이 맞지 않는 경우 기술 총괄(Tech Leads)이 자신의 팀에 맞게 조정을 담당했습니다. 우리가 가르친 멘탈 모델은 단순하고 도구에 구애받지 않았습니다. 계획(Plan), 검토(Review), 실행(Execute), 확인(Verify), 반복(Repeat)의 프로세스였습니다.