세일즈포스, AI 에이전트 도입으로 API 마이그레이션 기간 231일에서 13일로 단축
세일즈포스는 전체 소프트웨어 개발 프로세스를 AI 에이전트 기반으로 전환한 결과, 기존 231일이 걸릴 것으로 예상했던 API 마이그레이션 작업을 단 13일 만에 완료했습니다. 개발자들은 코드를 직접 작성하는 대신 여러 AI 에이전트를 조율하는 오케스트레이터 역할로 전환되었으며, 생산성이 크게 향상됨과 동시에 오류 발생률도 감소한 것으로 나타났습니다.
현재 코딩 분야에서 '에이전트적 전환(agentic shift)'만큼 활발한 논쟁을 불러일으키는 주제는 없습니다. 개발자들은 이제 코드를 한 줄씩 직접 작성하는 대신, AI 에이전트를 통해 소프트웨어 창출을 조율하고 있습니다. 세일즈포스(Salesforce)는 이러한 변화를 뒷받침하는 자체적인 성과 지표를 공개했습니다.
세일즈포스의 엔지니어링 총괄 책임자인 스리니바스 탈라프라가다(Srinivas Tallapragada)의 게시물에 따르면, 회사는 전체 개발 조직을 에이전트 워크플로우로 전환했다고 밝혔습니다. 앤스로픽(Anthropic)의 '클로드 코드(Claude Code)'를 전사적으로 메인 AI 에이전트로 도입했으며, 모든 개발자에게 사용량 제한 없는 무제한 토큰을 제공했습니다.
2026년 4월 기준, 세일즈포스는 작년 동월 대비 효율성이 급증했다고 보고했습니다. 개발자당 완료된 작업 항목은 50.8% 증가했습니다. 개발자당 병합된 풀 리퀘스트(PR)는 79% 증가했습니다. 실제로 배포된 코드의 가치를 측정하기 위해 설계된 머신러닝 기반 '유효 산출물 점수(Effective Output Score)'는 151.3% 향상되었습니다. 단, 이 수치들은 외부적으로 독립적인 검증이 이루어진 것은 아닙니다.
산출량 증가, 사건(인시던트) 감소 이러한 속도라면 코드 품질이 저하되지 않을까 하는 당연한 의문에 대해 탈라프라가다는 자체 모니터링 플랫폼인 '엔지니어링 360(Engineering 360)'을 언급하며 답변합니다. 풀 리퀘스트가 급증했음에도 불구하고 인시던트는 5% 감소했습니다. 그는 안전 가드레일과 품질 표준이 에이전트 워크플로우에 기본적으로 내재되어 있다고 설명합니다. 탈라프라가다는 "에이전트 도구가 제대로 적용될 때, 품질은 속도 때문에 저하되지 않고 오히려 그 이점을 누리게 된다"고 작성했습니다. 다만 세일즈포스는 이러한 주장을 뒷받침할 외부 감사나 독립적인 측정 결과는 제공하지 않았습니다.
탈라프라가다에 따르면, 엔지니어들은 이제 기성 도구를 사용하는 것을 넘어 자체적인 에이전트 워크플로우를 구축하고 있습니다. 팀의 맥락, 명명 규칙 및 워크플로우 패턴을 내재화하는 재사용 가능한 기능인 이른바 '클로드 코드 스킬(Claude Code skills)'은 새로운 형태의 엔지니어링 결과물이 되었습니다. 또한 세일즈포스는 모든 개발자를 위한 공통 기반 역할을 하는 'AI 전문가 제품군(AI Expert Suite)' 및 '세일즈포스 파운데이션 플러그인(Salesforce Foundation Plugins)'이라는 엄선된 라이브러리를 구축했습니다.
더 큰 작업 내에서 병렬적인 작업 흐름을 처리하는 전문 AI 에이전트인 '하위 에이전트(Sub-agents)' 및 '에이전트 팀'은 복잡한 작업이 분할되는 방식을 변화시키고 있습니다. 개발자들은 더 이상 5개의 시스템을 오가며 작업할 필요가 없습니다. 그저 원하는 결과를 설명하기만 하면, 조율된 에이전트들이 개별 단계를 알아서 처리합니다.
API 마이그레이션, 231일에서 13일로 구체적인 예시로 탈라프라가다는 33개의 API 엔드포인트를 새로운 클라우드 네이티브 아키텍처로 마이그레이션(이관)한 사례를 꼽았습니다. 전통적인 접근 방식으로는 약 231명의 인력이 투입되는 일(man-days)이 소요될 것으로 회사는 추정했습니다. 그러나 마크다운 파일과 참조 구현이 포함된 클로드 기반의 규칙 기반 프레임워크를 활용하여 마이그레이션을 13일 만에 완료했으며, 이는 기존보다 18배 빠른 속도입니다.
각 라운드의 PR(풀 리퀘스트) 피드백은 규칙 세트에 다시 반영되어 정확도가 지속적으로 개선되었습니다. 또한 수동 개입 없이 빌드, 수정, 검증을 수행하는 자율적인 LLM 루프가 실행되었습니다. 마이그레이션은 격리된 환경에서 병렬로 진행되었습니다. 그 결과 총 5개의 풀 리퀘스트가 생성되었으며, 가장 큰 단일 PR 하나만으로도 완전한 테스트 커버리지를 갖춘 21개의 엔드포인트가 처리되었습니다.
탈라프라가다는 "오늘날 가장 중요한 기술은 에이전트 시스템을 위해 문제를 어떻게 구조화할지, 언제 작업을 위임하고 언제 개입할지, 그리고 재사용 가능한 에이전트 워크플로우를 어떻게 구축할지 아는 것"이라고 강조했습니다.