메뉴
BL
The Decoder 1일 전

세일즈포스, AI 에이전트 도입으로 API 마이그레이션 기간 231일에서 13일로 단축

IMP
8/10
핵심 요약

세일즈포스는 전체 소프트웨어 개발 프로세스를 AI 에이전트 기반으로 전환한 결과, 기존 231일이 걸릴 것으로 예상했던 API 마이그레이션 작업을 단 13일 만에 완료했습니다. 개발자들은 코드를 직접 작성하는 대신 여러 AI 에이전트를 조율하는 오케스트레이터 역할로 전환되었으며, 생산성이 크게 향상됨과 동시에 오류 발생률도 감소한 것으로 나타났습니다.

번역된 본문

현재 코딩 분야에서 '에이전트적 전환(agentic shift)'만큼 활발한 논쟁을 불러일으키는 주제는 없습니다. 개발자들은 이제 코드를 한 줄씩 직접 작성하는 대신, AI 에이전트를 통해 소프트웨어 창출을 조율하고 있습니다. 세일즈포스(Salesforce)는 이러한 변화를 뒷받침하는 자체적인 성과 지표를 공개했습니다.

세일즈포스의 엔지니어링 총괄 책임자인 스리니바스 탈라프라가다(Srinivas Tallapragada)의 게시물에 따르면, 회사는 전체 개발 조직을 에이전트 워크플로우로 전환했다고 밝혔습니다. 앤스로픽(Anthropic)의 '클로드 코드(Claude Code)'를 전사적으로 메인 AI 에이전트로 도입했으며, 모든 개발자에게 사용량 제한 없는 무제한 토큰을 제공했습니다.

2026년 4월 기준, 세일즈포스는 작년 동월 대비 효율성이 급증했다고 보고했습니다. 개발자당 완료된 작업 항목은 50.8% 증가했습니다. 개발자당 병합된 풀 리퀘스트(PR)는 79% 증가했습니다. 실제로 배포된 코드의 가치를 측정하기 위해 설계된 머신러닝 기반 '유효 산출물 점수(Effective Output Score)'는 151.3% 향상되었습니다. 단, 이 수치들은 외부적으로 독립적인 검증이 이루어진 것은 아닙니다.

산출량 증가, 사건(인시던트) 감소 이러한 속도라면 코드 품질이 저하되지 않을까 하는 당연한 의문에 대해 탈라프라가다는 자체 모니터링 플랫폼인 '엔지니어링 360(Engineering 360)'을 언급하며 답변합니다. 풀 리퀘스트가 급증했음에도 불구하고 인시던트는 5% 감소했습니다. 그는 안전 가드레일과 품질 표준이 에이전트 워크플로우에 기본적으로 내재되어 있다고 설명합니다. 탈라프라가다는 "에이전트 도구가 제대로 적용될 때, 품질은 속도 때문에 저하되지 않고 오히려 그 이점을 누리게 된다"고 작성했습니다. 다만 세일즈포스는 이러한 주장을 뒷받침할 외부 감사나 독립적인 측정 결과는 제공하지 않았습니다.

탈라프라가다에 따르면, 엔지니어들은 이제 기성 도구를 사용하는 것을 넘어 자체적인 에이전트 워크플로우를 구축하고 있습니다. 팀의 맥락, 명명 규칙 및 워크플로우 패턴을 내재화하는 재사용 가능한 기능인 이른바 '클로드 코드 스킬(Claude Code skills)'은 새로운 형태의 엔지니어링 결과물이 되었습니다. 또한 세일즈포스는 모든 개발자를 위한 공통 기반 역할을 하는 'AI 전문가 제품군(AI Expert Suite)' 및 '세일즈포스 파운데이션 플러그인(Salesforce Foundation Plugins)'이라는 엄선된 라이브러리를 구축했습니다.

더 큰 작업 내에서 병렬적인 작업 흐름을 처리하는 전문 AI 에이전트인 '하위 에이전트(Sub-agents)' 및 '에이전트 팀'은 복잡한 작업이 분할되는 방식을 변화시키고 있습니다. 개발자들은 더 이상 5개의 시스템을 오가며 작업할 필요가 없습니다. 그저 원하는 결과를 설명하기만 하면, 조율된 에이전트들이 개별 단계를 알아서 처리합니다.

API 마이그레이션, 231일에서 13일로 구체적인 예시로 탈라프라가다는 33개의 API 엔드포인트를 새로운 클라우드 네이티브 아키텍처로 마이그레이션(이관)한 사례를 꼽았습니다. 전통적인 접근 방식으로는 약 231명의 인력이 투입되는 일(man-days)이 소요될 것으로 회사는 추정했습니다. 그러나 마크다운 파일과 참조 구현이 포함된 클로드 기반의 규칙 기반 프레임워크를 활용하여 마이그레이션을 13일 만에 완료했으며, 이는 기존보다 18배 빠른 속도입니다.

각 라운드의 PR(풀 리퀘스트) 피드백은 규칙 세트에 다시 반영되어 정확도가 지속적으로 개선되었습니다. 또한 수동 개입 없이 빌드, 수정, 검증을 수행하는 자율적인 LLM 루프가 실행되었습니다. 마이그레이션은 격리된 환경에서 병렬로 진행되었습니다. 그 결과 총 5개의 풀 리퀘스트가 생성되었으며, 가장 큰 단일 PR 하나만으로도 완전한 테스트 커버리지를 갖춘 21개의 엔드포인트가 처리되었습니다.

탈라프라가다는 "오늘날 가장 중요한 기술은 에이전트 시스템을 위해 문제를 어떻게 구조화할지, 언제 작업을 위임하고 언제 개입할지, 그리고 재사용 가능한 에이전트 워크플로우를 어떻게 구축할지 아는 것"이라고 강조했습니다.

원문 보기
원문 보기 (영어)
Salesforce claims AI agents cut a 231-day migration to 13 days with fewer incidents Matthias Bastian View the LinkedIn Profile of Matthias Bastian May 30, 2026 GPT-Image-2 prompted by THE DECODER Key Points Salesforce has shifted its entire software development process to AI agents powered by Anthropic's Claude Code, operating without token limits, marking a fundamental change in how the company builds software. The results have been striking: developers now produce 79 percent more pull requests while simultaneously reducing error rates, with one API migration completed in just 13 days compared to an original estimate of 231 days. Rather than writing code manually, developers have taken on a new role as orchestrators of specialized agent teams, coordinating multiple AI agents to tackle complex development tasks collaboratively. Ask about this article… Search Few topics spark as much debate right now as the "agentic shift" in coding. Instead of writing code line by line, developers orchestrate software creation through AI agents. Salesforce is now putting its own numbers behind that shift. In a post by Srinivas Tallapragada, Salesforce's head of engineering, the company says it has moved its entire development organization to agentic workflows. They rolled out Anthropic's Claude Code across the whole company as the main AI agent and gave every developer unlimited tokens to use it. For April 2026, Salesforce reports a sharp efficiency jump compared to the same month last year. Completed work items per developer rose 50.8 percent. Merged pull requests per developer climbed 79 percent. Ad An ML-based "Effective Output Score" designed to measure the actual value of shipped code improved by 151.3 percent. None of these numbers can be independently verified. Ad DEC_D_Incontent-1 More output, fewer incidents The obvious question, whether quality suffers at this pace, Tallapragada answers by pointing to the company's own monitoring platform, Engineering 360. Despite the surge in pull requests, incidents dropped five percent. Safety guardrails and quality standards are baked into the agentic workflow, he says. "When agentic tools get applied properly, quality doesn't suffer from speed. It benefits from it," Tallapragada writes. Salesforce doesn't back this claim with external audits or independent measurements. Ad Engineers are now building their own agentic workflows rather than just using off-the-shelf tools, according to Tallapragada. So-called Claude Code skills , reusable capabilities that encode team context, naming conventions, and workflow patterns, have become a new kind of engineering artifact. Salesforce also built a curated library called "AI Expert Suite" and "Salesforce Foundation Plugins" that serves as a shared foundation for all developers. Sub-agents and agent teams, specialized AI agents that handle parallel workstreams within a larger task, are changing how complex work gets broken down. Developers no longer bounce between five systems. They describe the desired outcome, and coordinated agents handle the individual steps. Ad DEC_D_Incontent-2 API migration in 13 days instead of 231 As a concrete example, Tallapragada points to migrating 33 API endpoints to a new cloud-native architecture. The traditional approach would have taken about 231 person-days, the company estimates. Using a rule-based framework built on Claude with Markdown files and reference implementations, the migration was done in 13 days; 18 times faster. Ad Each round of PR feedback was fed back into the rule set, so accuracy kept improving. Autonomous LLM loops of building, fixing, and validating ran without manual intervention. Migrations were parallelized across isolated environments. The result: five pull requests, with the largest single PR delivering 21 endpoints with full test coverage. "The most important skill today is knowing how to structure problems for an agentic system, when to delegate versus stay in the loop, and how to build reusable patterns your team can compound on," Tallapragada writes. Security, junior talent, and team structure remain unsolved Tallapragada is upfront about a range of unsolved problems, calling them "genuinely hard." Context management in long agentic sessions is a skill engineers still need to learn. The quality of CLAUDE.md files—persistent context configs that align Claude with a codebase—varies widely between teams and has a big impact on output quality. Security needs a rethink too. When agents act on systems rather than just making suggestions, the blast radius of a misconfigured tool gets much larger. Then there's the talent pipeline question. "When agents handle more of the execution layer, how do junior engineers grow into senior engineers if AI is absorbing much of the entry-level work? What is the role of a designer or product manager in this new world?" Tallapragada writes. Salesforce is experimenting with one-person or three-person units instead of traditional Scrum teams. It doesn't have clear answers yet. Productivity leap or tech debt on autopilot? A sharply different take came a few days ago from well-known programmer and hacker George Hotz. Using AI agents in software development will be one of the industry's most expensive mistakes, he argues. LLMs are "sophisticated statistical models" that "mimic the distribution of programming" but can never truly program, Hotz says. Large organizations are especially at risk because weaker developers can't spot faulty output. Even Andrej Karpathy, who now counts himself among agentic coding's supporters , has flagged quality problems. Agent-generated code is "not like super amazing code necessarily all the time," he said, calling it "bloaty, there's a lot of copy paste, there's awkward abstractions that are brittle, and like, it works, but it's just really gross." Unlike Hotz, though, Karpathy is still sold on the new approach and recently joined Anthropic . A broader debate about the rising costs of AI relative to its benefits is heating up too, alongside questions about what the models actually deliver in day-to-day work . AI News Without the Hype – Curated by Humans Subscribe to THE DECODER for ad-free reading, a weekly AI newsletter, our exclusive "AI Radar" frontier report six times a year, full archive access, and access to our comment section. Subscribe now Source: Salesforce