메뉴

#비용 절감

TC
TechCrunch AI 2일 전
IMP 8

AI 비용 절감이 핵심 무기… 길린(Glean), 연간 매출 3억 달러 돌파

기업용 AI 검색 플랫폼 길린(Glean)의 연간 반복 매출(ARR)이 3억 달러를 돌파했습니다. 빅테크들의 경쟁 진입 속에서도 '컨텍스트 그래프(Context Graph)' 기술을 통해 고객의 비즈니스를 깊이 이해하고 AI 연산에 소요되는 토큰 비용을 크게 절감해 주는 점이 핵심 성공 요인으로 꼽혔습니다.

기업용 AI AI 검색 길린
LL
r/LocalLLaMA 2일 전
IMP 8

자이(Zai), GLM-5.1 추론 네트워크 교체로 33% 비용 절감 및 15% 성능 향상 달성

자이(Zai)는 천 개 GPU 규모의 GLM-5.1 코딩 추론 클러스터에서 기존 ROFT 방식을 청화대와 공동 개발한 'ZCube'로 전면 교체했습니다. 동일한 GPU와 소프트웨어 스택을 유지하면서도 네트워크 아키텍처만의 변경으로 스위치 비용은 33% 줄이고, 처리량은 15% 높이며 첫 토큰 지연 시간(P99)은 40.6% 단축시키는 결과를 얻었습니다. 이는 하드웨어 비용을 추가하는 대신 트래픽 병목을 해소하는 네트워크 평면화(Flat) 방식을 통해 역설적인 성과를 입증했다는 점에서 AI 인프라 실무자들에게 매우 중요한 시사점을 줍니다.

인프라 최적화 네트워크 아키텍처 GPU 추론
TC
TechCrunch AI 25일 전
IMP 7

페이팔의 반전 카드: "다시 기술 기업으로 도약하겠다"

주가 하락과 대규모 감원 위기에 처한 페이팔이 '기술 기업'으로서의 회생을 위해 전면적인 AI 도입을 선언했습니다. CEO는 개발, 고객 서비스, 리스크 관리 등 핵심 프로세스를 AI로 혁신하여 향후 2~3년 내 최소 15억 달러의 비용을 절감하겠다고 밝혔습니다. 이는 최근 급격히 성장하는 AI 코딩 및 기업 내 AI 도입 트렌드를 페이팔이 이제야 본격적으로 따라잡겠다는 의지로 풀이됩니다.

페이팔 AI 도입 비용 절감
HN
Hacker News 27일 전
IMP 8

DeepClaude: Claude 코드 에이전트, 17배 저렴하게

최고의 자율 코딩 에이전트로 꼽히는 Claude Code의 API를 DeepSeek V4 Pro 등 저렴한 백엔드로 우회하여 사용할 수 있게 해주는 도구입니다. 기존 Anthropic API 대비 최대 90%의 비용을 절감할 수 있으며, 기존 Claude Code의 파일 수정 및 터미널 제어 등 모든 에이전트 루프 기능을 동일하게 유지합니다.

클로드 코드 딥시크 오픈소스
HN
Hacker News 39일 전
IMP 7

클로드 코드, 신규 월 20달러 프로 요금제에서 제외

앤스로픽이 AI 코딩 도구인 '클로드 코드(Claude Code)'를 월 20달러 프로(Pro) 요금제 신규 가입자에게서 제외하는 실험을 진행하고 있습니다. 이는 구독 기반 사용량 제한 방식에서 API 토큰 기반 종량제로 전환하려는 비용 절감 및 수익화 정책의 일환으로 풀이됩니다. 기존 프로 및 맥스(Max) 구독자들은 이번 변경 사항의 영향을 받지 않습니다.

Anthropic 클로드 코드 요금제 정책