메뉴

#api

LL
r/LocalLLaMA 4일 전
IMP 8

클라우드 AI, 커스텀 파인튜닝 기능 공개

클라우드(Claude) AI가 사용자가 직접 모델을 파인튜닝(Fine-tuning)할 수 있는 기능을 발표했습니다. 이를 통해 기업은 자사 데이터에 맞춰 AI를 최적화하고 성능을 극대화할 수 있게 되었습니다. 특히 API(응용 프로그래밍 인터페이스)를 통해 손쉽게 적용이 가능하여 실무적인 활용도가 매우 높습니다.

인공지능 클라우드 파인튜닝
MP
MarkTechPost 7일 전
IMP 6

명령어·에이전트·모드 활용한 슈퍼클로드 프레임워크 구축

본 튜토리얼은 Anthropic API(앤스로픽 API)를 기반으로 고도화된 작업 흐름을 구축하는 방법을 다룹니다. 핵심은 'SuperClaude Framework(슈퍼클로드 프레임워크)'라는 구조화된 레이어를 활용해 명령어(Commands), 에이전트(Agents), 모드(Modes), 그리고 세션 메모리(Session Memory)를 통합적으로 관리하는 워크플로우를 완성하는 것입니다.

에이전트 워크플로우 앤스로픽
TD
The Decoder 7일 전
IMP 8

딥시크 75% 할인 영구화, GPT-5.5보다 34배 저렴

중국 AI 기업 딥시크(Deepseek)가 플래그십 모델 '딥시크 V4 Pro'의 75% 할인을 영구적으로 전환한다고 발표했습니다. 이로 인해 출력 토큰 가격이 경쟁사인 GPT-5.5 및 Opus 4.7에 비해 34~51배 이상 저렴해졌습니다. 성능 면에서는 최신 프론티어 모델들보다 뒤처지지만, 가격 경쟁력을 앞세워 기업들의 AI 도입 전략을 '최고 성능'에서 '충분한 성능의 최저가'로 변화시키는 핵심 계기로 작용할 전망입니다.

딥시크 가격 경쟁 API
HN
Hacker News 8일 전
IMP 7

AI 모델 스펙·가격·기능 통합 오픈소스 DB 공개

전 세계 AI 모델의 스펙, 가격, 기능 정보를 한곳에 모은 오픈소스 프로젝트가 공개되었습니다. API와 TOML 형식의 파일 구조를 통해 데이터에 접근할 수 있으며, 커뮤니티 기여를 통해 최신 정보가 지속적으로 갱신됩니다. 주요 내용에는 모델의 토큰당 비용, 컨텍스트 제한, 지원 모달리티(Modality) 등의 세부 설정값과 로고 추가 방법 등이 포함되어 있습니다.

오픈소스 AI 모델 데이터베이스
HN
Hacker News 9일 전
IMP 7

AI 에이전트 전용 이메일, curl로 가입하세요

YC W25 소속 AgentMail 팀이 인간 개입 없이 AI 에이전트가 직접 이메일 계정을 생성할 수 있는 'Agent.Email' 실험을 공개했습니다. 에이전트는 curl 명령어로 가입하고, 인간의 OTP 인증을 통해 계정을 활성화하여 스팸 없이 자체 이메일 수신함을 갖게 됩니다. 이는 인간 중심으로 설계된 기존 웹 환경에서 AI 에이전트가 독립적인 인터넷 사용자로 활동할 수 있는 기반을 마련했다는 점에서 의미가 있습니다.

에이전트 이메일 API
HN
Hacker News 11일 전
IMP 7

클라우드플레어, 오픈소스 AI 모델 '플럭스' 공개

클라우드플레어가 블랙 포레스트 랩스(Black Forest Labs)와 협력하여 오픈소스 기반의 텍스트-투-이미지(T2I) 생성 AI 모델인 '플럭스(Flux)'를 자사 워커스 AI(Workers AI) 플랫폼에 추가했습니다. 이를 통해 개발자들은 별도의 복잡한 설정 없이도 API를 통해 고품질 이미지 생성 기능을 자체 애플리케이션에 빠르고 쉽게 통합할 수 있게 되었습니다. 이번 조치는 개발자 친화적인 에지(edge) 컴퓨팅 환경에 강력한 이미지 생성 도구를 제공하여, 향후 관련 AI 애플리케이션 개발과 대중화를 크게 가속화할 것으로 기대됩니다.

이미지 생성 클라우드플레어 오픈소스 AI
TC
TechCrunch AI 12일 전
IMP 8

앤스로픽, 경쟁사 쓰던 개발툴 스타인리스 인수

AI 기업 앤스로픽이 SDK(소프트웨어 개발 키트) 자동 생성 스타트업 '스타인리스(Stainless)'를 인수했습니다. 이 인수로 인해 오픈AI와 구글 등 경쟁사들이 핵심 인프라로 사용하던 해당 툴의 호스팅 서비스는 종료될 예정입니다. 이는 AI 에이전트 구축에 필수적인 개발자 도구를 앤스로픽이 독점적으로 확보했다는 점에서 업계에 큰 파장을 일으킬 것으로 보입니다.

인수합병 앤스로픽 개발자도구
TD
The Decoder 17일 전
IMP 8

루마, 오픈AI·구글 맞먹는 품질·가격으로 이미지 API 공개

AI 스타트업 루마(Luma)가 자사의 고성능 이미지 생성 모델인 'Uni-1.1'의 API를 정식으로 공개했습니다. 이 API는 오픈AI, 구글 등과 맞먹는 수준의 성능을 제공함에도 불구하고, 장당 최저 0.04달러 수준의 합리적인 가격을 책정하여 개발자들에게 매력적인 대안이 될 전망입니다.

image-gen api luma
HN
Hacker News 19일 전
IMP 8

AWS 내 클로드 플랫폼 정식 출시

앤스로픽(Anthropic)이 자사의 클로드(Claude) 플랫폼 전체를 AWS 환경에서 직접 사용할 수 있는 'AWS 내 클로드 플랫폼(Claude Platform on AWS)'의 일반 사용을 발표했습니다. 이를 통해 기업들은 기존 AWS 인증(IAM), 감사 로그(CloudTrail) 및 결제 시스템을 그대로 활용하면서도, 클로드의 최신 API 기능들을 즉시 도입할 수 있게 되었습니다. 특히 대규모 에이전트 배포, 코드 실행, 파일 API 등 클로드의 네이티브 기능들을 AWS의 안정적인 인프라 내에서 온전히 활용할 수 있다는 점에서 실무적 가치가 높습니다.

AWS 클로드(Claude) 앤스로픽(Anthropic)
TC
TechCrunch AI 21일 전
IMP 7

AI 용어에 고개만 끄덕이셨나요? 이제 확실히 이해해 봅시다

AI 기술이 발전함에 따라 AGI, AI 에이전트, 사고 연쇄(Chain of thought) 등 새로운 용어들이 쏟아지고 있습니다. 이 글은 일반 개발자와 실무자들이 자주 마주하는 핵심 AI 개념들을 알기 쉽게 풀어 설명한 가이드입니다. 빠르게 변화하는 AI 생태계에서 필수적인 기술 용어들의 정확한 의미를 이해하는 것이 중요합니다.

인공지능 개념 AI 에이전트 AGI
OA
r/OpenAI 23일 전
IMP 8

OpenAI, 파인튜닝(Fine-tuning) 서비스 중단 발표

OpenAI가 파인튜닝 API 및 플랫폼 서비스를 단계적으로 중단한다고 발표했습니다. 기존 고객은 2027년 1월 6일까지만 새로운 학습을 진행할 수 있으며, 이후에는 파인튜닝된 모델의 추론(Inference)도 베이스 모델이 폐기될 때 함께 종료됩니다. 이로 인해 프롬프트와 RAG만으로는 한계가 있는 일관된 성격 구현을 위해 파인튜닝을 사용하던 개발자들이 비용 절감 조치에 반발하며 대안을 찾아 떠날 것으로 보입니다.

OpenAI 파인튜닝 API
TD
The Decoder 23일 전
IMP 8

오픈AI 실시간 음성 모델, GPT-5 수준 추론 능력 탑재

오픈AI가 실시간 추론, 번역, 전사 기능에 특화된 3종的新 음성 모델(GPT-Realtime-2, Translate, Whisper)을 공개했습니다. 특히 핵심 모델인 GPT-Realtime-2는 기존 텍스트 모델과 비견되는 GPT-5 수준의 추론 능력과 12만 8천 토큰의 긴 문맥 처리 능력을 제공합니다. 이를 통해 개발자들은 단순한 질의응답을 넘어 도구 사용과 복잡한 문맥을 이해하는 수준 높은 실시간 음성 AI 에이전트를 구축할 수 있게 되었습니다.

음성 AI GPT-5 실시간 추론
OA
r/OpenAI 23일 전
IMP 9

실시간 음성 앱 혁신, 세 가지 오디오 API 공개

사람이 말하는 동시에 추론, 번역, 전사가 가능한 차세대 실시간 음성 모델 3종이 API를 통해 공개되었습니다. 개발자들은 이 모델을 활용하여 단순한 대화를 넘어 실시간으로 작업을 수행하고 도구를 활용하는 지능형 음성 인터페이스를 구축할 수 있게 되었습니다.

음성 AI API 실시간 번역
HN
Hacker News 24일 전
IMP 9

스페이스X 파트너십 및 클로드 사용 한도 확대

앤스로픽(Anthropic)은 스페이스X와의 대규모 컴퓨팅 파트너십을 체결하여 클로드(Claude) 모델의 API 및 서비스 사용 한도를 대폭 상향한다고 발표했습니다. 이번 협력으로 22만 개 이상의 NVIDIA GPU를 활용할 수 있게 됨에 따라 개발자와 실무자들의 작업 환경이 크게 개선되며, 글로벌 인프라 확장을 통해 규제 산업 기업들의 데이터 주권 요구사항도 지원할 전망입니다.

클로드 스페이스X 컴퓨팅_인프라
HN
Hacker News 25일 전
IMP 8

AI 에이전트, 클라우드플레어 계정 생성부터 도메인 구매·배포까지 원클릭 완료

이제 AI 에이전트가 사용자의 개입 없이도 클라우드플레어(Cloudflare) 계정 생성, 결제 수단 연동, 도메인 구매 및 애플리케이션 프로덕션 배포까지 전 과정을 자율적으로 수행할 수 있게 되었습니다. 이는 클라우드플레어가 스트라이프(Stripe)와 협력하여 개발한 새로운 프로토콜(Stripe Projects) 기반으로 작동하며, 사용자는 단 한 번의 권한 승인만으로 코딩 에이전트가 즉시 프로덕션 환경을 구축하도록 지시할 수 있습니다.

클라우드플레어 코딩 에이전트 자동 배포
TD
The Decoder 28일 전
IMP 7

엑스AI 커스텀 보이스: 1분 녹음으로 목소리 복제

엑스AI(xAI)가 약 1분 분량의 짧은 음성 녹음만으로 자신의 목소리를 복제할 수 있는 '커스텀 보이스(Custom Voices)' 기능을 출시했습니다. 실시간 인증과 음성 특징 비교를 통한 2단계 검증을 통해 타인의 목소리나 기존 녹음본의 무단 복제를 원천 차단하여 오용을 방지하는 것이 특징입니다. 이 기능은 기존에 공개된 음성-텍스트/텍스트-음성 변환 API 및 스타링크(Starlink) 고객 지원에 적용된 음성 에이전트 모델과 연동되어 추가 요금 없이 사용할 수 있어 개발자와 실무자들에게 유용한 도구로 평가받습니다.

음성 복제 엑스AI 인증 보안
HN
Hacker News 32일 전
IMP 8

클로드(Claude) 대규모 접속 장애 발생

AI 기업 앤스로픽(Anthropic)의 핵심 서비스인 Claude.ai와 API에서 대규모 접속 장애 및 오류가 발생했습니다. 이번 장애로 인해 웹 버전뿐만 아니라 Claude Code, Claude Console, API 등 개발자와 실무자가 사용하는 주요 플랫폼 전반의 이용이 불가능한 상태입니다. 현재 앤스로픽은 장애 원인을 특정했으며, 서비스 복구를 위해 전면적인 대응을 진행 중입니다.

인공지능 클로드 장애
SG
r/singularity 34일 전
IMP 7

GPT-image-2로 지오게스처 타임머신 복제 구현

새로운 이미지 생성 모델인 gpt-image-2가 거의 완벽에 가까운 360도 파노라마 이미지를 생성할 수 있다는 사실이 밝혀졌습니다. 이를 API와 결합해 대량으로 파노라마를 생성하면 시대를 거슬러 올라가는 듯한 '타임 트래블' 체험을 구현할 수 있습니다.

이미지 생성 파노라마 API
OA
r/OpenAI 35일 전
IMP 4

"유튜브 다운로더 자동화하다 계정 정지 위기"

한 사용자가 새로운 AI 모델의 지침을 이용해 유튜브 다운로드 자동화 코드를 작성하려다 계정 정지 직전까지 몰렸다고 주장했습니다. 이는 최신 AI 모델들의 안전 장치(Guardrail)가 사용자의 기존 합법적 코딩 작업까지 과도하게 제한하고 있음을 보여줍니다. 실무자들은 이처럼 강화된 안전망으로 인해 업무 자동화에 예기치 않은 제한을 받을 수 있으므로 주의가 필요합니다.

안전장치 정책 API
HN
Hacker News 35일 전
IMP 7

에덴 AI: 오픈라우터의 유럽형 대안

에덴 AI는 하나의 통합 API로 500개 이상의 LLM 및 전문 AI 모델(음성, 비전, OCR, 번역 등)에 접근할 수 있는 플랫폼입니다. 이 플랫폼은 벤더 종속성을 피하면서 비용, 지연 시간 및 지역에 따라 스마트 라우팅을 설정하고 장애 발생 시 자동으로 대체 모델로 전환하는 기능을 제공합니다. 이를 통해 개발자들은 여러 API를 개별적으로 관리할 필요 없이 생산성 높은 AI 애플리케이션을 구축할 수 있습니다.

API LLM 에덴 AI
HN
Hacker News 36일 전
IMP 9

오픈AI, API에 GPT-5.5 및 GPT-5.5 프로 공개

오픈AI가 자사 API를 통해 최신 언어 모델인 GPT-5.5와 고성능 버전인 GPT-5.5 Pro를 공개했습니다. 이 모델은 기존 버전 대비 추론 능력 및 처리 속도가 향상되어 실무 개발 및 다양한 비즈니스 애플리케이션에 즉각적으로 활용될 수 있습니다. 개발자 커뮤니티에서도 폭발적인 반응을 보이며 연 1,000개가 넘는 댓글이 달리는 등 AI 업계의 기술적 진보를 확인하는 중요한 이정표로 평가받고 있습니다.

오픈AI GPT-5.5 API
TD
The Decoder 37일 전
IMP 9

오픈AI, GPT-5.5 공개... API 가격 2배 '새로운 지능'

오픈AI가 복잡한 작업을 자율적으로 수행하는 에이전트 기반 모델 'GPT-5.5'를 공개했습니다. 이 모델은 코딩, 웹 검색, 데이터 분석 등에 강점을 보이며 주요 벤치마크에서 경쟁 모델들을 큰 폭으로 앞섰습니다. 다만, 이에 상응하는 성능 향상을 제공하지만 API 호출 비용은 기존 대비 2배로 인상되었습니다.

오픈AI GPT-5.5 에이전트AI
TD
The Decoder 39일 전
IMP 8

구글, 복잡한 연구 자동화 에이전트 딥 리서치 출시

구글이 최신 모델인 Gemini 3.1 Pro 기반의 자율 연구 에이전트인 딥 리서치(Deep Research)와 딥 리서치 맥스(Deep Research Max)를 공개했습니다. 속도를 중시하는 기본 버전과 심층 분석에 특화된 Max 버전을 통해 실시간 상호작용부터 비동기식 백그라운드 작업까지 폭넓은 연구 워크플로우를 자동화할 수 있습니다. 특히 모델 컨텍스트 프로토콜(MCP)을 지원하여 사내 데이터베이스 및 외부 전문 데이터 소스와 연동이 가능해지며, 이는 API를 통한 완전한 형태의 자율 에이전트 구축을 가능하게 하는 핵심 변화입니다.

Gemini AI 에이전트 딥 리서치
SG
r/singularity 39일 전
IMP 9

구글, 심층 연구 에이전트 '딥 리서치' 공개

구글 딥마인드가 자체 최고급 모델인 '제미나이 3.1 프로(Gemini 3.1 Pro)'를 탑재한 새로운 자율 연구 에이전트 '딥 리서치(Deep Research)'와 '딥 리서치 맥스(Deep Research Max)'를 발표했습니다. 이번 업데이트를 통해 단순한 웹 검색을 넘어 기업 내부 데이터베이스와 전문 데이터 스트림을 연동하는 MCP(모델 컨텍스트 프로토콜)를 지원하며, 텍스트 기반 결과물에 더해 프레젠테이션 바로 사용 가능한 수준의 인포그래픽과 차트를 네이티브로 생성하는 것이 가장 큰 특징입니다.

제미나이 AI 에이전트 데이터 분석
HN
Hacker News 39일 전
IMP 7

Go 기반 오픈소스 AI 게이트웨이 'GoModel' 공개

Go 언어로 작성된 고성능 오픈소스 AI 게이트웨이인 GoModel이 공개되었습니다. 이 도구는 OpenAI, Anthropic, 구글 Gemini 등 다양한 LLM 제공업체의 API를 단일 OpenAI 호환 인터페이스로 통합해줍니다. 특히 기존 유사 도구인 LiteLLM보다 44배 더 가볍게 설계되어 가볍고 빠른 서비스 연동이 필요한 실무 환경에서 유용하게 활용할 수 있습니다.

오픈소스 AI 게이트웨이 Go 언어
HN
Hacker News 40일 전
IMP 7

앤스로픽, 클로드 CLI 재사용을 다시 허용

앤스로픽(Anthropic) 측이 OpenClaw와 같은 서드파티 도구에서 클로드 CLI(Claude CLI)를 재사용하는 방식을 다시 허용했다고 공식적으로 확인했습니다. 이에 따라 OpenClaw는 사용자가 자신의 CLI 로그인을 연동해 클로드 모델을 사용하는 것을 승인된 정책으로 간주하고 이를 지원합니다. 다만 장기적으로 안정적인 서비스 운영과 명확한 요금 청구를 위해서는 전용 API 키를 사용하는 것을 권장하고 있습니다.

앤스로픽 클로드 정책변경
MP
MarkTechPost 42일 전
IMP 8

xAI, 엔터프라이즈 음성 개발자 겨냥한 Grok 오디오 API 공개

일론 머스크의 AI 기업 xAI가 기존 음성 시장을 겨냥해 음성을 텍스트로 변환하는 STT와 텍스트를 음성으로 변환하는 TTS, 두 가지 독립적인 오디오 API를 전격 출시했습니다. 특히 Grok STT API는 경쟁사 대비 최대 3~4배 낮은 오류율을 기록하며 뛰어난 정확도를 입증했으며, TTS API는 감정 표현과 세밀한 발화 제어 기능을 제공하는 것이 특징입니다. 이를 통해 기업 개발자들은 고도화된 회의록 자동 작성, 음성 비서, 콜센터 분석 등의 서비스를 저렴하고 효율적으로 구축할 수 있게 되었습니다.

음성 AI API xAI
TD
The Decoder 42일 전
IMP 7

세일즈포스스 CEO, "API는 AI 에이전트를 위한 새로운 UI"

세일즈포스스 CEO 마크 베니오프는 AI 에이전트 시대에 API가 기존의 사용자 인터페이스(UI)를 대체할 새로운 UI가 될 것이라고 선언했습니다. 이에 따라 세일즈포스스는 자사 플랫폼 전체를 API와 MCP(Model Context Protocol)로 개방하여 에이전트가 직접 데이터와 워크플로에 접근할 수 있도록 만들었습니다. 이러한 변화는 오픈AI 샘 알트만 CEO가 언급했던 '모든 기업이 API 기업이 되어야 하는 시대'라는 업계 트렌드를 실제 비즈니스에 적용한 사례로 평가받습니다.

세일즈포스스 API AI 에이전트
HN
Hacker News 43일 전
IMP 7

클로드 오푸스 4.7, 세션당 20~30% 비용 증가

Anthropic의 새로운 토크나이저 도입으로 인해 Claude Opus 4.7 모델의 실제 토큰 사용량이 예상치보다 크게 증가했습니다. 실무 환경에서는 기술 문서나 실제 코드 파일 기준으로 토큰 소모량이 약 1.45~1.47배 늘어나며, 이는 세션당 20~30%의 추가 비용 발생으로 이어집니다.

클로드 오푸스 토크나이저 비용 증가
HN
Hacker News 43일 전
IMP 7

웹사이트 AI 에이전트 준비 상태 스캔 도구

Cloudflare가 웹사이트가 AI 에이전트와 원활하게 상호작용할 수 있는지 점검할 수 있는 스캔 도구를 공개했습니다. 이 도구는 접근성, 봇 제어, 인증, 상거래 등 5가지 범주에 걸쳐 사이트의 AI 호환성을 진단하고 개선 방법을 안내합니다. 개발자는 간단한 설정만으로도 AI 에이전트가 웹사이트를 탐색하고 거래하는 데 필요한 최신 표준을 준수할 수 있습니다.

웹 표준 AI 에이전트 Cloudflare