메뉴

#GPT-5

TC
TechCrunch AI 23일 전
IMP 8

오픈AI, 실시간 음성 지능 API 새 기능 공개

오픈AI가 개발자가 애플리케이션 내에서 대화, 번역, 전사 기능을 구현할 수 있도록 돕는 새로운 실시간 음성 지능 기능들을 API에 추가했습니다. 이번 업데이트에는 GPT-5 수준의 추론 능력을 갖춘 'GPT-Realtime-2', 실시간 다국어 번역을 제공하는 'GPT-Realtime-Translate', 그리고 실시간 음성-텍스트 변환 기능인 'GPT-Realtime-Whisper'가 포함되었습니다. 이러한 기능들은 고객 서비스, 교육, 미디어 등 다양한 산업군에서 활용될 전망이며, 오픈AI는 스팸 및 사기와 같은 악용을 막기 위해 강력한 가드레일도 함께 적용했습니다.

오픈AI 음성 AI Realtime API
TD
The Decoder 23일 전
IMP 8

오픈AI 실시간 음성 모델, GPT-5 수준 추론 능력 탑재

오픈AI가 실시간 추론, 번역, 전사 기능에 특화된 3종的新 음성 모델(GPT-Realtime-2, Translate, Whisper)을 공개했습니다. 특히 핵심 모델인 GPT-Realtime-2는 기존 텍스트 모델과 비견되는 GPT-5 수준의 추론 능력과 12만 8천 토큰의 긴 문맥 처리 능력을 제공합니다. 이를 통해 개발자들은 단순한 질의응답을 넘어 도구 사용과 복잡한 문맥을 이해하는 수준 높은 실시간 음성 AI 에이전트를 구축할 수 있게 되었습니다.

음성 AI GPT-5 실시간 추론
OA
r/OpenAI 31일 전
IMP 6

AI에 갑자기 '고블린'이 등장한 이유

OpenAI가 GPT-5.1 이후 모델들이 대답에 '고블린'과 같은 크리처 단어를 빈번하게 사용했던 원인을 분석한 결과, 'Nerdy(너드)' 성격 커스터마이징 기능의 강화 학습 과정에서 크리처 비유에 과도한 보상(Reward)이 부여된 것으로 드러났습니다. 이는 소비자에게 제공되는 AI의 페르소나와 미세한 보상 신호가 모델의 전반적인 동작과 언어 습관에 예기치 않은 방식으로 영향을 미칠 수 있음을 보여주는 중요한 사례입니다.

GPT-5 모델 행동 강화 학습
TD
The Decoder 35일 전
IMP 8

500명 투자은행가 평가, 고객 전달 가능한 AI 결과물은 0%

Handshake AI와 맥길 대학교 연구진이 주니어 투자은행가의 실무를 테스트하는 오픈소스 벤치마크 'BankerToolBench'를 공개했습니다. 골드만삭스, JP모건 등 현직 및 전직 은행가 500명이 참여해 최신 AI 모델들의 결과물을 평가한 결과, 고객에게 바로 전달할 수 있는 결과물은 단 하나도 없었습니다. 1위를 차지한 GPT-5.4조차 절반 가까운 기준에서 탈락했으며, 특히 클로드 모델들은 핵심 수치를 수식이 아닌 고정값으로 처리하는 치명적인 오류를 보여 실무 적용의 높은 한계를 드러냈습니다.

AI 벤치마크 투자은행 금융 AI