메뉴

#스텝펀

MP
MarkTechPost 6일 전
IMP 8

스텝펀, 역할극 특화 RLHF 적용한 'StepAudio 2.5 실시간' 공개

중국 상하이 기반 AI 연구소 스텝펀(StepFun)이 오디오 입력부터 출력까지 단일 시스템으로 처리하는 엔드투엔드 실시간 음성 대형 언어 모델(LLM) 'StepAudio 2.5 Realtime'을 공개했습니다. 이 모델은 백만 단위의 페르소나 데이터 증강과 역할극 특화 RLHF(인간 피드백 기반 강화학습)를 적용하여 대화 중 캐릭터 붕괴(OOC) 현상을 방지하고 안정적인 연기력을 유지하는 것이 특징입니다. 특히 사용자의 말투, 감정, 속도 등 비언어적(Paralinguistic) 요소를 이해하고 이에 맞춰 감정적인 반응을 생성하여 5가지 벤치마크 평가에서 모두 1위를 차지했습니다.

음성 AI 모델 엔드투엔드 LLM RLHF
HN
Hacker News 59일 전
IMP 6

스텝펀 3.5 플래시, 오픈클로우 300회 테스트서 최고 가성비 입증

오픈클로우 아레나(OpenClaw Arena)에서 진행된 300회의 실전 테스트 결과, 스텝펀 3.5 플래시(StepFun 3.5 Flash) 모델이 최고의 가성비를 입증했습니다. 이 테스트는 최고 수준의 AI 모델들이 실제 작업과 에이전트 환경에서 어떤 성능을 발휘하는지 비교하는 벤치마크입니다. 실무자 관점에서 이 모델은 비용 효율성과 성능의 균형을 가장 잘 맞춘 선택지로 평가받고 있습니다.

스텝펀 오픈클로우 가성비