메뉴

#추론

SG
r/singularity 10일 전
IMP 8

OpenAI 연구원 “에르되시 문제 해결은 AI 역사 최대 사건, 연말엔 작게 보일 것”

OpenAI 연구원이 최근 AI가 수학계의 유명한 난제인 '에르되시 문제(Erdős problem)'를 반박(해결)한 성과에 대해 “AI 역사상 가장 큰 사건이며, 연말이 되면 이것조차 작은 성과로 보일 것”이라고 언급했습니다. 이는 AI가 이제 단순한 데이터 처리를 넘어 고도의 논리와 추론이 필요한 수학 및 과학 분야에서도 인간을 뛰어넘는 혁신적인 성과를 내고 있음을 시사합니다. 관련 논의는 X(트위터)와 OpenAI 공식 블로그를 통해 확인할 수 있습니다.

OpenAI 수학 추론
HN
Hacker News 10일 전
IMP 7

PopuLoRA: LLM 추론 능력을 향상시키는 공진화 자가 대전 프레임워크

기존 단일 에이전트 자가 대전(Self-Play) 방식의 한계를 극복하고 LLM의 추론 능력을 향상시키는 새로운 강화학습 프레임워크인 PopuLoRA를 소개합니다. 이 프레임워크는 모델 스스로 쉬운 문제로 수렴하는 현상을 방지하기 위해, 학습 과정에서 서로 경쟁하며 진화하는 교사(문제 생성) 모델과 학생(문제 해결) 모델 집단을 공동으로 훈련합니다. 이를 통해 모델이 지속적으로 더 어렵고 복잡한 과제에 도전하게 만들어 훈련 데이터가 고갈되거나 난이도가 정체하는 문제를 해결합니다.

강화학습 대형언어모델 자가대전
SG
r/singularity 44일 전
IMP 6

클로드 오푸스 4.7, 벤치마크서 4.6보다 성능 역행

클로드 오푸스 4.7이 '주제 일반화 벤치마크(Thematic Generalization Benchmark)' 테스트에서 예상과 달리 이전 버전인 4.6보다 낮은 점수를 기록했습니다. 모델이 제시된 예시에서 구체적인 제약 조건을 잊고 더 포괄적이지만 틀린 패턴을 선택하는 오류를 보였으며, 이는 모델 업데이트 과정에서 추론 및 맥락 파악 능력의 퇴화 가능성을 시사합니다.

클로드 오푸스 4.7 벤치마크
HN
Hacker News 45일 전
IMP 8

클라우드플레어, 에이전트 최적화 통합 AI 추론 플랫폼 발표

클라우드플레어가 단 하나의 API로 여러 AI 제공업체의 모델을 사용할 수 있는 통합 추론(Inference) 레이어를 발표했습니다. 이 플랫폼은 코딩 에이전트 등 복잡한 AI 워크플로우에서 발생하는 지연 시간 증가와 비용 관리 문제를 해결하는 데 초점을 맞추고 있습니다. 개발자는 이제 클라우드플레어 인프라 내에서 오픈소스 모델부터 상용 모델까지 자유롭게 전환하며 멀티모달 애플리케이션을 구축할 수 있습니다.

클라우드플레어 API 추론