메뉴

#추론 모델

TD
The Decoder 7일 전
IMP 8

AI 도구, 모델 선택 '기본값'으로 두면 안 되는 이유

마이크로소프트 코파일럿(Copilot)과 구글 제미나이(Gemini) 등의 AI 도구를 기본 설정(자동 모델 선택)으로 사용할 경우, 실제 데이터를 분석하는 대신 학습 과정에서 내재된 편견과 고정관념에 기반해 거짓 결과를 생성하는 치명적인 문제가 발견되었습니다. 실험 결과, 동일한 텍스트 데이터에 국가명 라벨만 다르게 붙였을 뿐인데 AI가 국가별 특성을 전혀 다르게 요약하고 심지어 존재하지 않는 차이를 허위 수치로 제시했습니다. 데이터 분석 등 정확성이 요구되는 작업에서는 기본 모델 대신 스스로 논리적 추론이 가능한 '추론(Reasoning) 모델'로 수동 전환할 수 있는 사용자의 도구 활용 능력이 필수적입니다.

AI 모델 선택 데이터 분석 AI 환각 현상
TD
The Decoder 7일 전
IMP 8

연구진, AI가 직접 설계한 스케일링 알고리즘 공개

인간 연구자 대신 AI 코딩 에이전트가 스스로 탐색하여 설계한 새로운 AI 추론 제어 알고리즘이 기존 방식들을 능가하는 성능을 보였습니다. 이 알고리즘은 모델의 신뢰도 변화를 동적으로 추적하여 연산 자원을 할당하는 방식으로, 극도로 적은 토큰 사용량(약 70% 절감) 대비 높은 정확도를 달성했습니다. 단 40달러와 160분 만에 인간이 고안해 내기 힘든 독창적인 로직을 자발적으로 찾아냈다는 점에서 자동화된 알고리즘 탐색의 가능성을 입증했다는 평가를 받습니다.

AI 에이전트 알고리즘 최적화 추론 모델
MP
MarkTechPost 9일 전
IMP 8

알리바바, 100만 토큰 컨텍스트 추론 모델 Qwen3.7-Max 발표

알리바바 클라우드 서밋 2026에서 멀티스텝 에이전트 및 복잡한 코딩 작업에 최적화된 최신 폐쇄형 추론 모델 Qwen3.7-Max가 공개되었습니다. 이 모델은 100만 토큰의 컨텍스트 윈도우를 지원하며, 과학적 추론과 코딩 벤치마크에서 전작 대비 큰 성능 향상을 보였습니다.

에이전트 AI 추론 모델 Qwen3.7-Max
TC
TechCrunch AI 10일 전
IMP 8

오픈AI, 80년된 수학 난제 최초로 해결

오픈AI가 수학계의 거장 폴 에르되시가 1946년에 제기한 지오메트리 미해결 추측을 기각하는 완전히 새로운 증명을 AI 모델이 자율적으로 생성했다고 발표했습니다. 과거 기존 문헌의 해답을 '새로운 풀이'로 오해했던 전철을 밟지 않기 위해, 이번에는 에르되시 문제 웹사이트 관리자인 토마스 블룸 등 저명한 수학자들의 검증과 지지 성명을 동반했습니다. 이번 증명은 수학 전용 시스템이 아닌 범용 추론(reasoning) 모델에서 도출된 점이 핵심이며, 장기적이고 복잡한 논리적 사고가 가능해진 AI의 발전이 향후 물리학, 공학, 의학 등 타 분야에도 지대한 영향을 미칠 것임을 시사합니다.

OpenAI 수학 증명 추론 모델
SG
r/singularity 10일 전
IMP 8

오픈AI 모델, 80년 된 수학 명제 반례 증명

오픈AI의 범용 추론 모델이 특정 문제에 맞춰 설계되지 않았음에도 80년 된 수학적 가정을 반증하는 증명을 도출했습니다. 증명의 유효성은 검증 단계지만, 최첨단 AI 모델이 단순히 지식을 재생산하는 것을 넘어 새로운 지식 창출에 능동적으로 기여하는 강력한 신호로 평가받고 있습니다.

인공지능 추론 모델 수학 증명
GP
r/ChatGPT 25일 전
IMP 3

ChatGPT의 심화 사고, 날 스트레스받는 10대로 떴다!?

한 대학생이 프로젝트 보고서 작성을 요청하는 긴 프롬프트를 입력했는데, AI 모델이 사용자의 상태를 분석하는 과정에서 이를 '스트레스받는 10대'로 잘못 인식하여 화제가 되었습니다. 이는 최근 도입된 모델의 확장된 추론(Extended Thinking) 과정이 사용자에게 노출될 때 발생할 수 있는 흥미로운 오작동 사례입니다.

챗GPT 추론 모델 오작동
LL
r/LocalLLaMA 32일 전
IMP 7

엔비디아 새 추론 모델 '네모트론' 유출?

레딧(Reddit)에 엔비디아의 새로운 AI 모델로 추정되는 'Nemotron-3-Nano-Omni-30B-A3B-Reasoning'의 추론 템플릿 코드가 유출되었습니다. 이 코드는 사용자의 프롬프트에 따라 모델의 '생각(Thinking)' 기능을 켜고 끌 수 있는 고급 추론 제어 시스템을 포함하고 있어, 엔비디아가 강력한 오픈소스 추론 모델을 준비하고 있음을 시사합니다.

인공지능 모델 엔비디아 추론 모델
TD
The Decoder 36일 전
IMP 8

오픈AI 수석 과학자 "AI 발전 의외로 느려…곧 비약적 도약"

오픈AI는 GPT-5.5 출시를 계기로 향후 AI 기술 발전 속도가 크게 가속화될 것이라고 발표했습니다. 자쿠브 파초키 수석 과학자는 최근 AI 발전이 의외로 더뎠다며 단기 및 중기적으로 상당한 수준의 개선이 이루어질 것이라고 강조했습니다. 이는 GPT-5.5가 기존 GPT-4o가 o시리즈의 기반이 되었던 것처럼 차세대 고성능 추론 모델의 핵심 토대가 될 것이라는 전망 때문입니다.

오픈AI GPT-5.5 추론 모델
TD
The Decoder 44일 전
IMP 8

오픈AI, 생명과학 연구 특화 추론 모델 GPT-Rosalind 공개

오픈AI가 DNA 구조 발견에 기여한 화학자 로잘린드 프랭클린의 이름을 딴 생명과학 특화 추론 모델, GPT-Rosalind를 발표했습니다. 이 모델은 가설 생성, 실험 설계, 단백질 및 유전자 분석 등의 복잡한 연구 워크플로우를 지원하며, 내부 벤치마크에서 기존 최신 모델들을 능가하는 우수한 성능을 입증했습니다. 현재 미국 내 검증된 기업 고객을 대상으로만 연구 미리보기 형태로 제공되며, 공개 생물학 데이터베이스 50여 개와 연동되는 무료 플러그인도 함께 공개되어 실무 연구자들의 작업 효율을 크게 높일 것으로 기대됩니다.

생명과학 GPT-Rosalind 오픈AI
MP
MarkTechPost 46일 전
IMP 8

구글 딥마인드, 로봇 인지 능력 강화 모델 'Gemini Robotics-ER 1.6' 공개

구글 딥마인드가 실제 환경에서 로봇을 제어하는 '인지 뇌' 역할을 하는 발현형 추론(Embodied Reasoning) 모델의 대대적인 업그레이드 버전인 Gemini Robotics-ER 1.6을 발표했습니다. 이 모델은 로봇 공학에 필수적인 시각적/공간적 이해, 작업 계획 수립, 성공 여부 감지 및 계기판 판독 능력을 향상시켜 물리적 AI의 실용성을 한 차원 높였습니다.

로봇공학 인공지능 발현형 AI
TD
The Decoder 51일 전
IMP 8

스탠퍼드 연구: 다중 AI 에이전트 협업이 자원 대비 효과적인 시기

스탠퍼드 대학의 새로운 연구에 따르면, 다중 에이전트 시스템의 높은 성능은 단일 에이전트보다 더 많은 컴퓨팅 자원(compute)을 사용하기 때문인 것으로 나타났습니다. 동일한 연산량을 부여했을 때 단일 에이전트가 팀보다 성능이 높거나 동등했지만, 입력 데이터의 오류나 노이즈가 많은 환경에서는 다중 에이전트 팀이 정보 필터링에 유리해 더 나은 성과를 보였습니다.

멀티 에이전트 스탠퍼드 연구 컴퓨팅 자원
TD
The Decoder 56일 전
IMP 8

알리바바 Qwen, AI 추론 사고 과정을 깊게 만드는 새 알고리즘 발표

알리바바의 Qwen 팀은 기존 강화학습의 한계를 극복하고 개별 토큰의 영향력에 따라 보상을 차등 분배하는 새로운 훈련 알고리즘인 FIPO를 발표했습니다. 이를 통해 AI 모델의 추론(사고) 과정이 두 배 이상 길어졌으며, 중간 결과를 스스로 검증하는 능력이 자연스럽게 발현되어 수학 벤치마크에서 정확도가 크게 향상되었습니다. 이 알고리즘은 별도의 가치 모델 없이도 기존 PPO 방식과 맞먹는 성능을 내며, 향후 오픈소스로 공개될 예정입니다.

강화학습 추론 모델 알리바바 Qwen