챗GPT, 환각 현형태 줄인 'GPT-5.5 인스턴트' 전면 적용
OpenAI가 챗GPT의 기본 모델을 GPT-5.5 Instant로 교체했습니다. 이번 업데이트는 의료, 법률 등 고위험 주제에서 환각(Hallucination) 현상을 대폭 줄이고 수학 및 과학 추론 능력을 크게 향상시켰습니다. 또한 사용자에게 맞춤형 답변을 제공하기 위해 어떤 개인 데이터가 활용되었는지 보여주는 '메모리 소스(Memory Sources)' 기능을 새롭게 도입했습니다.
OpenAI가 챗GPT의 기본 모델을 'GPT-5.5 Instant'로 교체했습니다. 이번 업데이트는 환각(Hallucination) 현상을 줄이고 답변을 더욱 간결하게 개선하였으며, '메모리 소스(Memory Sources)'라는 새로운 기능을 통해 사용자가 AI 답변에 어떤 저장된 맥락이 반영되었는지 확인할 수 있게 되었습니다.
GPT-5.5 Instant는 기존 GPT-5.3 Instant를 대체하며, API를 통해서도 'chat-latest'라는 이름으로 사용할 수 있습니다. OpenAI의 내부 테스트 결과, GPT-5.5 Instant는 의료, 법률, 금융과 같은 고위험 프롬프트에서 전작 대비 환각으로 인한 잘못된 주장을 52.5% 적게 생성했습니다. 또한 사용자가 사실적 오류로 지적했던 까다로운 대화에서 부정확한 주장이 37.3% 감소했다고 밝혔습니다.
OpenAI는 대수학 문제를 예시로 들었습니다. 사용자가 계산 실수가 포함된 필기 방정식 사진을 업로드했을 때, 기존 GPT-5.3 Instant는 처음에 사용자의 풀이에 동의한 뒤 오류를 발견했지만 최종적으로 잘못된 결론(실수 해가 없음)을 도출했습니다. 반면 GPT-5.5 Instant는 처음에는 사용자의 계산에 동의했지만, 곧바로 식을 변형하는 과정에서의 오류를 정확히 짚어내고 올바르게 수정된 이차방정식을 풀었습니다.
벤치마크 점수 역시 눈에 띄는 성능 향상을 보여줍니다. 경쟁적인 수학 시험인 AIME 2025에서 정확도가 65.4%에서 81.2%로 크게 뛰었습니다. 박사급 과학 추론을 테스트하는 GPQA에서는 78.5%에서 85.6%로 상승했으며, 과학 차트 해석 및 추론을 측정하는 CharXiv는 75.0%에서 81.6%로 올랐습니다.
텍스트와 이미지를 넘나들며 전문가 수준의 질문을 처리하는 능력을 평가하는 MMMU-Pro는 69.2%에서 76.0%로 증가했습니다. 또한 복잡한 문서에서 구조화된 데이터를 추출하는 능력을 테스트하는 OmniDocBench의 오류율은 14.6%에서 12.5%로 감소했습니다.
[벤치마크 비교표]
- CharXiv-reasoning (과학 차트 추론 정확도): 75.0% → 81.6%
- MMMU-Pro (전문가 멀티모달 추론 정확도): 69.2% → 76.0%
- OmniDocBench (문서 파싱 평균 오류율, 낮을수록 우수): 14.6% → 12.5%
- GPQA (박사급 과학 정확도): 78.5% → 85.6%
- AIME 2025 (경시 대회 수학 정확도): 65.4% → 81.2%
OpenAI는 불필요한 내용을 줄이는 데에도 집중했습니다. 회사 측은 답변의 핵심 내용을 잃지 않으면서도 길이를 더 짧게 만들었으며, 불필요한 추가 질문을 줄이고, 과도한 이모티콘 사용을 자제하며, 복잡한 텍스트 포맷팅을 생략한다고 설명했습니다. OpenAI는 "이전 모델들과 동일한 정보를 전달하면서도 유용성을 높이고, 답변이 지나치게 길어지게 만드는 장황함과 과도한 서식을 줄였다"고 전했습니다.
또한 이 모델은 과거 대화 내역, 업로드된 파일, 연결된 Gmail 계정의 맥락을 활용하는 능력이 향상되었습니다. GPT-5.5 Instant는 추가적인 개인화가 답변에 실질적으로 도움이 될 때를 더 잘 판단하며, 이전 대화를 훨씬 더 빠르게 검색합니다.
OpenAI는 모든 챗GPT 모델에 걸쳐 '메모리 소스' 기능도 순차적으로 도입하고 있습니다. AI의 답변이 저장된 맥락에 기반을 둘 경우, 사용자는 이제 저장된 메모나 과거 대화와 같이 어떤 정보가 사용되었는지 확인할 수 있습니다. 해당 항목은 관련성 유무에 따라 표시하거나, 편집 및 삭제할 수 있습니다.
다만, OpenAI는 메모리 소스 기능이 AI 답변에 영향을 미친 모든 요인을 항상 보여주지는 않는다고 덧붙였습니다. 오직 일부 요소만 표시됩니다.
원문 보기 (영어)
GPT-5.5 인스턴트(Instant) 공개
수억 명이 매일 사용하는 ChatGPT의 기본 모델이 GPT-5.5 인스턴트로 업데이트되었습니다. 이번 업데이트는 모든 주제에서 사실 관계 오류(환각 현상)를 대폭 줄이고 개인화된 맥락을 더 잘 이해하도록 개선된 것이 특징입니다. 또한 복잡한 수학 문제의 오류를 스스로 찾아내고 교정하는 논리적 추론 및 문제 해결 능력이 크게 향상되어 실무 및 학습에 더욱 유용해졌습니다.
오픈AI, 챗GPT 기본 모델로 'GPT-5.5 인스턴트' 공개
오픈AI가 챗GPT의 새로운 기본 모델인 'GPT-5.5 Instant'를 공개했습니다. 이 모델은 수학 및 멀티모달 추론 벤치마크에서 이전 모델을 크게 상회하는 성능을 보여주며, 법률 및 의료 등 민감한 분야의 환각(Hallucination) 현상을 줄이는 데 집중했습니다. 특히 과거 대화 및 파일 등을 참조하는 개인화된 컨텍스트 관리 기능과 모델의 기억 출처를 확인 및 수정할 수 있는 기능이 추가되어 사용자 경험이 크게 향상되었습니다.