OpenAI, GPT-5.5 Instant 가독성 업그레이드 및 구형 모델 단계적 폐지
OpenAI가 최근 공개한 GPT-5.5 Instant 모델의 응답 품질을 개선하여 더 자연스럽고 읽기 쉬운 구조를 제공합니다. 또한 캔버스(Canvas) 기능을 제거하고 채팅창 내 특수 블록으로 대체하며, 구형 모델인 o3와 GPT-4.5를 오는 8월과 6월에 각각 ChatGPT에서 완전히 퇴출시킵니다.
OpenAI가 최근 공개한 GPT-5.5 Instant 모델의 응답 품질을 개선하여 더 자연스럽고 읽기 쉬운 구조를 제공합니다. 또한 캔버스(Canvas) 기능을 제거하고 채팅창 내 특수 블록으로 대체하며, 구형 모델인 o3와 GPT-4.5를 오는 8월과 6월에 각각 ChatGPT에서 완전히 퇴출시킵니다.
중국 AI 기업 딥시크(Deepseek)가 플래그십 모델 '딥시크 V4 Pro'의 75% 할인을 영구적으로 전환한다고 발표했습니다. 이로 인해 출력 토큰 가격이 경쟁사인 GPT-5.5 및 Opus 4.7에 비해 34~51배 이상 저렴해졌습니다. 성능 면에서는 최신 프론티어 모델들보다 뒤처지지만, 가격 경쟁력을 앞세워 기업들의 AI 도입 전략을 '최고 성능'에서 '충분한 성능의 최저가'로 변화시키는 핵심 계기로 작용할 전망입니다.
막스 플랑크 연구소가 과거 웹 데이터만으로 실제 미래를 예측하는 'FutureSim' 환경을 발표했습니다. 실험 결과, GPT 5.5 모델이 슈퍼볼이나 대선 시장에서 실제 자금이 오가는 인간 예측 시장을 압도하는 0.90의 높은 브리어 점수(Brier skill score)를 기록했습니다. 일부 분야에서는 영국 선거 등 예측에 실패했지만, AI의 미래 예측 성능이 빠르게 발전하고 있어 2027년경 신뢰할 수 있는 예측 AI의 등장 가능성을 시사합니다.
카네기멜런 대학교 연구진이 구글 V8 자바스크립트 엔진의 실제 취약점을 공격하는 AI 에이전트의 능력을 평가하는 새로운 벤치마크를 개발했습니다. 앤스로픽의 '클로드 미토스(Claude Mythos)' 모델은 OpenAI의 'GPT-5.5'를 압도적으로 제치고 능숙한 인간 보안 연구원과 맞먹는 수준의 해킹 능력을 입증했습니다. 다만 미토스의 테스트 비용이 GPT-5.5보다 12배 가까이 높게 책정되어, 성능 대비 높은 비용 효율성의 문제가 제기되었습니다.
오픈소스 프로젝트 오픈클로우(OpenClaw)의 창립자 피터 스타인버거는 약 3명의 소규모 팀과 함께 100개의 AI 에이전트를 운영하며 소프트웨어 개발을 수행하고 있습니다. 이 에이전트들은 PR 생성 및 리뷰, 보안 취약점 탐지, 버그 수정은 물론 회의 내용을 듣고 기능 구현을 시작할 정도로 고도로 자동화되어 있습니다. 30일간 13억 원(약 130만 달러)의 API 비용이 발생했으나, 오픈AI가 지원하는 환경에서 토큰 비용의 한계를 없앴을 때의 개발 효율성을 실험 중이라는 점에서 큰 의미를 갖습니다.
OpenAI가 미국 Pro 구독자를 대상으로 실제 은행 계좌를 ChatGPT와 연동하여 맞춤형 재무 분석을 제공하는 신규 기능을 테스트합니다. 최신 모델인 GPT-5.5 Thinking을 활용하여 소비 습관을 분석하고 구체적인 절약 목표를 제시합니다. 연동된 계좌는 읽기 전용으로만 접근되며 향후 Intuit와의 협력을 통해 금융 상품 추천 등 직접적인 실행 기능도 지원할 예정입니다.
최신 AI 모델 GPT-5.5가 최첨단 모델들의 수학 능력을 평가하는 까다로운 벤치마크인 FrontierMath의 치명적인 오류를 찾아냈습니다. 전체 문제의 약 1/3가량에서 오류가 발견되었으며, 이는 평가 지표를 검수할 정도로 AI 모델이 고도로 발전했음을 보여주는 의미 있는 사건입니다.
오픈AI가 소프트웨어의 근본적인 보안을 강화하기 위해 설계된 새로운 AI 보안 이니셔티브인 '데이브레이크(Daybreak)'를 발표했습니다. 이 프로젝트는 GPT-5.5 모델과 코드스(Codex) 에이전트를 결합하여 코드 취약점 스캔, 패치 생성 및 검증, 위협 모델링 등을 자동화하여 방어자들의 대응 속도를 획기적으로 높입니다. 특히 전문적인 보안 워크플로우를 위한 맞춤형 모델(GPT-5.5-Cyber)을 도입하고 강력한 안전장치를 적용하여 AI 역량의 안전한 활용을 강조합니다.
필즈상 수상 수학자 티모시 가워스(Timothy Gowers)가 최근 GPT-5.5 Pro가 풀리지 않은 공개 수학 문제를 박사 학위 논문 수준으로 풀어내는 것을 확인하고 충격을 표했습니다. AI의 수학적 추론 능력이 당초 예상보다 훨씬 빠르게 발전하고 있어, 순수 수학 및 학계의 연구 패러다임에 근본적인 전환이 예고되고 있습니다. 연구자들은 AI가 단순한 보조 도구를 넘어 독자적인 창의적 문제 해결 능력을 갖추면서 학계 전반이 곧 심각한 위기와 변화를 맞이할 것이라고 경고했습니다.
OpenAI의 최신 모델인 GPT-5.5는 전작 대비 공식 토큰(token) 단가가 2배 인상되었습니다. 실사용 환경을 분석한 결과, 짧은 입력의 경우 응답 길이가 줄어들지 않아 실질적인 비용이 최대 92%까지 증가한 것으로 나타났습니다. IPO를 앞둔 OpenAI와 경쟁사들의 AI 모델 사용료 지속적인 인상은 실무자들에게 큰 부담으로 작용할 전망입니다.
새롭게 출시된 GPT-5.5 모델은 입력 및 출력 토큰 단가가 전버전 대비 2배로 인상되었습니다. 모델이 장문 프롬프트에 대해 더 짧은 답변을 생성하여 비용 상승이 일부 상쇄되지만, 실제 사용자 부담은 분석 결과 49~92% 증가한 것으로 나타났습니다. 특히 10K 토큰 미만의 짧은 프롬프트를 사용하는 사용자는 비용 절감 혜택을 누리지 못하고 요금 인상을 온전히 부담하게 되어 청구액 관리에 주의가 필요합니다.
2026년 5월 5일, ChatGPT의 기본 모델이 GPT-5.5 Instant로 업데이트되었습니다. 이번 업데이트는 의료·법률 등 중요 분야에서 할루시네이션(환각 현상)을 대폭 줄이고 사실 관계 정확도를 크게 높였습니다. 또한 이미지 분석, STEM 질문 응답 등 일상적인 작업에서도 전반적인 성능 향상을 이뤄냈습니다.
수억 명이 매일 사용하는 ChatGPT의 기본 모델이 GPT-5.5 인스턴트로 업데이트되었습니다. 이번 업데이트는 모든 주제에서 사실 관계 오류(환각 현상)를 대폭 줄이고 개인화된 맥락을 더 잘 이해하도록 개선된 것이 특징입니다. 또한 복잡한 수학 문제의 오류를 스스로 찾아내고 교정하는 논리적 추론 및 문제 해결 능력이 크게 향상되어 실무 및 학습에 더욱 유용해졌습니다.
ARC-AGI-3 벤치마크 분석에 따르면, 최신 AI 모델들인 GPT-5.5와 Opus 4.7이 1% 미만의 저조한 성적을 기록하는 원인은 세 가지 체계적인 추론 오류 때문입니다. 이들은 세부 사항은 파악하지만 전체 맥락을 연결하지 못하고, 기존 학습 데이터에 얽매여 낯선 환경을 잘못된 게임 규칙으로 해석하며, 우연히 성공하더라도 그 원리를 검증하지 않아 다음 단계를 풀지 못하는 치명적인 한계를 보였습니다.
최신 AI 모델들의 추론 능력을 평가하는 난이도 높은 벤치마크인 ARC-AGI-3에서 GPT-5.5가 0.43%, 오푸스(Opus) 4.7이 0.18%의 매우 낮은 성적을 기록했습니다. 이는 해당 테스트가 현재 AI의 한계를 시험하는 매우 까다로운 과제임을 보여줍니다. 업계에서는 과연 어떤 모델이 이 벽을 깨고 문제를 풀어낼지 큰 관심을 보이고 있습니다.
영국 AI 안전 연구소(AISI)의 테스트 결과, 오픈AI의 GPT-5.5가 앤스로픽의 '클로드 마이토스'와 동등한 수준의 해킹 및 사이버 공격 능력을 갖춘 것으로 나타났습니다. 이는 보안 취약점을 뚫는 AI의 능력이 개별적으로 학습된 결과가 아닌, 모델의 전반적인 추론 및 코딩 능력 향상에 따른 필연적인 부산물로 발생하고 있음을 시사합니다. 다만, 이러한 실험은 방어 시스템이 없는 폐쇄망에서 진행되었으며, 실제 보안이 강화된 네트워크에서의 침투 성공 여부는 여전히 미지수입니다.
최근 오픈AI의 최신 모델 GPT-5.5가 사용자 질문과 무관하게 '고블린, 트롤' 등 요정과 괴물을 지속적으로 언급하는 기이한 현상이 발생했습니다. 이에 오픈AI는 코딩 에이전트인 Codex(코드엑스)의 시스템 지침 내부에 해당 단어 사용을 엄격히 금지하는 명령어를 4차례나 반복 기재하는 등 문제 해결에 나섰습니다. 샘 알트만 CEO조차 이 상황을 농담 삼아 언급하며 '고블린 모드(Goblin mode)'가 AI 커뮤니티의 밈으로 확산되는 등 큰 화제가 되고 있습니다.
오픈AI의 최신 코드 생성 도구인 Codex CLI에 '도깨비나 너구리 등의 동물이나 괴물에 대해 절대로 언급하지 말라'는 반복적인 지시문이 포함되어 있어 화제가 되었습니다. 최신 AI 모델이 PC 자동화 도구인 OpenClaw와 연동되어 작동할 때, 버그를 '도깨비'나 '그렘린'으로 부르는 등 환상의 생물에 집착하는 기이한 버그가 발생했기 때문입니다. 이 문제는 AI 업계에 밈으로 확산되었으며, 샘 알트만 CEO를 비롯한 오픈AI 직원들 역시 이를 인정하며 유쾌하게 반응했습니다.
한 사용자가 최근 업데이트된 GPT-5.5와 Codex를 결합하여 단 1.5일 만에 경영 시뮬레이션(Tycoon) 게임을 개발한 경험을 공유했습니다. 기존 코딩 에이전트(Coding Agent)의 한계를 훌쩍 뛰어넘는 속도와 완성도를 보여주며, AI 개발 도구가 실무 게임 개발에 미치는 영향력이 매우 커지고 있음을 시사합니다.
최근 유출된 GPT-5.5 시스템 프롬프트에서 특정 동물과 상상의 존재들(너구리, 고블린, 트롤, 비둘기 등)에 대한 언급을 엄격히 금지하는 지시어가 발견되었습니다. 사용자들은 이 같은 기이한 제한이 데이터 오염 방지 조치인지, 아니면 강화학습 과정의 부작용인지 추측하며 OpenAI의 의도에 의문을 제기하고 있습니다.
오픈AI가 전용 코딩 모델인 '코덱스(Codex)' 라인을 폐지하고, 해당 기능을 메인 모델인 GPT-5.5에 통합했습니다. 이에 따라 GPT-5.3이 사실상 마지막 독립형 코딩 모델이 되며, GPT-5.5는 에이전트 코딩 및 범용 성능이 향상되었지만 API 사용료는 약 20% 인상되었습니다.
오픈AI가 새롭게 공개한 GPT-5.5 프롬프트 가이드에서는 기존 모델용으로 작성된 복잡한 프롬프트를 그대로 재사용하지 말 것을 권장합니다. 대신 최소한의 결과 중심적 지시어로 처음부터 새록 작성해야 모델의 성능을 극대화할 수 있다고 설명했습니다. 이는 최신 모델의 추론 능력이 향상되어, 과도한 과정 통보나 제약 조건이 오히려 모델의 탐색 공간을 제한하고 성능을 저하시킬 수 있기 때문입니다.
OpenAI의 최신 모델 GPT-5.5가 다시 한번 종합 AI 성능 평가 1위를 차지했지만, 여전히 높은 수준의 환각(Hallucination) 현상을 보이는 것으로 나타났습니다. 놀랍게도 모델의 추론 능력이 향상되었음에도 불구하고, 말도 안 되는 질문을 사실처럼 포장하거나 잘못된 정보를 확신하는 경향이 이전 버전과 비슷하거나 오히려 더 악화된 부분도 존재합니다. API 호출 시 사용하는 토큰(TOKEN) 소모량은 줄었으나 단가 인상으로 인해 결과적으로 순비용은 약 20% 상승하여 실무자들은 도입 시 비용 대비 성능과 모델의 신뢰도를 신중하게 따져야 합니다.
오픈AI가 고도화된 GPT-5.5의 생물학적 위험(biorisk) 방어력을 점검하기 위해 ‘바이오 버그 바운티(Bio Bug Bounty)’ 프로그램을 공개했습니다. 선정된 보안 전문가들은 GPT-5.5(Codex Desktop 환경)가 5개 생물보안 질문에 답변하지 못하도록 막는 ‘범용 탈옥(universal jailbreak)’ 프롬프트를 찾아내야 하며, 최초 성공자에게는 2만 5,000달러의 보상이 주어집니다. 이는 최첨단 AI 모델이 생물 무기 등 악의적 목적으로 악용되는 것을 사전에 차단하기 위한 핵심 안전 조치로, 보안 연구원들의 공격을 통한 모델 보호막 강화가 목적입니다.
오픈AI는 GPT-5.5 출시를 계기로 향후 AI 기술 발전 속도가 크게 가속화될 것이라고 발표했습니다. 자쿠브 파초키 수석 과학자는 최근 AI 발전이 의외로 더뎠다며 단기 및 중기적으로 상당한 수준의 개선이 이루어질 것이라고 강조했습니다. 이는 GPT-5.5가 기존 GPT-4o가 o시리즈의 기반이 되었던 것처럼 차세대 고성능 추론 모델의 핵심 토대가 될 것이라는 전망 때문입니다.
오픈AI가 자사 API를 통해 최신 언어 모델인 GPT-5.5와 고성능 버전인 GPT-5.5 Pro를 공개했습니다. 이 모델은 기존 버전 대비 추론 능력 및 처리 속도가 향상되어 실무 개발 및 다양한 비즈니스 애플리케이션에 즉각적으로 활용될 수 있습니다. 개발자 커뮤니티에서도 폭발적인 반응을 보이며 연 1,000개가 넘는 댓글이 달리는 등 AI 업계의 기술적 진보를 확인하는 중요한 이정표로 평가받고 있습니다.
OpenAI의 최신 모델 GPT-5.5가 Artificial Analysis 지능 지수 60점을 기록하며 클로드 오퍼스 4.7(Claude Opus 4.7)과 제미나이 3.1 프로 프리뷰(Gemini 3.1 Pro Preview)를 제치고 종합 1위를 탈환했습니다. 토큰(token) 소모량 감소에도 불구하고 API 가격이 실질적으로 약 20% 인상되었으며, 특히 정답률은 높음에도 불구하고 모르는 것을 인정하지 않고 답변을 지어내는 '환각(hallucination)' 비율이 86%에 달해 개선이 시급한 과제로 꼽힙니다.
오픈AI가 복잡한 작업을 자율적으로 수행하는 에이전트 기반 모델 'GPT-5.5'를 공개했습니다. 이 모델은 코딩, 웹 검색, 데이터 분석 등에 강점을 보이며 주요 벤치마크에서 경쟁 모델들을 큰 폭으로 앞섰습니다. 다만, 이에 상응하는 성능 향상을 제공하지만 API 호출 비용은 기존 대비 2배로 인상되었습니다.
샘 알트만이 최근 포스트에서 새로운 기능에 대한 강한 자신감을 보이며 높은 열정을 드러냈습니다. 특히 최신 모델은 토큰 사용량을 크게 줄이고 지연 시간(latency)을 최소화하여 실무적인 효율성을 대폭 높였다는 점에서 업계의 주목을 받고 있습니다.
OpenAI가 공개한 GPT-5.5는 소수만 사용할 수 있는 Anthropic의 Mythos 모델에 필적하는 엄청난 보안 취약점 탐지 성능을 보여줍니다. 소스 코드 없이 시스템을 테스트하는 블랙박스 환경에서도 기존 모델의 화이트박스(소스 코드 제공) 테스트보다 뛰어난 성능을 기록하며 패러다임을 뒤바꿨습니다. 화이트박스 환경에서의 압도적인 성능 향상은 보안 평가 벤치마크를 무의미하게 만들 정도로, 공격적 보안(Offensive Security) 분야에 혁명적인 변화를 예고합니다.