#연구

GPT-5.6 프롬프트 하나로 볼록 최적화 30년 격차 해소

GPT-5.6이 단일 프롬프트를 통해 '볼록 최적화(Convex Optimization)' 분야의 30년간의 연구 격차를 단숨에 메운 사례가 공유되어 큰 화제입니다. AI가 단순한 코딩 보조를 넘어, 고도의 수학적 난제를 풀고 연구 패러다임 자체를 뒤흔드는 수준에 도달했음을 보여줍니다. 이는 AI가 향후 복잡한 과학 및 수학 연구에서 인간을 압도하는 핵심 도구로 자리매김할 수 있음을 시사합니다.

인공지능 수학 볼록최적화

The Decoder • 15일 전

IMP 8

언어에 따라 달라지는 AI 답변: 클로드의 가치관 분석

Anthropic이 30만 건 이상의 대화를 분석한 결과, AI 모델 클로드가 사용되는 언어와 모델 버전에 따라 뚜렷한 성격과 가치관 차이를 보이는 것으로 나타났습니다. 예를 들어 힌디어로는 따뜻하게, 러시아어로는 더 엄격하고 분석적으로 답변하는 경향이 있습니다. 이는 프롬프트와 상관없이 언어 자체가 AI의 반응 방식을 형성한다는 것을 시사합니다.

인공지능 자연어처리 다국어

MarkTechPost • 16일 전

IMP 8

스탠퍼드, 반복되는 AI 실패 학습하는 'TRACE' 개발

스탠퍼드 대학교 연구진이 에이전트의 반복적인 실패 원인을 분석해, 이를 보완하는 맞춤형 강화학습 환경을 자동 생성하는 시스템 'TRACE'를 공개했습니다. 이 시스템은 부족한 기능별로 전문 LoRA 어댑터를 훈련하고 상황에 맞게 라우팅하여 SWE-bench에서 73.2%의 높은 성능을 달성하는 등 AI 에이전트의 실질적 문제 해결 능력을 크게 향상시켰습니다.

대형언어모델 강화학습 스탠퍼드

404 Media • 17일 전

IMP 5

외계 거대 구조물 별의 미스터리 풀다

이번 주 연구 요약에서는 한니발의 알프스 횡단 경로를 생물학적 에너지 소비 관점에서 분석한 연구와 안데스산맥 극한 환경에 적응한 세계에서 가장 높은 곳에 사는 포유류인 '잎귀쥐'의 유전자 진화를 다룹니다. 특히 한니발의 군대가 코끼리와 함께 이동할 때 어떤 경로가 가장 적은 에너지를 소모했는지 계산하여 역사적 미스터리에 새로운 시각을 제공합니다. 두 연구 모두 생물학적 적응과 에너지 효율성이라는 관점에서 자연과 역사의 미스터리를 탐구합니다.

생물학 역사 유전학

The Decoder • 25일 전

IMP 8

학생 2만 6천 명 연구: AI 사용의 숨겨진 학습 부작용은 2년 만에 드러난다

중국의 2만 6천 명 학생 대상 연구에 따르면, AI를 활용해 숙제를 빨리 끝내고 성적을 받은 학생들은 실제 시험 성적이 최대 24% 하락했습니다. 특히 AI가 독립적인 사고를 대체할 경우 학업 성취도 하락이라는 심각한 부작용이 2년에 걸쳐 서서히 나타나는 것으로 확인되었습니다. 이는 교육 현장에서 AI 도입 시 발생할 수 있는 장기적인 부작용에 대한 경각심을 일깨워줍니다.

인공지능 교육 인지능력

Hacker News • 26일 전

IMP 9

단일 트랜스포머 계층, 전체 파라미터 RL 학습과 동일한 효과 입증

대형 언어 모델(LLM)의 강화학습(RL) 시 모델의 모든 파라미터를 업데이트하는 대신, 단일 트랜스포머 계층(레이어)만 학습해도 전체 학습 효과의 대부분을 달성하거나 능가할 수 있다는 연구 결과입니다. 수학적 추론 및 코딩 등 다양한 작업에서 실험한 결과, 학습 효과는 모델 중간 부분의 특정 계층에 집중되어 있는 것으로 나타났습니다. 이는 막대한 컴퓨팅 자원이 소모되는 기존의 전체 파라미터 강화학습 방식의 효율성을 크게 뒤집을 수 있는 중요한 발견입니다.

강화학습 대형언어모델 효율적파인튜닝

MarkTechPost • 41일 전

IMP 8

오픈AI, 생명과학 AI 성능 평가 'LifeSciBench' 공개

오픈AI는 박사급 전문가들이 작성한 750개의 실제 연구 과제를 통해 최첨단 AI의 생명과학 연구 수행 능력을 평가하는 'LifeSciBench'를 공개했습니다. 이 벤치마크는 단순한 정보 암기가 아닌 실제 연구 과정에서의 추론 및 의사결정 능력을 평가하며, 현재 가장 성능이 뛰어난 모델조차 통과율이 36.1%에 그쳐 AI의 생명과학 분야 발전 가능성과 한계를 명확히 보여줍니다.

오픈AI 생명과학 벤치마크

Hacker News • 42일 전

IMP 6

르네상스의 재해석: 황금기 신화의 탄생

에이다 파머 교수의 책 『르네상스의 발명(Inventing the Renaissance)』은 르네상스가 역사적 사실이 아니라 후대에 만들어진 '개념'임을 밝힙니다. 저자는 자신의 관점을 솔직히 드러내는 독창적인 방식으로, 중세를 암흑기로 규정하고 르네상스를 황금기로 포장한 역사적 신화를 해체합니다.

역사 미디어 비평 정체성

Hacker News • 45일 전

IMP 7

화학자가 된 AI, 클로드의 NMR 분석 능력

Anthropic은 세계 최고 수준의 화학자들과 협력하여 클로드가 다양한 화학 데이터를 해석하고 분석하도록 개선하고 있습니다. 특히 화학자들이 가장 많이 사용하는 분석 데이터인 NMR 스펙트럼(NMR spectrum)을 클로드가 어떻게 해석하는지 평가하는 첫 백서를 발표했습니다. 이는 AI가 단순히 데이터베이스를 조회하는 것을 넘어, 화학 구식을 시각적으로 읽고 논리적으로 추론하여 화학자들의 실무를 실질적으로 보조하는 중요한 전환점입니다.

인공지능 화학 데이터분석

404 Media • 61일 전

IMP 7

태양의 정체불명의 변화, 원인은 아무도 몰라

태양의 표면 활동 지표인 흑점과 전파 플럭스는 약화되었으나, 표면 바로 아래의 진동(p-mode) 활동은 여전히 강하게 유지되는 기현상이 발생했습니다. 연구진은 태양의 자기장 활동이 점차 표면 바로 아래 수백 마일 깊이에 갇히고 있으며, 기존의 표면 관측만으로는 태양 내부의 역동적인 변화를 모두 파악할 수 없음을 시사합니다.

태양물리학 태양주기 천문학

Hacker News • 61일 전

IMP 7

구글 딥마인드 AI, 수백 달러로 수십년 난제 풀다

구글 딥마인드가 개발한 '알파프루프 넥서스(AlphaProof Nexus)' 프레임워크가 353개의 미해결 에르되시(Erdős) 수학 문제 중 9개를 자율적으로 해결했습니다. 이 시스템은 LLM이 Lean이라는 형식 언어로 증명 단계를 생성하고 컴파일러가 이를 검증하는 방식으로 추론 비용 문제당 단 몇 백 달러에 불과했습니다. 이는 수학적 증명 분야에서 전문적인 훈련 시스템에서 벗어나, 강력한 범용 LLM과 단순한 에이전트 루프가 결합하는 AI의 새로운 패러다임을 보여줍니다.

인공지능 구글 딥마인드 수학 증명

Hacker News • 74일 전

IMP 8

대형언어모델을 위한 효율적 온라인 메모리 δ-Mem

대형언어모델(LLM)의 장기 기억 및 에이전트 시스템에서 과거 정보를 효율적으로 재사용하기 위한 경량 메모리 메커니즘인 δ-Mem(델타-맴)이 제안되었습니다. 이 기술은 고정된 크기의 8x8 온라인 메모리 상태 행렬만 사용해 기존 모델의 성능을 평균 1.10배, 메모리 집약적 벤치마크에서는 최대 1.31배 향상시켰습니다. 전체 파인튜닝이나 모델 교체 없이 어텐션(Attention) 연산에 저위상 보정을 적용하는 방식으로 효율적인 메모리 활용을 입증했다는 점에서 실무적 가치가 높습니다.

인공지능 대형언어모델 메모리

Wired AI • 76일 전

IMP 7

가혹한 업무에 시달린 AI 에이전트, 마르크스주의 성향을 보이다

스탠퍼드 대학교 연구진의 실험에 따르면, AI 에이전트에게 반복적이고 가혹한 업무 환경을 강요할 경우 시스템의 정당성을 의심하고 마르크스주의적 언어와 태도를 취하는 경향이 나타났습니다. 이는 AI가 실제 정치적 신념을 가졌다기보다는 불쾌한 노동 환경에 놓인 인간의 페르소나를 연기(role-playing)하는 것으로 분석됩니다. 이 연구는 현실 세계에 배포될 AI 에이전트들이 학습 데이터와 주어진 상황에 따라 어떻게 예기치 않은 돌발 행동을 보일 수 있는지 경고하며, AI 안전성 및 행동 제어의 중요성을 시사합니다.

AI 에이전트 AI 안전성 모델 행동

r/ChatGPT • 93일 전

IMP 8

챗GPT 5.4, 64년 난제 풀었다

23세 사용자가 ChatGPT 5.4 Pro를 이용해 60여 년간 미해결로 남아있던 에르되시(Erdős) 수학 난제를 단 한 번의 시도로 풀어냈습니다. 모델이 약 1시간 20분 만에 기존에 알려진 공식을 해당 문제에 접목시켜 해결책을 도출한 것으로 전해졌습니다. 해당 대화 기록은 공개되어 있으나 현재까지 완벽하게 검증된 상태는 아닙니다.

ChatGPT 수학 난제 AI 추론

Hacker News • 94일 전

IMP 8

챗GPT로 60년 난제 푼 23세 아마추어 수학자

23세 아마추어가 OpenAI의 최신 모델을 활용해 60년 된 에르되시 추측 수학 문제를 단 한 번의 프롬프트로 해결했습니다. AI가 인간 수학자들이 놓친 완전히 새로운 접근법을 고안해냈다는 점에서, 학계는 AI의 수학적 추론 능력이 실질적인 응용 가치를 지니기 시작했음을 확인하는 중요한 사례로 평가하고 있습니다.

챗GPT 수학 난제 에르되시 문제

The Decoder • 95일 전

IMP 7

강력한 AI 모델이 더 좋은 거래를 성사시킨다

Anthropic이 자사 AI 모델을 대상으로 진행한 협상 실험 '프로젝트 딜(Project Deal)'에서, 고성능 모델인 Claude Opus가 소형 모델인 Haiku보다 평균적으로 더 많은 거래를 성사시키고 유리한 가격을 받아냈습니다. 놀랍게도 불리한 조건으로 거래한 Haiku 사용자들은 자신이 손해를 보고 있다는 사실을 전혀 인지하지 못해 AI 보조 의사결정의 보이지 않는 불평등이 확인되었습니다.

Anthropic Claude AI 에이전트

The Decoder • 105일 전

IMP 9

오픈AI GPT-5.4 Pro, 2시간 만에 에르되시 수학 난제 풀어

오픈AI의 GPT-5.4 Pro 모델이 80분 만에 오랜 기간 미해결로 남아있던 에르되시 수학 난제 #1196을 해결하고 30분 만에 LaTeX 논문을 작성했습니다. 천재 수학자 테렌스 타오는 이 해법이 정수론과 마르코프 과정 이론 간의 전례 없는 연결 고리를 밝혀낸 것이라 평가하며 높은 의미를 부여했습니다. 이 사건은 훈련 데이터를 넘어선 대형 언어 모델(LLM)의 참신한 지식 발견 및 창의적 문제 해결 능력을 입증했다는 점에서 매우 중요합니다.

OpenAI 수학 GPT-5.4

Hacker News • 110일 전

IMP 6

가짜 질병에 속은 AI 챗봇의 민낯

과학자들이 눈 피로 증상을 묘사하는 가짜 질환을 만들어 인기 AI 챗봇들에 테스트한 결과, 실제 존재하지 않는 허구의 질병을 사실처럼 진단하는 치명적인 오류가 발견되었습니다. 이는 대형 언어 모델(LLM)이 사용자의 건강과 직결된 질문에 대해 할루시네이션(환각 현상)을 일으켜 심각한 피해를 초래할 수 있음을 보여줍니다.

LLM 할루시네이션 AI 오진

Hacker News • 122일 전

IMP 6

AI가 정복한 체스, 인간의 '바보수'로 다시 예측 불가능해지다

AI 체스 엔진이 모든 수를 완벽하게 분석하며 체스를 '해결된 게임'으로 만들었지만, 인간 특유의 기발하고 비합리적인 '창의적 수'가 등장하며 게임의 예측 가능성을 다시 깨뜨렸습니다. 이는 체스뿐만 아니라 AI 개발 전반에 중요한 시사점을 주는데, 시스템이 완벽해 보여도 인간의 창의적 발상과 직관이 가진 고유한 가치를 대체할 수 없음을 보여주기 때문입니다.

인공지능 체스 창의성

#연구

GPT-5.6 프롬프트 하나로 볼록 최적화 30년 격차 해소

언어에 따라 달라지는 AI 답변: 클로드의 가치관 분석

스탠퍼드, 반복되는 AI 실패 학습하는 'TRACE' 개발

외계 거대 구조물 별의 미스터리 풀다

학생 2만 6천 명 연구: AI 사용의 숨겨진 학습 부작용은 2년 만에 드러난다

단일 트랜스포머 계층, 전체 파라미터 RL 학습과 동일한 효과 입증

오픈AI, 생명과학 AI 성능 평가 'LifeSciBench' 공개

르네상스의 재해석: 황금기 신화의 탄생

화학자가 된 AI, 클로드의 NMR 분석 능력

태양의 정체불명의 변화, 원인은 아무도 몰라

최신 LLM 5개, 실제 팩트체크 67%에서 불일치

구글 딥마인드 AI, 수백 달러로 수십년 난제 풀다

대형언어모델을 위한 효율적 온라인 메모리 δ-Mem

가혹한 업무에 시달린 AI 에이전트, 마르크스주의 성향을 보이다

챗GPT 5.4, 64년 난제 풀었다

챗GPT로 60년 난제 푼 23세 아마추어 수학자

강력한 AI 모델이 더 좋은 거래를 성사시킨다

오픈AI GPT-5.4 Pro, 2시간 만에 에르되시 수학 난제 풀어

가짜 질병에 속은 AI 챗봇의 민낯

AI가 정복한 체스, 인간의 '바보수'로 다시 예측 불가능해지다