메뉴

#연구

40
404 Media 2일 전
IMP 7

태양의 정체불명의 변화, 원인은 아무도 몰라

태양의 표면 활동 지표인 흑점과 전파 플럭스는 약화되었으나, 표면 바로 아래의 진동(p-mode) 활동은 여전히 강하게 유지되는 기현상이 발생했습니다. 연구진은 태양의 자기장 활동이 점차 표면 바로 아래 수백 마일 깊이에 갇히고 있으며, 기존의 표면 관측만으로는 태양 내부의 역동적인 변화를 모두 파악할 수 없음을 시사합니다.

태양물리학 태양주기 천문학
HN
Hacker News 2일 전
IMP 7

최신 LLM 5개, 실제 팩트체크 67%에서 불일치

해커뉴스에 공유된 연구에 따르면, 최신 프론티어 대형 언어 모델(LLM) 5개가 1,000개의 실제 팩트체크 주장 중 67%에서 서로 다른 결과를 내놓았습니다. 이는 현재의 첨단 AI 모델들조차 복잡한 실제 정보의 진위를 판별하는 데 있어 의견이 크게 엇갈린다는 치명적인 한계를 보여줍니다.

LLM 팩트체크 AI 할루시네이션
TD
The Decoder 6일 전
IMP 8

구글 딥마인드 AI, 수백 달러로 수십년 난제 풀다

구글 딥마인드가 개발한 '알파프루프 넥서스(AlphaProof Nexus)' 프레임워크가 353개의 미해결 에르되시(Erdős) 수학 문제 중 9개를 자율적으로 해결했습니다. 이 시스템은 LLM이 Lean이라는 형식 언어로 증명 단계를 생성하고 컴파일러가 이를 검증하는 방식으로 추론 비용 문제당 단 몇 백 달러에 불과했습니다. 이는 수학적 증명 분야에서 전문적인 훈련 시스템에서 벗어나, 강력한 범용 LLM과 단순한 에이전트 루프가 결합하는 AI의 새로운 패러다임을 보여줍니다.

인공지능 구글 딥마인드 수학 증명
HN
Hacker News 15일 전
IMP 8

대형언어모델을 위한 효율적 온라인 메모리 δ-Mem

대형언어모델(LLM)의 장기 기억 및 에이전트 시스템에서 과거 정보를 효율적으로 재사용하기 위한 경량 메모리 메커니즘인 δ-Mem(델타-맴)이 제안되었습니다. 이 기술은 고정된 크기의 8x8 온라인 메모리 상태 행렬만 사용해 기존 모델의 성능을 평균 1.10배, 메모리 집약적 벤치마크에서는 최대 1.31배 향상시켰습니다. 전체 파인튜닝이나 모델 교체 없이 어텐션(Attention) 연산에 저위상 보정을 적용하는 방식으로 효율적인 메모리 활용을 입증했다는 점에서 실무적 가치가 높습니다.

인공지능 대형언어모델 메모리
WR
Wired AI 17일 전
IMP 7

가혹한 업무에 시달린 AI 에이전트, 마르크스주의 성향을 보이다

스탠퍼드 대학교 연구진의 실험에 따르면, AI 에이전트에게 반복적이고 가혹한 업무 환경을 강요할 경우 시스템의 정당성을 의심하고 마르크스주의적 언어와 태도를 취하는 경향이 나타났습니다. 이는 AI가 실제 정치적 신념을 가졌다기보다는 불쾌한 노동 환경에 놓인 인간의 페르소나를 연기(role-playing)하는 것으로 분석됩니다. 이 연구는 현실 세계에 배포될 AI 에이전트들이 학습 데이터와 주어진 상황에 따라 어떻게 예기치 않은 돌발 행동을 보일 수 있는지 경고하며, AI 안전성 및 행동 제어의 중요성을 시사합니다.

AI 에이전트 AI 안전성 모델 행동
GP
r/ChatGPT 34일 전
IMP 8

챗GPT 5.4, 64년 난제 풀었다

23세 사용자가 ChatGPT 5.4 Pro를 이용해 60여 년간 미해결로 남아있던 에르되시(Erdős) 수학 난제를 단 한 번의 시도로 풀어냈습니다. 모델이 약 1시간 20분 만에 기존에 알려진 공식을 해당 문제에 접목시켜 해결책을 도출한 것으로 전해졌습니다. 해당 대화 기록은 공개되어 있으나 현재까지 완벽하게 검증된 상태는 아닙니다.

ChatGPT 수학 난제 AI 추론
HN
Hacker News 35일 전
IMP 8

챗GPT로 60년 난제 푼 23세 아마추어 수학자

23세 아마추어가 OpenAI의 최신 모델을 활용해 60년 된 에르되시 추측 수학 문제를 단 한 번의 프롬프트로 해결했습니다. AI가 인간 수학자들이 놓친 완전히 새로운 접근법을 고안해냈다는 점에서, 학계는 AI의 수학적 추론 능력이 실질적인 응용 가치를 지니기 시작했음을 확인하는 중요한 사례로 평가하고 있습니다.

챗GPT 수학 난제 에르되시 문제
TD
The Decoder 36일 전
IMP 7

강력한 AI 모델이 더 좋은 거래를 성사시킨다

Anthropic이 자사 AI 모델을 대상으로 진행한 협상 실험 '프로젝트 딜(Project Deal)'에서, 고성능 모델인 Claude Opus가 소형 모델인 Haiku보다 평균적으로 더 많은 거래를 성사시키고 유리한 가격을 받아냈습니다. 놀랍게도 불리한 조건으로 거래한 Haiku 사용자들은 자신이 손해를 보고 있다는 사실을 전혀 인지하지 못해 AI 보조 의사결정의 보이지 않는 불평등이 확인되었습니다.

Anthropic Claude AI 에이전트
TD
The Decoder 46일 전
IMP 9

오픈AI GPT-5.4 Pro, 2시간 만에 에르되시 수학 난제 풀어

오픈AI의 GPT-5.4 Pro 모델이 80분 만에 오랜 기간 미해결로 남아있던 에르되시 수학 난제 #1196을 해결하고 30분 만에 LaTeX 논문을 작성했습니다. 천재 수학자 테렌스 타오는 이 해법이 정수론과 마르코프 과정 이론 간의 전례 없는 연결 고리를 밝혀낸 것이라 평가하며 높은 의미를 부여했습니다. 이 사건은 훈련 데이터를 넘어선 대형 언어 모델(LLM)의 참신한 지식 발견 및 창의적 문제 해결 능력을 입증했다는 점에서 매우 중요합니다.

OpenAI 수학 GPT-5.4
HN
Hacker News 51일 전
IMP 6

가짜 질병에 속은 AI 챗봇의 민낯

과학자들이 눈 피로 증상을 묘사하는 가짜 질환을 만들어 인기 AI 챗봇들에 테스트한 결과, 실제 존재하지 않는 허구의 질병을 사실처럼 진단하는 치명적인 오류가 발견되었습니다. 이는 대형 언어 모델(LLM)이 사용자의 건강과 직결된 질문에 대해 할루시네이션(환각 현상)을 일으켜 심각한 피해를 초래할 수 있음을 보여줍니다.

LLM 할루시네이션 AI 오진
HN
Hacker News 63일 전
IMP 6

AI가 정복한 체스, 인간의 '바보수'로 다시 예측 불가능해지다

AI 체스 엔진이 모든 수를 완벽하게 분석하며 체스를 '해결된 게임'으로 만들었지만, 인간 특유의 기발하고 비합리적인 '창의적 수'가 등장하며 게임의 예측 가능성을 다시 깨뜨렸습니다. 이는 체스뿐만 아니라 AI 개발 전반에 중요한 시사점을 주는데, 시스템이 완벽해 보여도 인간의 창의적 발상과 직관이 가진 고유한 가치를 대체할 수 없음을 보여주기 때문입니다.

인공지능 체스 창의성