메뉴

#구글 딥마인드

SG
r/singularity 5일 전
IMP 9

새로운 제미나이 옴니, 경쟁작들을 압도하다

구글 딥마인드가 텍스트, 오디오, 비디오 등 모든 형태의 입력을 받아 고품질 비디오를 생성하고 자연어 대화로 편집할 수 있는 멀티모달 모델 '제미나이 옴니(Gemini Omni)'를 공개했습니다. 이 모델은 제미나이의 방대한 실세계 지식과 물리 법칙에 대한 이해를 바탕으로 단순한 사실적인 영상을 넘어 의미 있는 스토리텔링이 가능한 영상을 제작합니다. 실무자들에게 이는 복잡한 프롬프트 엔지니어링 없이도 아이디어를 시각화하고 일관된 영상을 제작할 수 있는 혁신적인 워크플로우를 제공한다는 점에서 매우 중요합니다.

구글 딥마인드 제미나이 옴니 비디오 생성
TD
The Decoder 6일 전
IMP 8

구글 딥마인드 AI, 수백 달러로 수십년 난제 풀다

구글 딥마인드가 개발한 '알파프루프 넥서스(AlphaProof Nexus)' 프레임워크가 353개의 미해결 에르되시(Erdős) 수학 문제 중 9개를 자율적으로 해결했습니다. 이 시스템은 LLM이 Lean이라는 형식 언어로 증명 단계를 생성하고 컴파일러가 이를 검증하는 방식으로 추론 비용 문제당 단 몇 백 달러에 불과했습니다. 이는 수학적 증명 분야에서 전문적인 훈련 시스템에서 벗어나, 강력한 범용 LLM과 단순한 에이전트 루프가 결합하는 AI의 새로운 패러다임을 보여줍니다.

인공지능 구글 딥마인드 수학 증명
GB
Google AI Blog 8일 전
IMP 8

구글 I/O 2026 다이얼로그 무대 하이라이트

구글 I/O 2026 행사의 '다이얼로그(Dialogues)' 무대에서 산업 리더, 과학자, 창작자들이 모여 혁신 기술과 미래 사회를 논의했습니다. 선다르 피차이 CEO의 기조연설 후속 인터뷰를 시작으로 AI 에이전트(Agent), 양자 컴퓨팅, 로봇 공학, 영화 제작 등 다양한 분야에서 AI가 미치는 영향과 기술적 도약이 다뤄졌습니다.

구글 I/O AI 에이전트 양자 컴퓨팅
MR
MIT Tech Review 9일 전
IMP 8

코딩의 미래, '향상 게임', 그리고 AI 기반 과학

최근 앤스로픽(Anthropic)의 개발자 행사에서 절반 가까운 개발자가 AI가 작성한 코드를 검토 없이 배포한 것으로 나타나며 소프트웨어 개발의 자동화가 급속도로 진전되고 있습니다. 구글 I/O에서는 AI가 전문적이고 특화된 과학적 문제를 넘어, 인간의 개입 없이도 연구를 수행할 수 있는 자율적 에이전트(Agent) 기반으로 발돋움하는 모습을 선보였습니다. 이와 함께 로널드 트럼프 미 행정부의 규제 연기, AI 코딩 남발에 대한 업계의 경고, 물리적 환경을 이해하는 '월드 모델(World Models)'의 부상 등 AI 생태계의 다방면에서 중대한 변화가 포착되고 있습니다.

AI 코딩 구글 딥마인드 월드 모델
TD
The Decoder 11일 전
IMP 8

구글, 제니 모델과 스트리트뷰 결합…실제 장소 탐색 가능한 AI 세계 생성

구글 딥마인드가 세계 모델 'Genie'를 스트리트뷰와 연동하여, 실제 지도 위에서 사용자가 상호작용할 수 있는 AI 가상 세계를 생성하는 기능을 공개했습니다. 이 시스템은 대중 소비용 게임보다는 자율주행차와 로봇 등 AI 에이전트를 학습시키기 위한 현실적인 시뮬레이션 훈련장으로 활용된다는 점에서 기술적 의의가 큽니다. 현재 미국 지역에 한해 구글 AI Ultra 구독자를 대상으로 실험적 프로토타입 형태로 제공되고 있습니다.

구글 딥마인드 Genie 스트리트뷰
TD
The Decoder 11일 전
IMP 8

구글 제미나이 3.5 플래시, 대폭 인상된 사용료 논란

구글 딥마인드가 공개한 '제미나이 3.5 플래시(Gemini 3.5 Flash)'는 전 대비 5.5배 높은 운영 비용과 3배 오른 토큰 가격으로 개발자들의 비용 부담을 크게 가중시켰습니다. 특히 에이전트(Agent) 작업 시 토큰 소모량이 급증하여, 결과적으로 더 비싼 프리미엄 모델인 Pro 버전보다 총 사용료가 최대 75% 더 높게 청구되는 역설적인 상황이 발생했습니다. 최근 오픈AI와 앤스로픽의 신모델들 또한 토큰 소비량 증가 및 기본 요금 인상을 단행한 바 있어, 업계 전반에 걸쳐 실제 작업 기반의 효율성을 따지는 새로운 비용 측정 기준이 필요해졌습니다.

제미나이 AI 가격 정책 에이전트
HN
Hacker News 11일 전
IMP 9

구글 제미나이 3.5, 에이전트 행동 수행 능력 강화

구글 딥마인드가 최신 AI 모델 패밀리인 제미나이 3.5를 공개하며, 첫 모델로 고성능 에이전트 및 코딩 작업에 특화된 3.5 Flash를 출시했습니다. 이번 모델은 기존 대비 4배 빠른 속도를 제공하면서도 복잡한 다단계 에이전트 워크플로와 멀티모달 이해도에서 최고 수준의 성능을 기록하는 것이 핵심입니다. 또한 '안티그래비티(Antigravity)' 플랫폼과 결합하여 개발 및 엔터프라이즈 환경에서 실질적인 업무 자동화 및 문제 해결을 대규모로 수행할 수 있습니다.

제미나이 3.5 에이전트 코딩 AI
WR
Wired AI 11일 전
IMP 8

데미스 하사비스, AI로 인한 대규모 일자리 감축은 '어리석은 짓'

구글 딥마인드의 CEO 데미스 하사비스는 최신 AI 모델이 코딩 능력을 크게 향상시켰음에도 소프트웨어 개발자를 대체하는 것은 상상력 부족이라고 지적했습니다. 그는 개발자의 생산성이 높아지면 해고하는 대신 더 많은 혁신적인 프로젝트를 수행해야 한다고 강조했습니다.

구글 딥마인드 데미스 하사비스 AI 코딩
MR
MIT Tech Review 12일 전
IMP 8

구글 I/O 2025: AI 코딩 반격과 과학·헬스케어의 진화

이번 주 개최되는 구글 I/O 2025는 최근 AI 코딩 분야에서 오픈AI와 앤스로픽에 밀려 고전하는 구글이 반격을 시도하는 중요한 행사입니다. 특히 딥마인드 내 새로운 코딩 팀의 출범과 '엔티그래비티(Antigravity)' 코드 에이전트 플랫폼 업데이트에 업계의 이목이 집중되고 있습니다. 또한 구글이 노벨상 수주로 입증된 AI 과학 분야의 맹위를 이어갈지, 그리고 오픈AI에 대응하기 위한 헬스케어 AI '헬스 코치(Health Coach)'의 전략은 무엇인지 확인해야 할 주요 기점입니다.

구글 딥마인드 AI 코딩 구글 I/O 2025
HN
Hacker News 21일 전
IMP 8

제미나이 API 파일 검색, 멀티모달 완벽 지원

구글 딥마인드가 제미나이(Gemini) API의 파일 검색(File Search) 도구에 멀티모달 데이터 처리, 커스텀 메타데이터, 페이지 수준의 출처 인용 기능 등 세 가지 주요 업데이트를 도입했습니다. 이를 통해 개발자들은 텍스트와 이미지를 동시에 이해하는 정확하고 투명한 RAG(검색 증강 생성) 시스템을 구축할 수 있게 되었습니다. 이번 업데이트는 대규모 비정형 데이터를 다루는 실무자들에게 검색 정확도와 결과의 신뢰성을 획기적으로 높여준다는 점에서 중요합니다.

제미나이 API 멀티모달 RAG
SG
r/singularity 25일 전
IMP 7

머스크를 가장 두렵게 한 구글 AI 총수, 데미스 해서비스

일론 머스크와 샘 알트만의 OpenAI 향후 운영을 둘러싼 법정 다툼 과정에서 머스크가 구글 딥마인드 CEO 데미스 해서비스에 대해 가졌던 강한 경계심과 집착이 드러났습니다. 창립 초기 OpenAI는 구글의 AI 독점과 폐쇄적인 정책에 맞서기 위해 설립되었으며, 머스크는 해서비스를 '악한 인물'로 의심하며 AI 경쟁에서 뒤처지는 것에 깊은 조급증을 보였습니다. 이번 기사는 실리콘밸리 양대 산맥인 구글과 OpenAI 간의 치열한 AI 패권 경쟁의 이면을 보여준다는 점에서 중요합니다.

구글 딥마인드 오픈AI 일론 머스크
TD
The Decoder 30일 전
IMP 8

구글 딥마인드 AI, GPT-5.4 앞섰지만 전문의엔 못 미쳐

구글 딥마인드가 개발한 'AI 공동 진료 시스템(AI co-clinician)'이 블라인드 평가에서 GPT-5.4 등 기존 AI 모델들을 제치고 우수한 진단 및 약물 처방 능력을 입혀냈습니다. 하지만 실제 의료 현장과 유사한 복합 시뮬레이션 평가에서는 위중한 경고 신호 포착이나 신체 진찰 같은 핵심 역역에서 여전히 경력 있는 전문의의 실력에 미치지 못하는 한계를 보였습니다. 이 연구는 AI가 의사를 대체할 수 없으며, 철저한 임상적 감독하에 의료진을 보조하는 형태로 활용되어야 함을 시사합니다.

AI 의료 구글 딥마인드 GPT-5.4
40
404 Media 32일 전
IMP 6

포드캐스트: 몽환적 이미지의 음모론과 AI 갈등

이번 주 포드캐스트에서는 백악관 기자단 만찬 이후 바이러스처럼 퍼진 몽환적인 스톡 이미지에 얽힌 음모론(시간 여행자가 보냈다는 주장)의 진실을 파헤칩니다. 또한, 교수들의 동의 없이 강의를 무단으로 수집해 학습 자료를 생성하는 애리조나 주립대학(ASU)의 AI 도입 논란과 구글 딥마인드의 'LLM 의식 불가능' 주장을 다룹니다.

AI 윤리 저작권 및 데이터 스크래핑 AI 음모론
WR
Wired AI 32일 전
IMP 9

AI가 항생제 내성 극복을 돕는 방법

매년 수백만 명의 사망을 유발하는 항생제 내성 문제를 해결하기 위해 AI 기반 진단 기술과 신약 발굴이 활용되고 있습니다. AI는 기존 며칠씩 걸리던 내성 균 진단을 99% 이상의 정확도로 신속하게 수행할 수 있게 해주며, 구글 딥마인드 등의 AI는 연구진이 10년 걸린 내성 기작을 단 48시간 만에 밝혀내는 혁신을 보여주었습니다. 이에 따라 제약사의 신항생제 개발 유인을 높이기 위한 구독형 결제 모델 등 새로운 정책적 노력도 동반되고 있습니다.

헬스케어 AI 항생제 내성 신약 개발
MR
MIT Tech Review 39일 전
IMP 8

AI의 다음 도약, '세계 모델'의 부상

현재 AI는 디지털 영역을 정복했지만 물리적 세계를 이해하는 데는 한계가 있습니다. 이를 극복하기 위해 구글 딥마인드, 스탠퍼드 이비 리 교수, 얀 르쿤 등 AI 거장들이 물리적 환경을 시뮬레이션하고 예측하는 '세계 모델(World Model)' 연구에 본격적으로 나섰습니다. 세계 모델은 기존 대형 언어 모델(LLM)의 취약한 세계 인식 능력을 극복하고, 향후 로봇 공학과 자율 주행 등 물리적 환경 상호작용을 필요로 하는 AI 에이전트의 혁신을 이끌 핵심 기술로 평가받고 있습니다.

세계 모델 LLM 한계 로봇 공학
TD
The Decoder 40일 전
IMP 8

구글, 안스로픽 따라잡기 위해 코딩 특수 부대 창설

구글 딥마인드는 안스로픽의 코딩 AI 성능이 자사를 앞섰다는 내부 평가에 따라, 제미나이(Gemini) 모델의 코딩 능력을 강화하기 위한 전담 연구진을 꾸렸습니다. 이를 위해 내부 코드를 활용한 AI 모델 학습을 강화하고 있으며, 세르게이 브린 공동 창립자는 AI가 스스로 성장하는 자가 개선(AI self-improvement) 단계로 나아가기 위해 코딩 능력이 필수적이라고 강조했습니다.

구글 딥마인드 안스로픽 AI 코딩
TD
The Decoder 43일 전
IMP 7

구글 딥마인드, 로봇 계획·인지 능력 강화

구글 딥마인드가 로봇의 고수준 인지 및 작업 계획을 돕는 'Gemini Robotics-ER 1.6'을 공개했습니다. 이 모델은 구글 검색이나 비전-언어-액션(VLA) 모델을 연동하여 작은 계기판의 숫자까지 정밀하게 판독하는 등 복잡한 환경에서의 추론 능력을 대폭 향상시켰습니다. 보스턴 다이내믹스의 Spot 로봇에 적용되어 실제 시스템 검사에 활용될 만큼 높은 실용성을 입증했다는 점이 핵심입니다.

로봇공학 구글 딥마인드 AI 모델
MP
MarkTechPost 46일 전
IMP 8

구글 딥마인드, 로봇 인지 능력 강화 모델 'Gemini Robotics-ER 1.6' 공개

구글 딥마인드가 실제 환경에서 로봇을 제어하는 '인지 뇌' 역할을 하는 발현형 추론(Embodied Reasoning) 모델의 대대적인 업그레이드 버전인 Gemini Robotics-ER 1.6을 발표했습니다. 이 모델은 로봇 공학에 필수적인 시각적/공간적 이해, 작업 계획 수립, 성공 여부 감지 및 계기판 판독 능력을 향상시켜 물리적 AI의 실용성을 한 차원 높였습니다.

로봇공학 인공지능 발현형 AI
MP
MarkTechPost 57일 전
IMP 8

딥마인드 LLM, 전문가 능가하는 게임이론 알고리즘 자체 개발

구글 딥마인드는 대규모 언어 모델(LLM) 기반의 진화적 코딩 에이전트인 'AlphaEvolve(알파이볼브)'를 제안했습니다. 이 에이전트는 폭발적인 정보와 숨겨진 변수가 존재하는 불완전 정보 게임(예: 포커)을 위한 다중 에이전트 강화학습(MARL) 알고리즘을 스스로 재작성 및 최적화합니다. 기존의 수동 개발 방식을 넘어 전문가가 직접 설계한 것보다 더 우수한 성능을 입증했다는 점에서 매우 중요한 연구 성과로 평가받습니다.

구글 딥마인드 알파이볼브 다중 에이전트 강화학습
LL
r/LocalLLaMA 57일 전
IMP 7

구글 Gemma 4 완벽 시각적 가이드

Maarten Grootendorst가 작성한 이 가이드는 구글의 최신 오픈소스 모델인 Gemma 4의 핵심 아키텍처와 기술적 특징을 시각적으로 알기 쉽게 설명합니다. 개발자와 실무자들은 이를 통해 Gemma 4가 기존 모델 대비 어떤 구조적 진보를 이뤄냈는지, 그리고 어떻게 효율적으로 활용할 수 있는지 빠르게 파악할 수 있습니다. 최신 AI 모델 트렌드와 오픈소스 생태계의 발전 방향을 이해하는 데 매우 중요한 자료입니다.

Gemma 4 구글 딥마인드 오픈소스 모델