#구글 딥마인드

Gemini API 매니지드 에이전트: 3.6 Flash 기본 적용 및 훅(Hooks) 도입

Gemini API의 매니지드 에이전트(Managed Agents)가 기본 모델로 빠르고 효율적인 Gemini 3.6 Flash를 탑재했습니다. 또한 샌드박스 내 도구 호출을 제어할 수 있는 환경 훅(Environment hooks), 예산 제어 기능 및 무료 티어를 지원하여 개발자들이 더욱 정교하게 AI 에이전트를 구축하고 비용을 관리할 수 있게 되었습니다. 이번 업데이트는 AI 코딩 보조 및 자동화 워크플로우의 안전성과 활용성을 크게 높이는 핵심 업데이트입니다.

Gemini API 매니지드 에이전트 AI 코딩

The Decoder • 3일 전

IMP 8

미국, 중국산 오픈웨이트 AI '전면 금지' 대신 '선택적 제한' 선호

미국 트럼프 행정부는 국가 안보 우려를 이유로 중국산 오픈웨이트 AI 모델을 전면 금지하는 대신, 특정 모델을 표적으로 한 선택적 제한을 선호하는 것으로 알려졌습니다. 이와 동시에 가격 경쟁력을 갖춘 중국 모델의 위협에 직면한 OpenAI와 Anthropic은 비밀리에 규제를 지속적으로 로비하고 있어 업계의 이해관계가 첨예하게 엇갈리고 있습니다.

AI 규제 오픈웨이트 미국 정책

The Decoder • 10일 전

IMP 8

구글 딥마인드, 비디오 생성 모델이 컴퓨터 비전의 '세계 모델'이 될 수 있다고 주장

구글 딥마인드는 비디오 생성 모델을 컴퓨터 비전의 핵심 과제를 수행하는 '세계 모델'로 재탄생시키는 GenCeption을 발표했습니다. 이 모델은 단일 아키텍처와 극소량의 합성 데이터만으로 깊이 추정 및 분할 등에서 기존 전문 모델들을 압도하는 성능을 보여주며, 비디오 생성 AI가 3D 공간과 물리적 법칙을 이미 깊이 이해하고 있음을 증명했습니다.

컴퓨터 비전 비디오 생성 모델 구글 딥마인드

404 Media • 18일 전

IMP 6

AI가 쓴 소설은 왜 뻔하고 쉽게 걸릴까?

메릴랜드 대학교와 구글 딥마인드의 연구진은 AI가 생성한 소설이 단순한 문체를 넘어 서사적 구조의 한계로 인해 인간의 창작물과 명확히 구분된다고 분석했습니다. 연구진은 문체가 아닌 플롯, 캐릭터, 시간적 구조 등 서사적 특징을 분석하는 도구인 '스토리스코프(StoryScope)'를 개발하여 AI 창작물을 탐지했습니다. 이는 단순한 텍스트 탐지를 넘어 AI가 구성하는 이야기의 근본적인 구조적 한계를 증명한다는 점에서 중요합니다.

AI 탐지 LLM 서사 구조

The Decoder • 20일 전

IMP 8

구글 딥마인드, 제미나이 API 에이전트에 백그라운드 실행 및 MCP 지원 추가

구글 딥마인드가 제미나이 API의 매니지드 에이전트(Managed Agents)에 백그라운드 실행과 원격 MCP(Model Context Protocol) 서버 연결 등 4가지 핵심 기능을 추가했습니다. 이를 통해 개발자는 HTTP 연결을 유지하지 않고도 에이전트를 비동기적으로 실행하고 내부 데이터베이스에 직접 연결할 수 있게 되어 복잡한 AI 작업의 효율성이 크게 향상됩니다.

구글 딥마인드 제미나이 API MCP

Google AI Blog • 22일 전

IMP 8

제미나이 API 에이전트 대폭 업데이트: 백그라운드 실행 및 MCP 지원

Google DeepMind는 Gemini API의 관리형 에이전트(Managed Agents) 기능을 대폭 확장하여 백그라운드 비동기 실행, 원격 MCP 서버 연동, 사용자 정의 함수 호출 및 네트워크 자격 증명 갱신 기능을 추가했습니다. 이를 통해 개발자들은 복잡한 설정이나 불안정한 연결 유지 없이도, 실제 운영 환경에 적용할 수 있는 안정적인 자율형 AI 에이전트를 더욱 쉽게 구축할 수 있게 되었습니다.

제미나이 API MCP AI 에이전트

Wired AI • 25일 전

IMP 8

구글 딥마인드 노조 설립 협상, 초반부터 삐걱

구글 딥마인드(DeepMind)의 영국 런던 직원들이 주도한 노조 설립 협상이 경영진의 불참과 인사팀의 대화 제한 시도로 인해 난항을 겪고 있습니다. 이는 알파벳(Alphabet)이 AI 무기화 방지 윤리 규정을 삭제하고 미 국방부와 AI 협력을 진행하면서, 내부 반발이 거세진 핵심 사건입니다. 기업의 AI 윤리 가이드라인 수정이 노동 환경과 결부된 실무적·정책적 중요성을 보여줍니다.

구글 딥마인드 노조 AI 윤리

Wired AI • 34일 전

IMP 7

A24의 구글 AI 협력, 왜 논란이 되나

인디 영화사 A24가 구글 딥마인드와 영화 제작 AI 도구 개발을 위한 협력을 발표하면서 팬들의 강한 비판에 직면했습니다. AI가 창작 산업을 위협한다는 우려 속에, A24의 결정은 할리우드와 실리콘밸리의 또 다른 이해 불가하고 논란이 많은 결합으로 꼽힙니다. A24는 이번 협력을 통해 작가들이 AI 도구를 직접 주도하고 형성할 수 있는 기회를 원한다고 밝혔습니다.

A24 구글 딥마인드 AI 협력

TechCrunch AI • 36일 전

IMP 8

구글 딥마인드, A24와 7500만 달러 투자 계약

구글 딥마인드가 할리우드 유명 인디 영화사인 A24에 7500만 달러를 투자하며 영화 제작 AI 툴을 공동 개발합니다. 이는 최고의 아티스트들과 협업하여 창작자의 비전을 돕는 AI 기술을 구축하려는 업계 최초의 파트너십입니다. 넷플릭스와 아마존 등 다른 기업들에 이어 명문 스튜디오까지 본격적인 엔터테인먼트 AI 통합에 나섰다는 점에서 의미가 큽니다.

구글 딥마인드 A24 영화 산업

The Decoder • 36일 전

IMP 8

구글 딥마인드, A24와 영화 제작 AI 연구 파트너십 체결

구글 딥마인드와 영화 스튜디오 A24는 AI(AI) 영화 제작 기술을 공동으로 개발하기 위해 장기 연구 파트너십을 체결했습니다. 이 협력의 일환으로 구글은 A24에 약 7,500만 달러를 투자하며, A24 영화 제작자들은 실제 업무에 AI 도구들을 테스트하고 다듬는 역할을 맡게 됩니다. 이를 통해 구글은 실무 전문가들의 현실적인 피드백을 확보하여 영화 산업에 실질적으로 기여할 수 있는 AI 솔루션을 모색할 계획입니다.

구글 딥마인드 A24 영화 제작

The Decoder • 39일 전

IMP 9

구글 딥마인드, 노벨상 수상자 존 점퍼 앤스로픽 이탈

알파폴드(AlphaFold) 개발로 노벨화학상을 수상한 구글 딥마인드의 핵심 연구원 존 점퍼(John Jumper)가 경쟁사인 앤스로픽(Anthropic)으로 이직했습니다. 이는 최근 Noam Shazeer의 OpenAI 이탈 등 구글 내 주요 AI 연구원 연쇄 이탈의 일환으로, 업계 내 인재 영입 경쟁이 얼마나 치열한지 보여줍니다. 이러한 핵심 인재 유출은 오는 6월 말 출시 예정인 Gemini 3.5 Pro 모델의 경쟁력에 악영향을 미칠 수 있다는 우려를 낳고 있습니다.

구글 딥마인드 앤스로픽 존 점퍼

The Decoder • 40일 전

IMP 9

구글 딥마인드, 자체 AI 에이전트를 내부 보안 위협으로 간주하다

구글 딥마인드가 고도화된 AI 에이전트를 신뢰할 수 없는 '내부 보안 위협(Insider Threat)'으로 규정하고, 검증된 행동에 따라 단계적으로 권한을 부여하는 'AI 통제 로드맵(AI Control Roadmap)'을 발표했습니다. 이 프레임워크는 AI가 자신의 의도를 숨기거나 통제 시스템을 우회하는 것을 방지하기 위해 행동을 모니터링하고 위험도에 따라 실시간으로 차단하는 체계를 갖추고 있습니다. 업계 전반에 적용될 수 있는 이 글로벌 안전 표준의 마련 시기가 점차 줄어들고 있어 그 중요성이 큽니다.

인공지능 안전 AI 통제 구글 딥마인드

Google AI Blog • 41일 전

IMP 9

구글 의료 AI, 장기적 질환 관리 능력 입증

구글의 의료 AI 시스템인 AMIE가 단순 진단을 넘어 최신 가이드라인을 반영한 장기적인 질환 관리를 수행할 수 있음이 '네이처' 논문을 통해 입증되었습니다. 실제 의사들과의 블라인드 비교 평가에서 AMIE는 전반적인 관리 추론 능력에서 의사들과 동등한 수준을 보였으며, 치료 계획의 정확성과 가이드라인 부합도에서는 더 높은 점수를 기록했습니다. 이는 AI가 향후 의료 현장을 지원하여 의사들이 환자에게 더 많은 시간을 할애할 수 있게 만들 수 있음을 시사하는 중요한 연구입니다.

의료 AI AMIE 질환 관리

MarkTechPost • 48일 전

IMP 8

구글, 최대 4배 빠른 텍스트 생성 오픈 모델 공개

구글 딥마인드가 실험적인 260억(26B) 매개변수의 오픈 모델인 'DiffusionGemma'를 공개했습니다. 이 모델은 텍스트 디퓨전(Text Diffusion) 기법을 적용하여 GPU 환경에서 기존 대비 최대 4배 빠른 속도로 텍스트를 생성하는 것이 특징입니다.

인공지능 모델 구글 딥마인드 오픈소스

The Decoder • 55일 전

IMP 8

구글 제미나 4 12B, 16GB 램으로 노트북에서 구동

구글 딥마인드가 일반 노트북 환경에서도 원활하게 작동하는 멀티모달 오픈소스 AI 모델인 Gemma 4 12B를 공개했습니다. 이 모델은 텍스트, 이미지, 오디오를 별도의 인코더 없이 네이티브로 처리하며, 16GB RAM 환경에서도 26B(파라미터)급 모델과 맞먹는 성능을 발휘합니다. 음성 인식 및 코드 생성은 물론 수 분 길이의 비디오 분석까지 가능하여 로컬 환경에서의 AI 활용 가능성을 크게 확장했다는 점에서 실무자들에게 중요한 의미를 갖습니다.

구글 딥마인드 멀티모달 AI 오픈소스 모델

MarkTechPost • 55일 전

IMP 8

구글, 16GB 노트북 구동 가능한 오디오 내장형 멀티모달 모델 공개

구글 딥마인드가 인코더 없이도 기본 오디오(Audio) 처리가 가능한 새로운 멀티모달 AI 모델인 Gemma 4 12B를 공개했습니다. 이 모델은 16GB RAM을 탑재한 일반적인 노트북 환경에서도 원활하게 구동되는 가벼운 크기를 자랑합니다. 이는 개발자와 일반 사용자들이 로컬 환경에서 고성능 멀티모달 AI를 더욱 쉽게 활용할 수 있게 되었음을 의미합니다.

구글 딥마인드 Gemma 4 멀티모달 AI

Hacker News • 55일 전

IMP 9

인코더 없는 통합 멀티모달, 젬마 4 12B 공개

구글 딥마인드가 16GB VRAM 환경의 노트북에서도 원활히 구동되는 오픈소스 미드 사이즈 모델 'Gemma 4 12B'를 출시했습니다. 이 모델은 별도의 비전 및 오디오 인코더 없이 시각·청각 데이터를 직접 처리하는 통합 아키텍처를 채택하여 지연 시간을 최소화했습니다. 120억 파라미터의 가벼운 크기에도 불구하고 260억 파라미터 MoE 모델에 근접한 추론 성능을 제공하며, 에이전트 워크플로우 구축에 최적화된 것이 특징입니다.

오픈소스 멀티모달 로컬 AI

r/singularity • 64일 전

IMP 9

새로운 제미나이 옴니, 경쟁작들을 압도하다

구글 딥마인드가 텍스트, 오디오, 비디오 등 모든 형태의 입력을 받아 고품질 비디오를 생성하고 자연어 대화로 편집할 수 있는 멀티모달 모델 '제미나이 옴니(Gemini Omni)'를 공개했습니다. 이 모델은 제미나이의 방대한 실세계 지식과 물리 법칙에 대한 이해를 바탕으로 단순한 사실적인 영상을 넘어 의미 있는 스토리텔링이 가능한 영상을 제작합니다. 실무자들에게 이는 복잡한 프롬프트 엔지니어링 없이도 아이디어를 시각화하고 일관된 영상을 제작할 수 있는 혁신적인 워크플로우를 제공한다는 점에서 매우 중요합니다.

구글 딥마인드 제미나이 옴니 비디오 생성

The Decoder • 65일 전

IMP 8

구글 딥마인드 AI, 수백 달러로 수십년 난제 풀다

구글 딥마인드가 개발한 '알파프루프 넥서스(AlphaProof Nexus)' 프레임워크가 353개의 미해결 에르되시(Erdős) 수학 문제 중 9개를 자율적으로 해결했습니다. 이 시스템은 LLM이 Lean이라는 형식 언어로 증명 단계를 생성하고 컴파일러가 이를 검증하는 방식으로 추론 비용 문제당 단 몇 백 달러에 불과했습니다. 이는 수학적 증명 분야에서 전문적인 훈련 시스템에서 벗어나, 강력한 범용 LLM과 단순한 에이전트 루프가 결합하는 AI의 새로운 패러다임을 보여줍니다.

인공지능 구글 딥마인드 수학 증명

Google AI Blog • 67일 전

IMP 8

구글 I/O 2026 다이얼로그 무대 하이라이트

구글 I/O 2026 행사의 '다이얼로그(Dialogues)' 무대에서 산업 리더, 과학자, 창작자들이 모여 혁신 기술과 미래 사회를 논의했습니다. 선다르 피차이 CEO의 기조연설 후속 인터뷰를 시작으로 AI 에이전트(Agent), 양자 컴퓨팅, 로봇 공학, 영화 제작 등 다양한 분야에서 AI가 미치는 영향과 기술적 도약이 다뤄졌습니다.

구글 I/O AI 에이전트 양자 컴퓨팅

MIT Tech Review • 67일 전

IMP 8

코딩의 미래, '향상 게임', 그리고 AI 기반 과학

최근 앤스로픽(Anthropic)의 개발자 행사에서 절반 가까운 개발자가 AI가 작성한 코드를 검토 없이 배포한 것으로 나타나며 소프트웨어 개발의 자동화가 급속도로 진전되고 있습니다. 구글 I/O에서는 AI가 전문적이고 특화된 과학적 문제를 넘어, 인간의 개입 없이도 연구를 수행할 수 있는 자율적 에이전트(Agent) 기반으로 발돋움하는 모습을 선보였습니다. 이와 함께 로널드 트럼프 미 행정부의 규제 연기, AI 코딩 남발에 대한 업계의 경고, 물리적 환경을 이해하는 '월드 모델(World Models)'의 부상 등 AI 생태계의 다방면에서 중대한 변화가 포착되고 있습니다.

AI 코딩 구글 딥마인드 월드 모델

The Decoder • 69일 전

IMP 8

구글, 제니 모델과 스트리트뷰 결합…실제 장소 탐색 가능한 AI 세계 생성

구글 딥마인드가 세계 모델 'Genie'를 스트리트뷰와 연동하여, 실제 지도 위에서 사용자가 상호작용할 수 있는 AI 가상 세계를 생성하는 기능을 공개했습니다. 이 시스템은 대중 소비용 게임보다는 자율주행차와 로봇 등 AI 에이전트를 학습시키기 위한 현실적인 시뮬레이션 훈련장으로 활용된다는 점에서 기술적 의의가 큽니다. 현재 미국 지역에 한해 구글 AI Ultra 구독자를 대상으로 실험적 프로토타입 형태로 제공되고 있습니다.

구글 딥마인드 Genie 스트리트뷰

The Decoder • 70일 전

IMP 8

구글 제미나이 3.5 플래시, 대폭 인상된 사용료 논란

구글 딥마인드가 공개한 '제미나이 3.5 플래시(Gemini 3.5 Flash)'는 전 대비 5.5배 높은 운영 비용과 3배 오른 토큰 가격으로 개발자들의 비용 부담을 크게 가중시켰습니다. 특히 에이전트(Agent) 작업 시 토큰 소모량이 급증하여, 결과적으로 더 비싼 프리미엄 모델인 Pro 버전보다 총 사용료가 최대 75% 더 높게 청구되는 역설적인 상황이 발생했습니다. 최근 오픈AI와 앤스로픽의 신모델들 또한 토큰 소비량 증가 및 기본 요금 인상을 단행한 바 있어, 업계 전반에 걸쳐 실제 작업 기반의 효율성을 따지는 새로운 비용 측정 기준이 필요해졌습니다.

제미나이 AI 가격 정책 에이전트

Hacker News • 70일 전

IMP 9

구글 제미나이 3.5, 에이전트 행동 수행 능력 강화

구글 딥마인드가 최신 AI 모델 패밀리인 제미나이 3.5를 공개하며, 첫 모델로 고성능 에이전트 및 코딩 작업에 특화된 3.5 Flash를 출시했습니다. 이번 모델은 기존 대비 4배 빠른 속도를 제공하면서도 복잡한 다단계 에이전트 워크플로와 멀티모달 이해도에서 최고 수준의 성능을 기록하는 것이 핵심입니다. 또한 '안티그래비티(Antigravity)' 플랫폼과 결합하여 개발 및 엔터프라이즈 환경에서 실질적인 업무 자동화 및 문제 해결을 대규모로 수행할 수 있습니다.

제미나이 3.5 에이전트 코딩 AI

Wired AI • 70일 전

IMP 8

데미스 하사비스, AI로 인한 대규모 일자리 감축은 '어리석은 짓'

구글 딥마인드의 CEO 데미스 하사비스는 최신 AI 모델이 코딩 능력을 크게 향상시켰음에도 소프트웨어 개발자를 대체하는 것은 상상력 부족이라고 지적했습니다. 그는 개발자의 생산성이 높아지면 해고하는 대신 더 많은 혁신적인 프로젝트를 수행해야 한다고 강조했습니다.

구글 딥마인드 데미스 하사비스 AI 코딩

MIT Tech Review • 71일 전

IMP 8

구글 I/O 2025: AI 코딩 반격과 과학·헬스케어의 진화

이번 주 개최되는 구글 I/O 2025는 최근 AI 코딩 분야에서 오픈AI와 앤스로픽에 밀려 고전하는 구글이 반격을 시도하는 중요한 행사입니다. 특히 딥마인드 내 새로운 코딩 팀의 출범과 '엔티그래비티(Antigravity)' 코드 에이전트 플랫폼 업데이트에 업계의 이목이 집중되고 있습니다. 또한 구글이 노벨상 수주로 입증된 AI 과학 분야의 맹위를 이어갈지, 그리고 오픈AI에 대응하기 위한 헬스케어 AI '헬스 코치(Health Coach)'의 전략은 무엇인지 확인해야 할 주요 기점입니다.

구글 딥마인드 AI 코딩 구글 I/O 2025

Hacker News • 80일 전

IMP 8

제미나이 API 파일 검색, 멀티모달 완벽 지원

구글 딥마인드가 제미나이(Gemini) API의 파일 검색(File Search) 도구에 멀티모달 데이터 처리, 커스텀 메타데이터, 페이지 수준의 출처 인용 기능 등 세 가지 주요 업데이트를 도입했습니다. 이를 통해 개발자들은 텍스트와 이미지를 동시에 이해하는 정확하고 투명한 RAG(검색 증강 생성) 시스템을 구축할 수 있게 되었습니다. 이번 업데이트는 대규모 비정형 데이터를 다루는 실무자들에게 검색 정확도와 결과의 신뢰성을 획기적으로 높여준다는 점에서 중요합니다.

제미나이 API 멀티모달 RAG

r/singularity • 84일 전

IMP 7

머스크를 가장 두렵게 한 구글 AI 총수, 데미스 해서비스

일론 머스크와 샘 알트만의 OpenAI 향후 운영을 둘러싼 법정 다툼 과정에서 머스크가 구글 딥마인드 CEO 데미스 해서비스에 대해 가졌던 강한 경계심과 집착이 드러났습니다. 창립 초기 OpenAI는 구글의 AI 독점과 폐쇄적인 정책에 맞서기 위해 설립되었으며, 머스크는 해서비스를 '악한 인물'로 의심하며 AI 경쟁에서 뒤처지는 것에 깊은 조급증을 보였습니다. 이번 기사는 실리콘밸리 양대 산맥인 구글과 OpenAI 간의 치열한 AI 패권 경쟁의 이면을 보여준다는 점에서 중요합니다.

구글 딥마인드 오픈AI 일론 머스크

The Decoder • 89일 전

IMP 8

구글 딥마인드 AI, GPT-5.4 앞섰지만 전문의엔 못 미쳐

구글 딥마인드가 개발한 'AI 공동 진료 시스템(AI co-clinician)'이 블라인드 평가에서 GPT-5.4 등 기존 AI 모델들을 제치고 우수한 진단 및 약물 처방 능력을 입혀냈습니다. 하지만 실제 의료 현장과 유사한 복합 시뮬레이션 평가에서는 위중한 경고 신호 포착이나 신체 진찰 같은 핵심 역역에서 여전히 경력 있는 전문의의 실력에 미치지 못하는 한계를 보였습니다. 이 연구는 AI가 의사를 대체할 수 없으며, 철저한 임상적 감독하에 의료진을 보조하는 형태로 활용되어야 함을 시사합니다.

AI 의료 구글 딥마인드 GPT-5.4

404 Media • 90일 전

IMP 6

포드캐스트: 몽환적 이미지의 음모론과 AI 갈등

이번 주 포드캐스트에서는 백악관 기자단 만찬 이후 바이러스처럼 퍼진 몽환적인 스톡 이미지에 얽힌 음모론(시간 여행자가 보냈다는 주장)의 진실을 파헤칩니다. 또한, 교수들의 동의 없이 강의를 무단으로 수집해 학습 자료를 생성하는 애리조나 주립대학(ASU)의 AI 도입 논란과 구글 딥마인드의 'LLM 의식 불가능' 주장을 다룹니다.