메뉴

#영상 생성

GB
Google AI Blog 2일 전
IMP 9

구글 I/O 2026 주요 발표 12선 요약

구글 I/O 2026에서는 텍스트, 이미지, 영상 등을 통합 입력받아 고품질 영상을 생성하는 'Gemini Omni'와 복잡한 에이전트 및 코딩 작업에 최적화된 'Gemini 3.5 Flash' 모델이 공개되었습니다. 또한 사용자의 질문에 맞춰 실시간으로 맞춤형 웹 앱을 구동하는 'Antigravity' 기반의 검색 경험과 웹을 지능적으로 모니터링하는 '정보 에이전트'가 도입되어, AI가 일상적인 검색을 넘어 실질적인 작업을 대신 수행하는 에이전트 시대의 본격적인 막을 알렸습니다.

Gemini Omni Gemini 3.5 Flash 에이전트
HN
Hacker News 11일 전
IMP 8

구글 제미나이 옴니(Gemini Omni) 발표

구글이 텍스트, 이미지, 오디오 등 모든 형태의 입력을 조합해 자연어 대화만으로 영상을 생성하고 편집할 수 있는 멀티모달 AI 모델 '제미나이 옴니(Gemini Omni)'를 공개했습니다. 이 모델은 물리법칙이나 역사적 사실에 대한 세계 지식을 바탕으로 일관성 있는 스토리텔링이 가능하며, 복잡한 영상 편집 과정을 단계적인 대화를 통해 수행할 수 있다는 점이 가장 큰 특징입니다. 실무자 관점에서 프롬프트 가이드와 안전성 평제(Red Teaming)를 거쳐 배포되었으며, 영상 생성 및 편집 파이프라인의 혁신을 가져올 중요한 릴리즈입니다.

영상 생성 멀티모달 AI 제미나이 옴니
SG
r/singularity 12일 전
IMP 5

제미나이 옴니(Gemini Omni)가 생성한 영상 공개

X(옛 트위터)에 '제미나이 옴니(Gemini Omni)' 모델을 통해 생성된 것으로 보이는 영상이 공유되었습니다. 게시자는 해당 영상의 실제 생성 출처를 첫 번째 답글에서 확인할 수 있다고 안내했습니다. 실무자들에게 멀티모달 AI의 영상 생성 역량 및 진위를 파악하는 데 중요한 참고 자료가 됩니다.

제미나이 영상 생성 멀티모달 AI
GB
Google AI Blog 60일 전
IMP 7

구글, 가장 가성비 좋은 영상 생성 모델 Veo 3.1 Lite 공개

구글 딥마인드가 기존 모델 대비 절반 미만의 비용으로 동일한 속도를 제공하는 새로운 영상 생성 모델 'Veo 3.1 Lite'를 출시했습니다. 이 모델은 텍스트/이미지를 영상으로 변환하는 기능을 지원하며 720p 및 1080p 해상도와 최대 8초 길이 등 유연한 설정을 제공합니다. 4월 7일부터는 기존 'Veo 3.1 Fast' 모델의 가격도 인하되어 개발자들이 더욱 저렴하게 영상 생성 API를 제품에 통합할 수 있게 되었습니다.

영상 생성 Veo 3.1 Gemini API