메뉴
BL
r/LocalLLaMA 55일 전

M3 Pro에서 구동되는 Gemma E2B 실시간 AI

IMP
7/10
핵심 요약

오픈소스 모델인 Gemma를 활용해 오디오와 비디오를 입력받아 음성으로 출력하는 실시간 AI가 Apple M3 Pro 환경에서 로컬 구동되는 것을 확인한 사례입니다. 복잡한 에이전트 코딩은 불가능하지만 다국어 처리가 가능하여 언어 학습용으로 혁신적인 활용성을 보여줍니다. 수년 전 OpenAI가 시연했던 것과 같이 스마트폰 카메라로 사물을 인식하고 모국어로 소통하는 미래가 로컬 환경에서도 가까워지고 있습니다.

번역된 본문

Gemma 4 E2B로 자율형 에이전트 코딩(Agentic coding)을 수행할 수는 없겠지만, 이 모델은 새로운 언어를 배우는 사람들에게는 혁신적인 변화를 가져올 것입니다.

몇 년 후 사람들이 이 모델을 스마트폰에서 로컬로 구동할 수 있게 될 상상해 보십시오. 카메라로 사물을 가리키고 그에 대해 대화를 나눌 수 있을 것입니다. 또한 이 모델은 다국어를 지원하므로 원할 때 언제든 모국어로 되돌아가 대화할 수 있습니다. 이는 본질적으로 OpenAI가 몇 년 전에 시연했던 것과 같습니다.

저장소: https://github.com/fikrikarim/parlor

원문 보기
원문 보기 (영어)
Sure you can't do agentic coding with the Gemma 4 E2B, but this model is a game-changer for people learning a new language. Imagine a few years from now that people can run this locally on their phones. They can point their camera at objects and talk about them. And this model is multi-lingual, so people can always fallback to their native language if they want. This is essentially what OpenAI demoed a few years ago. Repo: [https://github.com/fikrikarim/parlor](https://github.com/fikrikarim/parlor)
관련 소식