메뉴
BL
TechCrunch AI 54일 전

구글, 오프라인 구동되는 AI 받아쓰기 앱 출시

IMP
7/10
핵심 요약

구글이 Wispr Flow, SuperWhisper 등과 경쟁하기 위해 오프라인에서도 AI 받아쓰기가 가능한 'Google AI Edge Eloquent' 앱을 iOS용으로 조용히 출시했습니다. 이 앱은 온디바이스 기반의 Gemma 모델을 사용하여 음성을 텍스트로 변환하고, 불필요한 추임새를 자동으로 제거하여 깔끔한 문장으로 다듬어주는 것이 특징입니다. 현재는 iOS 버전만 제공되지만 향후 안드로이드 통합 기능도 지원될 예정이며, 이번 실험적 출시를 통해 구글의 본격적인 음성 AI 시장 진출을 확인할 수 있습니다.

번역된 본문

구글은 월요일, Wispr Flow, SuperWhisper, Willow 등과 경쟁하기 위해 오프라인을 우선으로 하는 'Google AI Edge Eloquent'라는 받아쓰기 앱을 iOS용으로 조용히 출시했습니다. 이 앱은 무료로 다운로드할 수 있으며, Gemma 기반 자동 음성 인식(ASR) 모델이 다운로드되면 휴대폰에서 즉시 받아쓰기를 시작할 수 있습니다. 앱 내에서 실시간 전사 과정을 볼 수 있으며, 일시 정지를 누르면 앱이 자동으로 '음', '어'와 같은 불필요한 추임새를 필터링하고 텍스트를 매끄럽게 다듬어 줍니다. 전사본 하단에는 '핵심 요점', '격식 있는 말투', '짧은 길이', '긴 길이' 등의 옵션이 있어 텍스트를 쉽게 변환할 수 있습니다. 또한 클라우드 모드를 끄고 로컬에서만 처리하도록 설정할 수도 있습니다. (단, 클라우드 모드가 켜져 있을 때는 클라우드 기반의 Gemini 모델을 사용하여 텍스트를 보정합니다.) 원할 경우 Google AI Edge Eloquent는 Gmail 계정에서 특정 키워드, 이름, 전문 용어를 불러올 수 있습니다. 또한 사용자가 직접 맞춤법 단어를 목록에 추가하는 것도 가능합니다. 앱은 전사 세션의 기록을 보여주며 모든 기록을 검색할 수도 있습니다. 또한 지난 세션에서 받아쓰기된 단어 수, 분당 단어 속도(WPM), 총 발화 단어 수 등의 통계를 확인할 수 있습니다. 구글의 앱스토어 설명에는 "Google AI Edge Eloquent는 자연스러운 말과 전문적이고 바로 사용할 수 있는 텍스트 간의 간극을 메우기 위해 엔지니어링된 고급 받아쓰기 앱입니다. 말을 더듬거나 추임새를 있는 그대로 전사하는 일반적인 받아쓰기 소프트웨어와 달리, Eloquent는 AI를 활용하여 사용자가 의도한 의미를 정확히 파악합니다. '음', '어'와 같은 불필요한 추임새나 문장 중간의 자기 교정을 자동으로 편집하여 깔끔하고 정확한 글을 작성해 줍니다."라고 적혀 있습니다. 이 앱은 현재 iOS에서만 사용 가능하지만, 앱스토어 설명에는 안드로이드 버전에 대한 내용도 포함되어 있습니다. (구글 측에 추가 정보를 요청했으며, 답변을 받는 대로 기사를 업데이트할 예정입니다.) 설명에 따르면 Eloquent는 '완벽한 안드로이드 통합'을 제공하여, 시스템 내 모든 텍스트 입력란에서 사용자의 기본 키보드로 설정할 수 있습니다. 또한 안드로이드에서 Wispr Flow가 사용하는 것과 유사한 플로팅 버튼 기능을 활용하여 어디서든 쉽게 음성을 텍스트로 변환할 수 있습니다. 음성-텍스트 변환 모델이 발전함에 따라 AI 기반 전사 앱은 사용자들 사이에서 인기를 얻고 있습니다. 이 실험적인 앱을 통해 구글 역시 이러한 트렌드에 합류하게 되었습니다. 만약 이 테스트가 성공적이라면, 향후 안드로이드 전반에서도 개선된 전사 기능을 기대해 볼 수 있을 것입니다.

원문 보기
원문 보기 (영어)
Google on Monday quietly released an offline-first dictation app called "Google AI Edge Eloquent" on iOS to take on the likes of Wispr Flow , SuperWhisper , Willow , and others. The app is free to download, and once its Gemma-based automatic speech recognition (ASR) models are downloaded, you can start dictating on your phone. In the app, you can see the live transcription, and when you hit pause, the app automatically filters out filler words like "um" and "ah" and polishes the text. Below the transcript are options like "Key points", "Formal", "Short", and "Long" to transform the text. You can also turn off the cloud mode to use local-only processing. (When cloud mode is on, the app uses cloud-based Gemini models for text cleanup.) The Google AI Edge Eloquent can import certain keywords, names, and jargon from your Gmail account, if desired. Plus, you can add your own custom words to the list. The app displays the history of the transcription session and lets you search through all of them as well. It can show you words dictated in the last session, your word per minute speed, and the total number of words spoken. "Google AI Edge Eloquent is an advanced dictation app engineered to bridge the gap between natural speech and professional, ready-to-use text. Unlike standard dictation software that transcribes stumbles and filler words verbatim, Eloquent utilizes AI to capture your intended meaning. It automatically edits out ‘ums,' ‘uhs,' and mid-sentence self-corrections, outputting clean, accurate prose," the company's App Store description reads. While the app is currently only available on iOS, the App Store description references an Android version. (We have reached out to Google for more information, and will update the story if we hear back.) According to the description, Eloquent offers "seamless Android integration," where it can be set as users' default keyboard for system-wide access across any text field. Plus, the app will be able to use the floating button feature, similar to the one Wispr Flow uses on Android , for easy access to transcription from anywhere. AI-powered transcription apps are gaining popularity among users as speech-to-text models get better. With this experimental app, Google is joining the trend . If this test is successful, we could see improved transcription features across Android, too. Topics AI , Apps , Dictation , Google , TC , voice AI , Wispr flow Ivan Mehta Ivan covers global consumer tech developments at TechCrunch. He is based out of India and has previously worked at publications including Huffington Post and The Next Web. You can contact or verify outreach from Ivan by emailing im@ivanmehta.com or via encrypted message at ivan.42 on Signal. View Bio April 30 San Francisco, CA StrictlyVC kicks off the year in SF. Get in the room for unfiltered fireside chats with industry leaders, insider VC insights, and high-value connections that actually move the needle. Tickets are limited. REGISTER NOW Most Popular In Japan, the robot isn't coming for your job; it's filling the one nobody wants Kate Park Embattled startup Delve has ‘parted ways’ with Y Combinator Anthony Ha Anthropic says Claude Code subscribers will need to pay extra for OpenClaw usage Anthony Ha Anthropic took down thousands of GitHub repos trying to yank its leaked source code — a move the company says was an accident Tim Fernholz The reputation of troubled YC startup Delve has gotten even worse Julie Bort Anthropic is having a month Connie Loizos Google is now letting users in the US change their Gmail address Ivan Mehta