У понеділок Google тихо випустив застосунок для диктування з пріоритетом офлайн-режиму під назвою “Google AI Edge Eloquent” на iOS, щоб конкурувати з такими продуктами, як Wispr Flow, SuperWhisper, Willow та іншими.
Застосунок безкоштовний для завантаження, і після того, як його моделі автоматичного розпізнавання мовлення (ASR) на основі Gemma завантажаться, ви можете почати диктувати на своєму телефоні. У застосунку ви можете бачити живу транскрипцію, а коли натискаєте паузу, застосунок автоматично відфільтровує слова-паразити, такі як “ем” і “ах”, і полірує текст.
Під транскрипцією є опції, такі як “Ключові моменти”, “Формальний”, “Короткий” та “Довгий”, щоб трансформувати текст.
Ви також можете вимкнути хмарний режим, щоб використовувати лише локальну обробку. (Коли хмарний режим увімкнено, застосунок використовує хмарні моделі Gemini для очищення тексту.) Google AI Edge Eloquent може імпортувати певні ключові слова, імена та жаргон з вашого облікового запису Gmail, якщо бажаєте. Крім того, ви можете додавати власні слова до списку.
Застосунок відображає історію сеансів транскрипції та дозволяє шукати по всіх них. Він може показувати слова, продиктовані під час останнього сеансу, вашу швидкість слів за хвилину та загальну кількість вимовлених слів.
“Google AI Edge Eloquent — це передовий застосунок для диктування, розроблений для подолання розриву між природним мовленням і професійним, готовим до використання текстом. На відміну від стандартного програмного забезпечення для диктування, яке дослівно транскрибує запинки та слова-паразити, Eloquent використовує AI, щоб вловити ваш передбачуваний сенс. Він автоматично редагує ‘ем’, ‘ах’ та самостійні виправлення в середині речення, видаючи чисту, точну прозу”, — йдеться в описі застосунку компанії в App Store.
Хоча застосунок зараз доступний лише на iOS, в описі App Store згадується версія для Android. (Ми звернулися до Google за додатковою інформацією та оновимо історію, якщо отримаємо відповідь.)
Згідно з описом, Eloquent пропонує “безшовну інтеграцію з Android”, де його можна встановити як клавіатуру за замовчуванням для доступу до будь-якого текстового поля в усій системі. Крім того, застосунок зможе використовувати функцію плаваючої кнопки, подібно до тієї, яку Wispr Flow використовує на Android, для легкого доступу до транскрипції з будь-якого місця.
AI-застосунки для транскрипції набирають популярності серед користувачів, оскільки моделі перетворення мовлення на текст стають кращими. З цим експериментальним застосунком Google приєднується до тренду. Якщо це випробування буде успішним, ми зможемо побачити покращені функції транскрипції і на Android.

Залишити відповідь