DeepL, відома текстовим перекладом, тепер хоче перекладати ваш голос

DeepL, компанія з перекладу, найбільш відома своїми текстовими інструментами, сьогодні випустила набір інструментів для голосового перекладу, який охоплює такі сценарії використання, як зустрічі, мобільні та веб-розмови, а також групові комунікації для працівників на передовій через спеціальні додатки. Компанія також випускає API, що дозволяє зовнішнім розробникам і компаніям створювати власні рішення на основі технологій DeepL для індивідуальних випадків, наприклад, для кол-центрів.

«Після багатьох років роботи над текстовим перекладом, голос був для нас природним кроком», — розповів TechCrunch генеральний директор DeepL Ярек Кутиловський. «Ми досягли значного прогресу в текстовому перекладі та перекладі документів. Але ми вважали, що не існує якісного продукту для синхронного голосового перекладу».

Кутиловський зазначив, що проблеми у створенні продукту для синхронного перекладу зосереджені на пошуку балансу між зменшенням затримки — часу між тим, коли людина говорить, і відтворенням перекладеного аудіо — та збереженням точності результатів.

DeepL випускає додатки для таких платформ, як Zoom і Microsoft Teams, де слухачі можуть або чути синхронний переклад, поки інші говорять рідними мовами, або стежити за синхронним перекладеним текстом на екрані. Ця програма зараз доступна в режимі раннього доступу, і компанія запрошує організації приєднатися до списку очікування. Компанія також має продукт для мобільних та веб-розмов, які можуть відбуватися особисто або віддалено.

DeepL також дозволяє користувачам брати участь у груповій розмові в таких умовах, як тренінги або семінари, приєднуючись через QR-код.

DeepL повідомила, що її технологія голосового перекладу також може вивчати та адаптуватися до спеціальної лексики, як-от галузеві терміни, назви компаній та особисті імена.

Кутиловський зазначив, що ШІ змінює уявлення про те, як виглядатиме обслуговування клієнтів у найближчі роки. Він підкреслив, що шар перекладу допомагає компаніям надавати підтримку мовами, де кваліфікованих спеціалістів мало і їхній найм коштує дорого.

Компанія заявляє, що контролює весь стек технології голосового перекладу. Однак поточна система перетворює мовлення на текст, застосовує переклад, а потім конвертує його назад у мовлення. DeepL вважає, що через багаторічну роботу над текстовим перекладом вона має перевагу в якості перекладу. У майбутньому компанія планує розробити наскрізну модель голосового перекладу, яка повністю пропускає текстовий етап.

DeepL стикається з конкуренцією з боку кількох добре фінансованих стартапів, які працюють у суміжних сферах. Sanas, який минулого року залучив 65 мільйонів доларів від Quadrille Capital і Teleperformance, використовує ШІ для зміни акценту мовця в реальному часі — інструмент, призначений насамперед для агентів кол-центрів.

Дубайський Camb.AI зосереджується на синтезі мовлення та перекладі для медійних і розважальних компаній, допомагаючи їм дублювати та локалізувати відеоконтент у великих масштабах.

Palabra, який підтримує фірма співзасновника Reddit Алексіса Оганяна Seven Seven Six, створює механізм синхронного мовленнєвого перекладу, призначений для збереження як сенсу, так і оригінального голосу мовця, що робить його більш прямим конкурентом того, що зараз будує DeepL.

Instax Wide 400 розвиває простоту миттєвої фотографії та розтягує її — буквально

Звільнені працівники Oracle намагалися домовитися про кращу вихідну допомогу. Oracle відмовив.

Ринок нерухомості Сан-Франциско збожеволів

Prime Video слідом за Netflix і Disney додає в застосунок TikTok-подібну стрічку «Clips»

Instax Wide 400 розвиває простоту миттєвої фотографії та розтягує її — буквально

Звільнені працівники Oracle намагалися домовитися про кращу вихідну допомогу. Oracle відмовив.

DeepL, відома текстовим перекладом, тепер хоче перекладати ваш голос

Comments

Залишити відповідь Скасувати коментар

Instax Wide 400 розвиває простоту миттєвої фотографії та розтягує її — буквально

Звільнені працівники Oracle намагалися домовитися про кращу вихідну допомогу. Oracle відмовив.

Ринок нерухомості Сан-Франциско збожеволів

Prime Video слідом за Netflix і Disney додає в застосунок TikTok-подібну стрічку «Clips»

Instax Wide 400 розвиває простоту миттєвої фотографії та розтягує її — буквально

Звільнені працівники Oracle намагалися домовитися про кращу вихідну допомогу. Oracle відмовив.