,

Нотатки з зустрічей від Talat на основі ШІ залишаються на вашому пристрої, а не в хмарі

Фото для новини: Нотатки з зустрічей від Talat на основі ШІ залишаються на вашому пристрої, а не в хмарі

Застосунок для нотаток на основі ШІ Granola, оцінений у 1,5 мільярда доларів, став популярним інструментом серед засновників технологічних компаній та венчурних інвесторів. Але один розробник вважає, що існує попит на більш приватну, локальну альтернативу, яка доступна за одноразову плату і без підписки. Це призвело до створення нового застосунку для Mac під назвою Talat.

Розробник Нік Пейн з Йоркшира (Англія), який називає себе комп’ютерним гіком, каже, що ідея створити локальний застосунок для нотаток на основі ШІ виникла здебільшого завдяки серії щасливих випадковостей.

«Я вважаю Granola чудовим застосунком; це блискучий приклад того, чого можна досягти з Electron [фреймворк для створення десктопних застосунків], доклавши достатньо любові та турботи», — розповів він TechCrunch. «Коли я вперше спробував його, мене захопило те, як йому вдавалося записувати системний звук на моєму Mac без запису відео, що на той час було стандартним рішенням. Це призвело до величезної кількості досліджень і відкриття відносно нового та погано задокументованого Apple API».

Щоб спростити роботу з цим API (Core Audio Taps, який дозволяє розробникам отримувати доступ до аудіопотоків Mac), Пейн вирішив створити бібліотеку аудіо з відкритим кодом AudioTee.

«Того часу я поступово збирав інструментарій, але так і не знайшов нічого, що могло б самостійно стати продуктом, а не просто крутою технологічною демонстрацією», — зазначив Пейн. «Сучасні хмарні моделі транскрипції — ті самі провайдери, якими користуються такі застосунки, як Granola — неймовірні, і це надзвичайно круто бачити, як ваша мова майже в реальному часі з’являється на екрані. Але мене завжди непокоїло, що ціна за це — надання не просто моїх даних, а моїх аудіоданих; мого справжнього голосу», — додав він.

Потім він натрапив на програмний інструментарій під назвою FluidAudio, фреймворк Swift, який забезпечує повністю локальний ШІ з низькою затримкою на пристроях Apple. Він дозволяє запускати невеликі, швидкі моделі транскрипції безпосередньо на Neural Engine Mac — спеціалізованому апаратному забезпеченні Apple для обробки ШІ.

Саме це стало тим елементом, який дозволив Пейну зрозуміти, що він може перетворити свої дослідження на реальний продукт — такий, де ваш аудіозапис ніколи не покидає ваш Mac, а ваші транскрипти не зберігаються на серверах іншої компанії.

Talat, створений разом із давнім другом і колишнім колегою Пейна Майком Франкліном, став результатом інтересу Пейна до аудіосфери. Результат — це застосунок обсягом 20 МБ, який купується за одноразову плату, не вимагає створення облікового запису і навіть надсилання аналітичних даних розробникам. Щомісячних платежів також немає.

Хоча деякі ШІ-нотатки можуть мати більше додаткових функцій, Talat пропонує набір спрощених можливостей. Він захоплює звук із мікрофона вашого комп’ютера, коли ви перебуваєте в застосунках для зустрічей, таких як Zoom, Teams, Meet та інших, і транскрибує його в реальному часі. Застосунок намагається призначати спікерів у реальному часі, але ви можете змінювати їх за потреби. Ви також можете робити нотатки, а також редагувати, видаляти або розділяти сегменти транскрипту. Після закінчення зустрічі локальна велика мовна модель генерує підсумок із ключовими моментами, рішеннями та подальшими кроками.

Нотатки, транскрипти та підсумки також доступні для пошуку в Talat.

Окрім конфіденційності, Пейн каже, що метою є надати користувачам більше можливостей вибору.

«Ми робимо ставку на конфігурованість і дозволяємо користувачам контролювати, куди надходять їхні дані: обирати власну LLM, автоматичний експорт у [застосунок для нотаток] Obsidian, веб-хуки, які надсилають дані після завершення зустрічі, MCP сервер» — стандартизований спосіб підключення ШІ-інструментів до зовнішніх джерел даних — «для отримання даних на вимогу», — пояснив він.

Під капотом ШІ є комбінацією — «в основному зібраний докупи та абстрагований за допомогою FluidAudio», зазначив Пейн, який, за його словами, виконує велику частину важкої роботи. Для частини підсумовування застосунок за замовчуванням використовує модель ШІ під назвою Qwen3-4B-4bit, яка може працювати навіть на досить скромному обладнанні.

Однак користувачі можуть за бажанням замінити її на будь-якого хмарного LLM-провайдера на свій вибір, або вибрати один із двох варіантів Parakeet — моделей розпізнавання мови, розроблених Nvidia — або спрямувати її на Ollama (інструмент для локального запуску ШІ-моделей), що дає їм більше контролю над досвідом використання. З часом Talat додасть підтримку для більшої кількості вбудованих варіантів і матиме інтеграцію з іншими застосунками, такими як Google Calendar і Notion.

На момент запуску користувачі з комп’ютерами Mac на процесорах M-series (з власними процесорами Apple, починаючи з M1) можуть завантажити застосунок і безкоштовно спробувати його з 10 годинами записів, перш ніж вирішити придбати.

Talat доступний за 49 доларів США у цій попередній версії, яка все ще активно розробляється. Коли застосунок досягне релізу 1.0, ціна зросте до 99 доларів США.

Пейн і Франклін розвивають Talat самостійно (bootstrapping) і планують зберегти основний продукт як одноразову покупку в майбутньому.

Оновлено після публікації з урахуванням нової оцінки Granola.

Comments

Залишити відповідь

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *