Індустрія технологій відеоспостереження сьогодні перебуває в центрі уваги, але не з найкращих причин. Через суперечки навколо того, як Імміграційна та митна служба США використовує камерну мережу Flock для стеження за людьми, а також через критику на адресу виробника домашніх камер Ring за створення нових функцій, які дозволяють правоохоронним органам запитувати у власників житла відеозаписи їхніх районів, зараз триває широка дискусія про безпеку, конфіденційність і те, хто за ким має право спостерігати.
Але суперечки не знищують ринки, а постійне вдосконалення візуально-мовних моделей лише додає вітрил компаніям, які створюють нові способи допомогти підприємствам відстежувати те, що відбувається на їхніх об’єктах.
На думку Матана Гольднера, співзасновника та генерального директора стартапу з відеоспостереження Conntour, етика в цій сфері настільки важлива, що, за його словами, його компанія дуже вибірково ставиться до того, яким клієнтам продавати свої послуги. Це може не здаватися розумним бізнес-рішенням для стартапу, якому ледве виповнилося два роки, але Гольднер каже, що може дозволити собі це, оскільки Conntour вже має кілька великих державних та публічних клієнтів, одним з яких є Центральне бюро з боротьби з наркотиками Сінгапуру.
«Той факт, що у нас є такі великі клієнти, дозволяє нам відбирати їх і залишатися під контролем […] Ми справді контролюємо, хто використовує систему, який випадок використання, і можемо обирати те, що вважаємо моральним і, звісно, законним. Ми використовуємо все наше судження та приймаємо рішення на основі конкретних клієнтів, з якими ми згодні [працювати], тому що знаємо, як вони будуть використовувати систему», — сказав Гольднер TechCrunch в ексклюзивному інтерв’ю.
Це зростання допомогло Conntour не лише бути вибірковим. Інвестори звернули на це увагу: стартап нещодавно залучив $7 мільйонів у рамках посівного раунду від General Catalyst, Y Combinator, SV Angel та Liquid 2 Ventures.
Гольднер сказав, що раунд закрили протягом 72 годин. «Я думаю, що я запланував близько 90 зустрічей за вісім днів, і лише через три дні — ми почали в понеділок, а до середи після обіду ми закінчили», — сказав він.
У будь-якому разі, Conntour, можливо, має рацію, будучи вибірковим, особливо враховуючи, наскільки потужними стали інструменти ШІ в цій сфері. Власна відеоплатформа компанії використовує моделі ШІ, щоб дозволити персоналу служби безпеки робити запити до камер природною мовою, знаходячи будь-який об’єкт, людину або ситуацію на відео в реальному часі — це пошукова система, подібна до Google, але створена спеціально для відеопотоків спостереження. Вона також може самостійно відстежувати та виявляти загрози на основі заданих правил і автоматично надсилати сповіщення.
На відміну від застарілих систем, які покладаються на попередньо задані визначення або параметри для виявлення конкретних об’єктів, моделей руху чи поведінки, Conntour стверджує, що його система використовує природні та візуальні мовні моделі, що надає їй високого ступеня гнучкості та зручності використання. Користувач може запитати: «Знайти випадки, коли хтось у кросівках передає сумку у вестибюлі», і система Conntour швидко знайде всі записані відео або прямі трансляції, щоб повернути відповідні результати.
Оскільки платформа містить вбудовані моделі ШІ, користувачі можуть просто ставити запитання про відео та отримувати відповіді текстом, супроводжувані відповідними відеопотоками, а також генерувати звіти про інциденти.
Однак ключовою перевагою компанії є її масштабованість. Гольднер пояснив, що платформа головним чином відрізняється від інших сервісів пошуку відео на основі ШІ тим, що вона розроблена для ефективного масштабування до систем, що складаються з тисяч камер. Він зазначив, що система Conntour може контролювати до 50 камер на одній споживчій GPU, такій як Nvidia RTX 4090.
Компанія робить це, використовуючи кілька моделей і логічних систем, а потім визначаючи, які моделі та системи алгоритм має використовувати для кожного запиту, щоб вимагати найменшої кількості обчислювальної потужності для надання користувачам найкращих результатів.
Conntour стверджує, що його систему можна розгорнути повністю на місці, повністю в хмарі або в змішаному вигляді. Вона може підключатися до більшості вже використовуваних систем безпеки або слугувати повноцінною платформою спостереження самостійно.
Але в індустрії відеоспостереження існує давня проблема: якість спостереження залежить від якості записаного відео. Наприклад, важко розпізнати деталі на відео з погано освітленої парковки, знятому камерою низької роздільної здатності з брудним об’єктивом.
Гольднер каже, що Conntour компенсує цю неминучість, надаючи разом із результатами пошуку оцінку впевненості. Якщо джерело відеопотоку має недостатньо хорошу якість, система поверне результати з низьким рівнем впевненості.
Заглядаючи вперед, Гольднер каже, що найбільшою технічною проблемою, яку потрібно вирішити, є забезпечення повної функціональності великих мовних моделей у своїй системі при збереженні її ефективності.
«У нас є дві речі, які ми хочемо робити одночасно, і вони суперечать одна одній. З одного боку, ми хочемо забезпечити повну гнучкість природної мови в стилі LLM, щоб ви могли запитати що завгодно. А з іншого боку, це ефективність, тому ми хочемо використовувати дуже мало ресурсів, тому що, знову ж таки, обробка [тисяч] потоків — це просто божевілля. Це протиріччя є найбільшою технічною перешкодою та технічною проблемою в нашій сфері, і над її вирішенням ми працюємо дуже, дуже наполегливо».

Залишити відповідь