Гладия, компания, занимающаяся транскрипцией и аудиоинтеллектом на основе ИИ и расположенная в Париже, успешно привлекла 16 миллионов долларов инвестиций. Эти средства будут использованы для улучшения аудиоинфраструктуры, начиная с инновационного движка для реальной транскрипции и аналитики звука. Данная технология призвана предоставить платформам с голосовым управлением продвинутые возможности ИИ для создания превосходного пользовательского опыта в различных регионах.
В интервью генеральный директор Жан-Луи Кегенер рассказал о причинах создания Гладии, подчеркнув свои собственные трудности с существующими сервисами транскрипции, когда он говорил на английском с ярко выраженным французским акцентом. "Как вы можете услышать по моему красивому французскому акценту," объяснил Кегенер, "я был крайне разочарован неточностями, которые постоянно возникали в этих сервисах."
Кегенер продемонстрировал возможности Гладии по транскрипции в реальном времени, показав её впечатляющую точность даже с его сильным акцентом. Во время демонстрации система без проблем переключалась между языками, иллюстрируя свою многоязычную способность.
Раунд финансирования возглавила компания XAnge, с участием таких известных инвесторов, как Illuminate Financial, XTX Ventures, Athletico Ventures, Gaingels, Mana Ventures, Motier Ventures, Roosh Ventures и Soma Capital. Этот раунд увеличивает общий объем финансирования Гладии до 20,3 миллиона долларов, после предыдущих инвестиций от таких компаний, как New Wave, Sequoia Capital, Cocoa и GFC. Компания также была выбрана для участия в программе AWS Generative AI Accelerator.
Алексис дю Пелу, партнер XAnge, отметил: "Гладия воплощает те качества, которые мы поддерживаем: смелая, международная команда технологий на переднем крае ИИ-инноваций с подтвержденной бизнес-моделью, способной открывать новые возможности в различных отраслях." Он похвалил Кегенера и его команду за эффективное выполнение задач в быстро меняющемся мире ИИ.
Гладия выделяется тем, что придает приоритет разработке поистине многоязычного продукта, устраняя предвзятости, присущие большинству моделей распознавания речи, которые часто обучаются в основном на английских данных. Новый движок позволяет вести реальную транскрипцию более чем на 100 языках, эффективно поддерживает акценты и может адаптироваться к переключению языков на лету.
Особенность Гладии заключается в её способности извлекать полезную информацию из звонков, такую как анализ тональности, ключевую информацию и краткие резюме, которые генерируются менее чем за секунду.
Создание движка, работающего в реальном времени и с низкой задержкой, представляет собой сложную задачу, требующую глубокого понимания языков и навыков обработки данных. Тем не менее, продукт Гладии преодолевает эти трудности. Его движок преобразования речи в текст достигает ведущей в отрасли задержки менее 300 миллисекунд, обеспечивая высокую точность независимо от языка или технической среды.
"Многие компании инвестируют значительное время и ресурсы в интеграцию различных функций ИИ в свои существующие платформы," отметил директор по технологиям Гладии Джонатан Сото. "Наш единственный API совместим со всеми технологическими стеком, включая SIP, VoIP, FreeSwitch и Asterisk, что упрощает интеграцию реальной транскрипции в ИИ-платформы клиентов."
С момента запуска своего первого API для асинхронной транскрипции и аудиоинтеллекта в июне 2023 года, Гладия обрела значительную популярность в секторе бизнеса, особенно среди решений для записи встреч и ведения заметок. API привлек более 600 клиентов по всему миру, включая такие компании, как Attention, Circleback, Method Financial, Recall, Sana и VEED.IO, и насчитывает более 70 000 пользователей.
"Технология Гладии предоставляет бизнесам в отраслях, требующих передовой транскрипции в реальном времени, возможность перехода от ручной обработки после звонков к проактивным, низколатентным рабочим процессам," заявил Кегенер. "Наши решения поддерживают автоматизированное обогащение CRM и обеспечивают реальную помощь для агентов поддержки, улучшая операционную эффективность без необходимости обширной внутренней экспертизы в области ИИ."
С новым финансированием Гладия планирует ускорить свои усилия в области НИОКР, выпуская комплексный набор инструментов ИИ для аудио, наряду с дополнительными моделями, такими как большие языковые модели (LLM) и генерация с поддержкой извлечения (RAG). В данный момент компания проводит испытания решения для помощи агентам в секторе CCaaS и планирует расширить свою команду для подготовки к международному росту.
Кегенер подчеркнул уникальную способность Гладии к "переключению кода," позволяя пользователям инициировать транскрипцию на одном языке и без проблем переходить на другой во время звонка. Он отметил важность обработки в реальном времени и возможность интеграции пользовательских словарей, заявив: "Наша модель предлагает реальную информацию, которая отличает нас от конкурентов."
Что касается рыночных возможностей, Кегенер отметил фокус Гладии на записях встреч и сотрудничество с колл-центрами, что позволяет увеличить скорость завершения звонков на 30% за счет улучшенной точности. Гладия будет работать по простой ценовой модели, взимая, как правило, фиксированную плату на основе часового использования.
В целом, Гладия находится на стыке инноваций в области ИИ и реальной транскрипции, готовая трансформировать то, как бизнесы взаимодействуют с аудиоинтеллектом в различных условиях.