[Обновлено: 14 декабря, 9:10]
Чет Капур, генеральный директор DataStax — компании, предоставляющей облачные базы данных на базе Apache Cassandra с открытым исходным кодом, заявил на конференции AI.Dev в Силиконовой долине, что Cassandra является «лучшей базой данных для генеративного ИИ».
Появление ИИ-агентов
Капур сделал свое заявление перед аудиторией из 700 человек на мероприятии Фонда Линукс, подчеркивая конкурентную гонку между стартапами и сформировавшимися компаниями за лидерство в быстро развивающейся области генеративного ИИ. При исследовании технологических решений для бизнеса выбор поставщика базы данных становится критически важным. В то время как такие крупные поставщики языковых моделей (LLM), как OpenAI, Anthropic, Google (Gemini) и Meta (Llama) создают много шума, борьба за превосходство в базе данных среди компаний, поддерживающих приложения LLM, также вызывает значительный интерес.
В своем докладе Капур выделил несколько причин, почему база данных Cassandra от DataStax выделяется среди других. Прежде всего, она является одной из самых надежных эксплуатационных баз данных, предпочитаемых предприятиями. Многие организации успешно используют Cassandra для масштабного развертывания генеративного ИИ, и её технологические преимущества помогают ей опередить таких конкурентов, как MongoDB и Pinecone.
DataStax также рассматривает возможность выхода на IPO, и Капур стремится привлечь внимание к этому. В июне прошлого года компания собрала 115 миллионов долларов при оценке в 1,6 миллиарда долларов. Хотя DataStax не раскрыла финансовые детали, Капур отметил, что она на радаре банков, желающих произвести IPO компаний в 2024-2025 годах.
Ключевые моменты Капура:
1. Популярность и надежность Cassandra
Cassandra является ведущей эксплуатационной базой данных, особенно в условиях, когда такие компании, как Microsoft и Amazon, продвигают свои облачные сервисы с интегрированными базами данных для генеративного ИИ. Эти технологические гиганты побуждают пользователей переходить на свои платформы, устраняя преграды, включая сложные процессы миграции данных.
Капур с юмором раскритиковал эти облачные решения за избыточную сложность: «У вас есть одна для утреннего туалета, другая для дневного, и третья для вечернего». Он объяснил, что генеративный ИИ побудил CIO предприятий искать интегрированные базы данных для бесперебойного выполнения запросов, в чем Cassandra преуспевает. В отличие от баз данных Microsoft и Amazon, которые обычно сосредоточены на аналитических нагрузках, это может определять высокие затраты и неэффективность в операционных задачах, связанных с генеративным ИИ.
DataStax уделяет внимание эффективности затрат и производительности, что привлекает клиентов из списка Fortune 500. К значимым пользователям Cassandra относятся Netflix для метаданных фильмов, FedEx для отслеживания посылок, Apple для данных iCloud и iMessage, а также Home Depot для работы сайта. Так как организации разрабатывают новые AI-приложения, их успешный опыт с Cassandra стимулирует дальнейшую консолидацию вокруг этой технологии.
2. Активные развертывания генеративного ИИ
Капур выделил девять компаний, использующих облачную базу данных Astra DB от DataStax для генеративного ИИ. Хотя многие предприятия экспериментируют с генеративным ИИ, лишь немногие перешли к крупномасштабному производству, в основном из-за опасений по поводу безопасности и надежности. В условиях нарастающего напряжения в отрасли ожидается сдвиг в расходах в сторону реальных развертываний в следующем году.
Некоторые примечательные клиенты, внедряющие LLM:
- Physics Wallah: Индийская образовательная платформа, охватывающая 6 миллионов пользователей с многофункциональным ботом на основе LLM, разработанным всего за 55 дней.
- Skypoint: Медицинское обслуживание для пожилых людей с использованием LLM для персонализированного планирования лечения, освобождая более 10 часов в неделю для врачей.
К другим клиентам относятся Hey You, Reel Star, Arre, Hornet, Restworld, Sourcetable и Concide. Капур отметил, что малые и средние предприятия могут быстро адаптироваться, в то время как крупные компании сталкиваются с большими регуляторными барьерами.
3. Превосходство технологии
Капур подчеркнул достижения DataStax в области векторного поиска в Astra, что является критически важным компонентом для баз данных генеративного ИИ. Технология JVector от Astra предлагает на 16% более высокую релевантность по сравнению с ведущим конкурентом Pinecone. Это особенно важно для обеспечения точности результатов. Ожидается, что предстоящий отчет по бенчмаркингу предоставит дополнительные данные, но предварительные результаты показывают, что Astra демонстрирует лучшее качество обработки транзакций по сравнению как с Pinecone, так и с MongoDB.
Astra DB предлагает уникальный доступ к векторизованным данным с нулевой задержкой, начиная с индексации и заканчивая запросами.
Смотрим в будущее: быстрое внедрение генеративного ИИ
Капур предсказал, что внедрение генеративного ИИ произойдет быстрее, чем предыдущие технологические революции, используя существующие рамочные технологии, такие как веб, мобильные и облачные платформы. Он ожидает, что в следующем году появятся трансформационные варианты использования, генерирующие доход, включая продвинутые функции LLM, которые позволят ИИ-агентам выполнять сложные задачи. Реальные доходы от интеграций генеративного ИИ могут проявиться уже во втором квартале 2024 года, особенно в таких секторах, как розничная торговля и путешествия.
Хотя Капур и Ануф подчеркнули сильные стороны Cassandra, они признали, что генеративный ИИ повысит всю сферу баз данных. Требования AI-приложений потребуют дополнительных ресурсов хранения и вычислений, привлекая внимание облачных и базовых провайдеров данных. «Если AI-приложения станут важными, они будут основным двигателем роста как для частных, так и для публичных баз данных в легко следующие пять лет», — заявил Ануф.