DeepInfra sale del modo sigiloso con una financiación de $8 millones para hacer la inferencia de IA más asequible.

Home Noticias de IA DeepInfra sale del modo sigiloso con una financiación de $8 millones para hacer la inferencia de IA más asequible.

Updated on noviembre 9 2023

Desbloqueando la IA Generativa: Una Guía para Líderes Empresariales

Como líder de empresa o tomador de decisiones en TI, es probable que haya recibido numerosas discusiones sobre la IA generativa. Si está listo para implementar un chatbot de modelo de lenguaje grande (LLM) para sus empleados o clientes, surge una pregunta crucial: ¿cómo lanzarlo y qué costos debería anticipar?

Presentando a DeepInfra

DeepInfra, fundada por exingenieros de IMO Messenger, busca simplificar este proceso para los líderes empresariales. La empresa ofrece implementar modelos en servidores privados a una tarifa competitiva de solo $1 por millón de tokens, significativamente más bajo que los $10 de GPT-4 Turbo de OpenAI y los $11.02 de Claude 2 de Anthropic.

Recientemente lanzada, DeepInfra anunció una ronda de financiación inicial de $8 millones liderada por A.Capital y Felicis. Su enfoque está en proporcionar un conjunto de inferencias de modelos de código abierto, incluyendo Llama 2 y CodeLlama de Meta, así como versiones personalizadas de estos modelos.

La Propuesta de Valor de DeepInfra

Si bien se ha prestado mucha atención a los recursos de GPU necesarios para entrenar LLMs, la importancia de contar con suficiente potencia informática para un rendimiento confiable—llamado inferencia—es fundamental. Según el CEO Nikola Borisov, el verdadero desafío radica en atender eficientemente a múltiples usuarios concurrentes en el mismo hardware.

"La clave es gestionar múltiples usuarios accediendo al servidor simultáneamente. Cada token producido por estos modelos requiere un considerable procesamiento y ancho de banda de memoria," explica Borisov. Para asegurar un rendimiento óptimo, las empresas deben centrarse en maximizar la eficiencia y evitar que los servidores se sobrecarguen con tareas computacionales redundantes.

Los fundadores de DeepInfra aprovechan su amplia experiencia en la gestión de grandes flotas de servidores a nivel mundial para abordar estos desafíos de manera efectiva.

Avales de Inversores de Alto Nivel

Borisov y sus cofundadores han sido reconocidos por su experiencia en programación. Aydin Senkut, un emprendedor destacado y socio gerente de Felicis, elogió sus capacidades, afirmando: "Tienen una experiencia increíble, posiblemente solo superada por el equipo de WhatsApp en la construcción de infraestructuras eficientes que sirven a cientos de millones."

Esta eficiencia en infraestructura permite a DeepInfra ofrecer sus servicios a costos más bajos, lo que resulta atractivo en un entorno donde las empresas enfrentan costos crecientes por IA. Senkut destaca: “Si una empresa puede lograr una ventaja de costo de 10 veces en IA, puede revolucionar el mercado significativamente.”

Enfocándose en PYMES con IA de Código Abierto

El enfoque inicial de DeepInfra está en pequeñas y medianas empresas (PYMES) que buscan acceso asequible a modelos de lenguaje y aprendizaje automático de última generación y de código abierto. "Nuestros clientes objetivo desean acceso confiable a modelos de primer nivel sin arruinarse," afirma Borisov.

La empresa monitorea de cerca los avances en la comunidad de IA de código abierto, lista para adoptar modelos emergentes especializados en diversas tareas, desde generación de texto hasta visión por computadora y codificación.

Borisov expresa su creencia en el crecimiento y la versatilidad continuos de las soluciones de código abierto: "A medida que se publican modelos como Llama, muchos crearán sus variantes con demandas computacionales mínimas, alimentando un ecosistema colaborativo.”

Privacidad y Seguridad

El servicio de alojamiento de inferencias de DeepInfra atrae especialmente a las empresas que priorizan la privacidad de los datos. "No almacenamos ni utilizamos ningún aviso enviado; son descartados una vez que finaliza la sesión del usuario," asegura Borisov, enfatizando su compromiso con la privacidad.

Al aprovechar los servicios de DeepInfra, las empresas pueden navegar las complejidades de adoptar soluciones de IA generativa de manera eficiente y rentable, asegurando que permanezcan competitivas en un entorno en rápida evolución.

Snap integra ChatGPT en la realidad aumentada en Lens Fest, destacando innovaciones en inteligencia artificial.

Gong Forecast mejora con inteligencia artificial, aumentando la precisión en un 20% en comparación con las previsiones de ingresos tradicionales de CRM.

Most people like

OpenArt

5.1M

OpenArt es un innovador generador de imágenes con IA diseñado para potenciar la creatividad y la productividad, ofreciendo una amplia variedad de modelos de IA y estilos artísticos. Con su interfaz fácil de usar, OpenArt permite a los usuarios transformar sus visiones creativas en impresionantes visuales sin esfuerzo.

Generador de imágenes por IA AI Art Generator

Replayed

21.8K

Mejora el crecimiento de tu canal de YouTube con estrategias de edición personalizadas, diseñadas para aumentar el compromiso y atraer a más espectadores.

Edición de YouTube AI YouTube Assistant

InstantAPI.ai

24.5K

Desbloquea el potencial de los datos estructurados con nuestro web scraper impulsado por inteligencia artificial, diseñado para transformar sin esfuerzo páginas web desestructuradas en información valiosa y organizada. ¡Mejora tu proceso de recopilación de datos y optimiza tu análisis web hoy mismo!

Raspado web AI Analytics Assistant

Lindo

Lindo es un creador de sitios web impulsado por inteligencia artificial, diseñado específicamente para negocios, que simplifica el proceso de creación de páginas web sin necesidad de conocimientos en programación.

creador de sitios web AI App Builder

Find AI tools in YBX