Google lanza PaliGemma: su primer modelo multimodal de visión y lenguaje abierto para mejorar las capacidades de inteligencia artificial.

Home Noticias de IA Google lanza PaliGemma: su primer modelo multimodal de visión y lenguaje abierto para mejorar las capacidades de inteligencia artificial.

Google ha presentado PaliGemma, un nuevo modelo multimodal de visión-lenguaje en su colección Gemma de modelos abiertos y ligeros. Diseñado para la generación de subtítulos de imágenes, respuestas a preguntas visuales y recuperación de imágenes, PaliGemma se suma a sus homólogos, CodeGemma y RecurrentGemma, y ya está disponible para que los desarrolladores lo integren en sus proyectos.

Anunciado en la conferencia de desarrolladores de Google, PaliGemma se distingue dentro de la familia Gemma como el único modelo dedicado a traducir información visual en lenguaje escrito. Como modelo de lenguaje pequeño (SLM), opera de manera eficiente sin requerir extensiva memoria o potencia de procesamiento, lo que lo hace ideal para dispositivos con recursos limitados como teléfonos inteligentes, dispositivos IoT y computadoras personales.

Es probable que los desarrolladores se sientan atraídos por PaliGemma debido a su potencial para mejorar aplicaciones. Puede asistir a los usuarios en la generación de contenido, optimizar capacidades de búsqueda y ayudar a personas con discapacidad visual a comprender mejor su entorno. Mientras muchas soluciones de IA son basadas en la nube y dependen de modelos de lenguaje grandes (LLMs), los SLMs como PaliGemma ayudan a reducir la latencia, minimizando el tiempo entre entrada y respuesta. Esto lo convierte en una opción preferida para aplicaciones en áreas con conectividad a internet poco confiable.

Aunque las aplicaciones web y móviles son los principales casos de uso para PaliGemma, existe potencial para su integración en dispositivos portátiles, como gafas inteligentes que podrían competir con las Ray-Ban Meta Smart Glasses, o dispositivos como Rabbit r1 o Humane AI Pin. El modelo también podría mejorar los robots para el hogar y la oficina. Construido sobre la misma investigación y tecnología que Google Gemini, PaliGemma ofrece a los desarrolladores un marco familiar y robusto para sus proyectos.

Además de lanzar PaliGemma, Google ha introducido su versión más extensa de Gemma hasta la fecha, con unos impresionantes 27 mil millones de parámetros.

Google lanza la serie Gemma 2: Presentamos un modelo de 27 mil millones de parámetros que puede funcionar con solo un TPU.

Con OpenAI liberando GPT-4o, ¿quién necesita seguir pagando por ChatGPT Plus?

Most people like

BotPenguin Chatbot

141.1K

BotPenguin es un innovador chatbot de IA diseñado para optimizar el soporte al cliente y mejorar la interacción con los visitantes en las empresas. Al automatizar las interacciones, BotPenguin garantiza que tus clientes reciban asistencia rápida y eficiente, creando una experiencia fluida que aumenta la satisfacción y la retención.

Otro AI Chatbot

Voice-Swap

103.6K

Presentamos Voice-Swap: una herramienta innovadora de IA diseñada para una transformación de voz sin interrupciones. Perfecta para colaboraciones remotas y para ofrecer demostraciones realistas, Voice-Swap permite a los usuarios mejorar sus proyectos con una sorprendente versatilidad de audio.

intercambio de voces AI Celebrity Voice Generator

1PX.AI The world's most advanced AI Avatars generator

5.5K

En los últimos años, los generadores de retratos con inteligencia artificial han revolucionado la forma en que creamos y experimentamos imágenes artísticas. Al aprovechar algoritmos avanzados y técnicas de aprendizaje automático, estas herramientas innovadoras pueden producir retratos digitales impactantes en cuestión de segundos. Ya seas un artista en busca de inspiración o simplemente curioso sobre las capacidades de la IA, entender cómo funcionan estos generadores puede abrir nuevas avenidas para la creatividad y la expresión. Esta guía explorará el fascinante mundo de los generadores de retratos con IA, analizando su tecnología, aplicaciones y el futuro del arte digital.

Generador de retratos de IA AI Avatar Generator

SearchAI by Bocha

20.3K

Presentamos un Motor de Respuestas Sin Publicidad: Tu Fuente de Información Clara y Objetiva En un mundo abrumado por anuncios y distracciones de marketing, encontrar respuestas directas puede ser un desafío. Nuestro Motor de Respuestas Sin Publicidad ofrece una plataforma libre de desorden, brindando información precisa y confiable sin interrupciones ni contenido promocional. Sumérgete en una experiencia donde tu búsqueda de conocimiento es prioritaria, asegurando que obtengas los conocimientos que necesitas, cuando los necesitas. ¡Descubre claridad sin el ruido!

Búsqueda de IA Large Language Models (LLMs)

Find AI tools in YBX