A NVIDIA lança microserviços de IA generativa de nível empresarial para acelerar a implantação e inovação de aplicações de IA.

No mundo da inteligência artificial, as empresas enfrentam oportunidades e desafios sem precedentes. Para atender à crescente demanda por aplicações de IA rápidas, eficientes e personalizadas, a NVIDIA lançou diversos microserviços de IA generativa para empresas em 18 de março de 2024, em sua sede em San Jose, Califórnia. Esses microserviços são projetados para fornecer aos desenvolvedores uma plataforma robusta para criar e implementar assistentes de IA generativa personalizados, garantindo total controle sobre a propriedade intelectual das empresas.

Os novos microserviços de IA generativa são baseados na plataforma NVIDIA CUDA e incluem os microserviços NVIDIA NIM, que aprimoram o desempenho de inferência de mais de 20 modelos populares de IA dentro do ecossistema da NVIDIA. Os usuários também podem aproveitar os microserviços NVIDIA CUDA-X para utilizar kits de desenvolvimento de software, bibliotecas e ferramentas aceleradas para tarefas como geração aumentada com recuperação (RAG), segurança e computação de alto desempenho (HPC). Além disso, a NVIDIA lançou mais de 20 microserviços NIM e CUDA-X especializados para o setor médico, ampliando ainda mais as aplicações potenciais da IA na saúde.

Esses microserviços oferecem uma nova dimensão à plataforma de computação completa da NVIDIA, conectando de perto desenvolvedores de modelos, provedores de plataformas e empresas para criar um ecossistema de IA poderoso. As empresas podem implantar facilmente modelos de IA personalizados otimizados para instalação na base NVIDIA CUDA, que abrange bilhões de GPUs na nuvem, data centers, estações de trabalho e PCs.

O fundador e CEO da NVIDIA, Jensen Huang, destacou que as plataformas empresariais possuem vastos recursos de dados que podem ser transformados em assistentes de IA generativa, aumentando significativamente o valor comercial. Os microserviços de IA conteinerizados, desenvolvidos em colaboração com parceiros, servirão como base para as indústrias que fazem a transição para a IA.

A introdução dos microserviços de inferência NIM reduz drasticamente os tempos de implantação, condensando o que antes levava semanas em apenas minutos. Esses microserviços oferecem contêineres pré-construídos baseados no software de inferência da NVIDIA, incluindo o servidor de inferência Triton e TensorRT-LLM, permitindo que os desenvolvedores criem e implementem aplicações de IA rapidamente. Além disso, os microserviços NIM disponibilizam APIs padrão do setor em áreas como processamento de linguagem, reconhecimento de fala e descoberta de medicamentos, permitindo que os desenvolvedores utilizem dados proprietários para um desenvolvimento de IA mais seguro e eficiente.

Na prática, empresas como a ServiceNow já começaram a usar NIM para acelerar o desenvolvimento de assistentes específicos de domínio e aplicações de IA generativa. Os usuários podem acessar os microserviços NIM através de plataformas como Amazon SageMaker, Google Kubernetes Engine e Microsoft Azure AI, integrando-os com frameworks populares de IA, como Deepset e LangChain.

Além dos microserviços NIM, os microserviços CUDA-X oferecem suporte substancial ao desenvolvimento de aplicações de IA. Esses microserviços fornecem módulos de construção de ponta a ponta para preparação de dados, personalização e treinamento, ajudando as empresas a acelerar o desenvolvimento de IA em nível de produção. Com o NVIDIA Riva para desenvolvimento de IA personalizada de voz e tradução, e o NVIDIA cuOpt para otimização de rotas, as empresas podem melhorar o desempenho e a precisão de suas aplicações de IA. Além disso, o lançamento do microserviço NeMo Retriever permite que os desenvolvedores vinculem de perto as aplicações de IA com dados empresariais, melhorando a precisão e os insights dos assistentes de IA.

Em resumo, o lançamento dos microserviços de IA generativa para empresas da NVIDIA oferece às empresas um suporte tecnológico poderoso e impulso inovador. Esses microserviços não apenas simplificam os processos de desenvolvimento e implantação de aplicações de IA, mas também oferecem maior flexibilidade e desempenho para as empresas. À medida que a tecnologia de IA continua a evoluir, esses microserviços estão prontos para desempenhar um papel significativo na proliferação e inovação das aplicações de IA.

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles