A Apple lançou hoje uma série de modelos de linguagem grandes e de código aberto (LLMs) projetados para operar diretamente nos dispositivos, eliminando a dependência de servidores na nuvem. Batizados de OpenELM (Modelos de Linguagem Eficientes Abertos), esses modelos estão agora disponíveis no Hugging Face Hub, criando uma plataforma comunitária para compartilhamento de código de IA.
O OpenELM inclui oito modelos, sendo quatro pré-treinados com a biblioteca CoreNet e quatro ajustados por meio de refinamentos guiados. A Apple implementou uma estratégia de escalonamento hierárquico que aloca eficientemente parâmetros em cada camada do modelo Transformer, melhorando a precisão e a eficiência. Por exemplo, com um orçamento de parâmetros de cerca de um bilhão, o OpenELM consegue uma melhoria de 2,36% na precisão em relação ao OLMo, ao mesmo tempo em que reduz pela metade a demanda por tokens de pré-treinamento.
Diferente de lançamentos anteriores que apenas forneciam pesos de modelos e código de inferência, esta novidade apresenta uma estrutura abrangente para treinar e avaliar modelos de linguagem em conjuntos de dados públicos, incluindo registros de treinamento, múltiplos checkpoints e configurações de pré-treinamento. A Apple pretende que essa iniciativa acelere os avanços na IA de linguagem natural e forneça “resultados mais confiáveis.”
O lançamento desses modelos abertos visa “capacitar e enriquecer a comunidade de pesquisa aberta,” permitindo que pesquisadores investiguem minuciosamente os riscos, o uso de dados e os preconceitos dos modelos. Desenvolvedores e empresas também são encorajados a utilizar ou modificar esses modelos conforme suas necessidades específicas.
Ao compartilhar essa informação abertamente, a Apple se compromete a atrair engenheiros, cientistas e especialistas de destaque para impulsionar pesquisas em áreas relevantes, apesar dos desafios de publicar sob as políticas de confidencialidade da empresa. Embora os recursos de IA ainda não tenham sido integrados aos dispositivos da Apple, espera-se que o iOS 18 introduza uma série de novas capacidades de IA, com indicações de que a Apple planeja migrar seus modelos de linguagem grandes para operação local, visando maior privacidade.