La semaine dernière, Anthropic a dévoilé les instructions système pour sa famille de modèles Claude, mais le lancement était incomplet. En réponse aux chercheurs soulignant cette omission, l’entreprise s’est engagée à partager les instructions système pour sa dernière fonctionnalité, Artifacts, dans les prochaines semaines.
Un porte-parole d'Anthropic a confirmé que davantage de détails concernant les instructions système, y compris celles d'Artifacts, seront disponibles prochainement. Artifacts a été introduit avec l'interface de chat Claude pour faciliter l'exécution de morceaux de code, mais ses instructions système n'avaient pas été incluses lors du lancement initial.
La publication des instructions système de Claude a reçu une attention positive des médias pour sa transparence, se distinguant dans un secteur où de nombreuses grandes entreprises d'IA restent secrètes sur les configurations de leurs modèles. Cependant, des chercheurs comme Mohammed Sahli ont noté que les affirmations d'Anthropic étaient incomplètes en raison de l'omission des instructions système d'Artifacts.
Anthropic a précisé qu'Artifacts n'était pas accessible à tous les utilisateurs de Claude jusqu'à la semaine dernière, coïncidant avec l'annonce des instructions système. Ce calendrier explique l'absence d'instructions relatives à Artifacts dans la version précédente.
Pourquoi les instructions système sont-elles importantes ?
Bien que les développeurs d'IA ne soient pas tenus de divulguer les instructions système pour les modèles de langage de grande taille (LLM), la quête pour révéler ces instructions opérationnelles est devenue une recherche populaire parmi les passionnés d’IA. Partager publiquement les instructions système accroît la transparence, décrivant comment les développeurs souhaitent que leurs modèles se comportent et clarifiant pourquoi certaines requêtes des utilisateurs peuvent être refusées.
Selon la documentation d'Anthropic, Claude 3.5 Sonnet, la variante la plus avancée du modèle, privilégie l'exactitude et la concision dans les réponses, évitant de qualifier les informations de sensibles ou d'utiliser des phrases de remplissage. Claude 3 Opus, un modèle plus large, dispose d'une base de connaissances mise à jour en août 2023, ce qui lui permet d'aborder des sujets controversés tout en évitant les stéréotypes et en garantissant des points de vue équilibrés. Le plus petit modèle, Claude 3 Haiku, met l'accent sur la rapidité et fonctionne sous des directives comportementales différentes de celles de Claude 3.5 Sonnet.
Bien que les détails des instructions système d'Artifacts restent non divulgués, un article de Sahli sur Medium suggère que cette fonctionnalité est conçue pour aborder des problèmes complexes de manière systématique, en mettant l'accent sur des réponses concises aux questions des utilisateurs.