Les tenseurs sont des conteneurs de données dans le processus d’apprentissage automatique de l’IA qui contiennent et organisent les informations de manière structurée, permettant ainsi aux LLM de comprendre et de générer plus facilement un texte de type humain.
Les LLM sont des algorithmes d’IA d’apprentissage profond qui peuvent reconnaître, résumer, traduire, prédire et générer du contenu à l’aide de très grands ensembles de données.

« Au cours d’expériences de formation approfondies, nous avons renommé plusieurs fois le code pour répondre aux exigences expérimentales », a déclaré Lin de 01.AI dans son message mardi. « Mais nous avons en quelque sorte laissé tomber la balle et ne les avons pas inversés avant de publier notre version… Nous sommes désolés pour la confusion. »
La société a déclaré mercredi dans une réponse au Post via WeChat qu’elle avait changé le nom du tenseur de son Yi-34B LLM pour « tester pleinement le modèle (Llama) » et qu’elle n’avait aucune intention de masquer la source du modèle d’IA.
Hartford, membre de la communauté Hugging Face, qui avait soulevé il y a plus d’une semaine des questions sur le nom du tenseur du Yi-34B LLM de 01.AI, sorti le 6 novembre, a déclaré mercredi avoir rejeté toute bizarrerie liée à l’utilisation du modèle d’IA d’une autre société pour aider au développement. son propre LLM basé sur le point de vue de la communauté open source.
La start-up chinoise 01.AI atteint une valeur d’un milliard de dollars avec son modèle open source le mieux classé
La start-up chinoise 01.AI atteint une valeur d’un milliard de dollars avec son modèle open source le mieux classé
« Dans notre communauté open source, nous partageons souvent le code de chacun », a déclaré Hartford, chercheur principal à la société de technologie d’IA conversationnelle Convai. «Nous prenons des idées de différentes architectures et partageons des idées de différentes architectures. C’est normal pour nous.
Hartford a déclaré que différents modèles d’IA « peuvent avoir la même architecture, mais les données avec lesquelles ils ont été formés sont complètement différentes ».
En raison de l’investissement et des outils autour de l’architecture Llama, il est utile d’utiliser les mêmes noms pour les tenseurs, a suggéré Hartford dans son précédent article sur la plateforme Hugging Face.
Il est nécessaire de « mieux honorer » les conventions de la communauté open source, selon un entrepreneur en IA basé à Hangzhou qui a requis l’anonymat en raison de la sensibilité du sujet. Cette pratique revient à citer un document de recherche et à en donner l’attribution appropriée, a déclaré l’entrepreneur.