LUCIE — l'IA véritablement open source construite sur la transparence, la confiance et l'efficacité.
LUCIE n'est pas simplement open source ; elle est particulièrement transparente et fiable. Depuis sa création, chaque décision a été guidée par des principes de confiance, d'équité et de responsabilité. Que ce soit pour l'éducation, le gouvernement ou la recherche, LUCIE est conçue pour être un modèle sur lequel vous pouvez compter.
Nos origines
Le voyage de LUCIE a commencé en juin 2023 lorsque LINAGORA a décidé de lancer la communauté OpenLLM France, réunissant des contributeurs (>900 membres en janvier 2025) autour de l'objectif de construire une IA générative ouverte alignée sur les valeurs européennes communes. En février 2024, cette communauté s'est transformée en OpenLLM Europe, visant à connecter et renforcer les initiatives européennes pour des modèles génératifs d'IA ouverts et éthiques. Pour aller plus loin dans cette vision, LINAGORA a dirigé le consortium OpenLLM France**, formé avec 11 partenaires de la communauté, pour répondre à l'appel à projets "Communs Numériques dans le domaine de l'IA Générative". Désormais lauréat France 2030, le consortium s'engage dans une mission de deux ans débutant fin 2024 pour créer des communs d'IA générative ouverts, avec un accent particulier sur l'éducation et le secteur EdTech. L'étape suivante est survenue fin 2023, lorsque LINAGORA a initié l'entraînement de LUCIE avec le soutien de la communauté et particulièrement du GENCI (Grand Équipement National de Calcul Intensif) pour l'accès au supercalculateur Jean Zay. Aujourd'hui, en janvier 2025, la sortie de LUCIE marque une étape importante dans la livraison d'un modèle d'IA véritablement open source, éthique et efficace pour l'Europe et au-delà.
Qu'est-ce qui fait que LUCIE est véritablement open source ?
Données transparentes
Tous les jeux de données d'entraînement sont ouverts et sous licence pour une utilisation publique. De la collecte à la curation, nous assurons la transparence à chaque étape.
Algorithmes ouverts
Nos méthodologies d'entraînement, nos processus d'ajustement fin et notre « sauce secrète » sont entièrement documentés et librement accessibles pour que chacun puisse les explorer, les utiliser et les améliorer.
Modèles librement accessibles
Les poids, points de contrôle et code source de LUCIE sont accessibles sous licence Apache 2.0. Cette licence permissive et sans restriction permet à quiconque, partout dans le monde, d'utiliser, d'adapter et de déployer le modèle à n'importe quelle fin, garantissant une véritable accessibilité et innovation mondiale.
Conçu pour la souveraineté et la durabilité
LUCIE a été créée pour répondre aux défis uniques de la création d'une IA éthique, efficiente et accessible
Souveraineté européenne
LUCIE incarne un engagement envers les valeurs européennes, respectant la diversité culturelle, promouvant le développement éthique de l'IA et la conformité avec l'AI Act.
Compact et efficace
Optimisé pour les environnements à faibles ressources, l'architecture de LUCIE permet le déploiement sur des infrastructures "pauvres en GPU" et même sur des appareils mobiles.
Éco-responsabilité
En privilégiant la qualité à la quantité dans les données d'entraînement, nous garantissons une empreinte environnementale plus légère sans compromettre les performances.
Testez LUCIE par vous-même
Vous pouvez tester les capacités de LUCIE directement via notre plateforme SaaS dédiée, disponible dès maintenant sur LUCIE.chat. Que vous exploriez les performances du modèle ou que vous l'intégriez dans vos flux de travail, la plateforme offre un accès transparent aux fonctionnalités de LUCIE.
Essayez maintenantLUCIE en chiffres
7 milliards de paramètres
Taille du modèle : 7 milliards de paramètres – compact et optimisé pour des performances élevées dans diverses applications. En 2025, nous construirons une version plus compacte de LUCIE (<3B)
3,1 billions de tokens
Jeu de données d'entraînement : 3,1 billions de tokens, soigneusement sélectionnés pour équilibrer qualité et diversité, incluant le français, l'anglais, l'allemand, l'espagnol, l'italien et le code.
600K heures GPU
Heures d'entraînement : Plus de 600 000 heures GPU sur le supercalculateur Jean Zay, utilisant 512 GPU NVIDIA H100 en parallèle.
Langues prises en charge
Approche multilingue, avec un accent particulier sur le français et les principales langues européennes, assurant une représentation culturelle et linguistique.
2023-2025
Chronologie de développement : Entraînement initié fin 2023, aboutissant à la sortie du modèle en janvier 2025.
L'avenir de LUCIE en 2025
Le voyage de LUCIE ne s'arrête pas là. Notre feuille de route pour 2025 définit des objectifs ambitieux pour améliorer les capacités et élargir les applications du modèle :
Amélioration du fine-tuning et meilleure boîte à outils pour les créateurs d'IA
Nous allons affiner les capacités de LUCIE à suivre les instructions (fine-instruct), introduire l'appel de fonctions pour une meilleure intégration avec les systèmes externes, et publier au moins un modèle de moins de 3 milliards de paramètres pour garantir l'accessibilité dans les environnements aux ressources limitées.
Génération Augmentée par Récupération (RAG) Avancée
LUCIE bénéficiera d'une fonction RAG avancée, lui permettant d'exploiter des bases de connaissances externes pour des réponses plus précises et contextuellement adaptées.
Extension multimodale avec support vocal
Nous étendrons les capacités de LUCIE à l'IA multimodale, en mettant l'accent sur le traitement de la voix en français, ouvrant ainsi de nouvelles possibilités pour des applications dans l'éducation, l'accessibilité et au-delà.
Cadre d'IA Agentique
LUCIE évoluera vers un cadre d'IA agentique robuste, exploitant ses capacités pour alimenter des systèmes autonomes et des fondations pour les Modèles d'Action Large (LAM), tout en maintenant la transparence, la confiance et les garanties éthiques.
Rejoignez le mouvement LUCIE
LUCIE est plus qu'un modèle—c'est un effort communautaire pour redéfinir l'avenir de l'IA. En nous rejoignant, vous contribuez à construire une IA qui s'aligne sur nos valeurs communes d'ouverture, de transparence et de confiance.