Nos origines

Le voyage de LUCIE a commencé en juin 2023 lorsque LINAGORA a décidé de lancer la communauté OpenLLM France, réunissant des contributeurs (>900 membres en janvier 2025) autour de l'objectif de construire une IA générative ouverte alignée sur les valeurs européennes communes. En février 2024, cette communauté s'est transformée en OpenLLM Europe, visant à connecter et renforcer les initiatives européennes pour des modèles génératifs d'IA ouverts et éthiques. Pour aller plus loin dans cette vision, LINAGORA a dirigé le consortium OpenLLM France**, formé avec 11 partenaires de la communauté, pour répondre à l'appel à projets "Communs Numériques dans le domaine de l'IA Générative". Désormais lauréat France 2030, le consortium s'engage dans une mission de deux ans débutant fin 2024 pour créer des communs d'IA générative ouverts, avec un accent particulier sur l'éducation et le secteur EdTech. L'étape suivante est survenue fin 2023, lorsque LINAGORA a initié l'entraînement de LUCIE avec le soutien de la communauté et particulièrement du GENCI (Grand Équipement National de Calcul Intensif) pour l'accès au supercalculateur Jean Zay. Aujourd'hui, en janvier 2025, la sortie de LUCIE marque une étape importante dans la livraison d'un modèle d'IA véritablement open source, éthique et efficace pour l'Europe et au-delà.

ai-partner ai-partner ai-partner ai-partner ai-partner ai-partner ai-partner ai-partner ai-partner ai-partner

Qu'est-ce qui fait que LUCIE est véritablement open source ?

solution

Données transparentes

Tous les jeux de données d'entraînement sont ouverts et sous licence pour une utilisation publique. De la collecte à la curation, nous assurons la transparence à chaque étape.

solution

Algorithmes ouverts

Nos méthodologies d'entraînement, nos processus d'ajustement fin et notre « sauce secrète » sont entièrement documentés et librement accessibles pour que chacun puisse les explorer, les utiliser et les améliorer.

solution

Modèles librement accessibles

Les poids, points de contrôle et code source de LUCIE sont accessibles sous licence Apache 2.0. Cette licence permissive et sans restriction permet à quiconque, partout dans le monde, d'utiliser, d'adapter et de déployer le modèle à n'importe quelle fin, garantissant une véritable accessibilité et innovation mondiale.

Conçu pour la souveraineté et la durabilité

LUCIE a été créée pour répondre aux défis uniques de la création d'une IA éthique, efficiente et accessible

solution

Souveraineté européenne

LUCIE incarne un engagement envers les valeurs européennes, respectant la diversité culturelle, promouvant le développement éthique de l'IA et la conformité avec l'AI Act.

solution

Compact et efficace

Optimisé pour les environnements à faibles ressources, l'architecture de LUCIE permet le déploiement sur des infrastructures "pauvres en GPU" et même sur des appareils mobiles.

solution

Éco-responsabilité

En privilégiant la qualité à la quantité dans les données d'entraînement, nous garantissons une empreinte environnementale plus légère sans compromettre les performances.

Testez LUCIE par vous-même

Vous pouvez tester les capacités de LUCIE directement via notre plateforme SaaS dédiée, disponible dès maintenant sur LUCIE.chat. Que vous exploriez les performances du modèle ou que vous l'intégriez dans vos flux de travail, la plateforme offre un accès transparent aux fonctionnalités de LUCIE.

Essayez maintenant

LUCIE en chiffres

7 milliards de paramètres

Taille du modèle : 7 milliards de paramètres – compact et optimisé pour des performances élevées dans diverses applications. En 2025, nous construirons une version plus compacte de LUCIE (<3B)

3,1 billions de tokens

Jeu de données d'entraînement : 3,1 billions de tokens, soigneusement sélectionnés pour équilibrer qualité et diversité, incluant le français, l'anglais, l'allemand, l'espagnol, l'italien et le code.

600K heures GPU

Heures d'entraînement : Plus de 600 000 heures GPU sur le supercalculateur Jean Zay, utilisant 512 GPU NVIDIA H100 en parallèle.

Langues prises en charge

Approche multilingue, avec un accent particulier sur le français et les principales langues européennes, assurant une représentation culturelle et linguistique.

2023-2025

Chronologie de développement : Entraînement initié fin 2023, aboutissant à la sortie du modèle en janvier 2025.

L'avenir de LUCIE en 2025

Le voyage de LUCIE ne s'arrête pas là. Notre feuille de route pour 2025 définit des objectifs ambitieux pour améliorer les capacités et élargir les applications du modèle :

Q1

Amélioration du fine-tuning et meilleure boîte à outils pour les créateurs d'IA

Nous allons affiner les capacités de LUCIE à suivre les instructions (fine-instruct), introduire l'appel de fonctions pour une meilleure intégration avec les systèmes externes, et publier au moins un modèle de moins de 3 milliards de paramètres pour garantir l'accessibilité dans les environnements aux ressources limitées.

Q2

Génération Augmentée par Récupération (RAG) Avancée

LUCIE bénéficiera d'une fonction RAG avancée, lui permettant d'exploiter des bases de connaissances externes pour des réponses plus précises et contextuellement adaptées.

Q3

Extension multimodale avec support vocal

Nous étendrons les capacités de LUCIE à l'IA multimodale, en mettant l'accent sur le traitement de la voix en français, ouvrant ainsi de nouvelles possibilités pour des applications dans l'éducation, l'accessibilité et au-delà.

Q4

Cadre d'IA Agentique

LUCIE évoluera vers un cadre d'IA agentique robuste, exploitant ses capacités pour alimenter des systèmes autonomes et des fondations pour les Modèles d'Action Large (LAM), tout en maintenant la transparence, la confiance et les garanties éthiques.