IMTBS - L'intelligence artificielle souveraine en France : Un enjeu stratégique et technologique

Michel-Marie Maudet, Co-fondateur et Directeur Général de LINAGORA est intervenu à l’Institut Mines-Télécom Business School (IMT-BS) pour animer une après-midi dédiée à l’Intelligence Artificielle (IA) générative. Cette session a débuté par un workshop recherche, réunissant chercheurs et enseignants pour explorer les enjeux actuels de l’IA. S'est ensuivi une masterclass captivante, où Michel-Marie a partagé son expertise avec les étudiants abordant les défis et opportunités offerts par l’IA générative dans le monde professionnel et sociétal. Ces deux moments ont offert une immersion riche en réflexion et en débat sur l’avenir de la technologie.
 

Les débuts de LINAGORA

Michel-Marie Maudet et Alexandre Zapolsky, les deux fondateurs de LINAGORA, ont débutés cette aventure au sein même des locaux de l’IMT-BS, anciennement l'Institut National des Télécoms (INT), à la fin de 1999. À l'époque, Michel-Marie, lui, était militaire sur la base aérienne de Brétigny et Alexandre, étudiant sur le campus d’Evry, où ils jouaient tous deux au rugby universitaire. En 2000, ils créent LINAGORA, et aujourd'hui, 25 ans plus tard, LINAGORA est une société de plus de 200 personnes, présente sur quatre continents, spécialisée dans la collaboration d'entreprise, développant des alternatives souveraines à des outils comme Office 365 ou Google Workplace, grâce à l'Open Source.
 

L'Open Source, un pilier fondamental de la souveraineté numérique

L'essor des technologies Open Source en France et en Europe s'inscrit dans une démarche cruciale pour la souveraineté numérique. Depuis 25 ans, nous développons des technologies Open Source offrant contrôle et transparence, renforçant la confiance dans les technologies utilisées. En lien avec l'IA, cette transparence devient indispensable, surtout à long terme lorsqu'il s'agit de décisions critiques (assurances, crédits, etc.). Ce lien entre technologie et prise de décision future soulève des questions éthiques et de choix de société, notamment sur l'influence culturelle des données américaines sur les modèles d'IA.

En matière de souveraineté numérique, Michel-Marie expose que : 

« 80 %, pour les services internet, pour les services cloud, on fait des solutions en fait américaines. Est-ce que c'est un problème ? »

 

Cette problématique s'étend à l'IA, où les modèles déjà existants, sont majoritairement entraînés sur des données anglophones, influençant les réponses générées et présentant des biais culturels. Cela peut entraîner des distorsions, par exemple dans la reconnaissance de certains faits historiques ou dans l'analyse de CV de ses étudiants.

 
L'Open Source représente une offre de transparence qui permet de maintenir un contrôle sur les données utilisées, et ainsi garantir ainsi une meilleure confiance dans l'outil. 
Comme le souligne Michel-Marie MAUDET, « la transparence, c’est de la confiance ». 

 

Cela est particulièrement pertinent dans le domaine de l’intelligence artificielle (IA), où la maîtrise des données et des algorithmes deviennent un enjeu de taille pour assurer une prise de décision souveraine et équitable.

 

La mission de LINAGORA est donc de réduire la dépendance aux grandes entreprises américaines, un impératif lorsqu'il s'agit de protéger les informations sensibles des administrations et des entreprises françaises


 

Les biais des modèles IA actuels et l’importance de modèles souverains

Les modèles d’IA actuels, majoritairement issus des géants Américains et Chinois, comme ChatGPT ou Claude, présentent des biais culturels qui soulèvent des questions de pertinence et de sécurité dans d'autres contextes nationaux, en particulier en France et en Europe. Michel-Marie MAUDET met en évidence que 

« les modèles de langage, tels que Llama ou Falcon, sont principalement entraînés sur des données en anglais, avec moins de 1 % de données en français ». 

Cela induit des réponses et des préférences orientées, qui ne reflètent pas nécessairement la culture ou les valeurs européennes. L'exemple des réponses erronées sur l’histoire du premier micro-ordinateur est frappant : 

« Lorsque je pose la question : quel est le premier micro-ordinateur qui a été disponible sur le marché ? 
Un modèle qui a été entraîné massivement par des données anglaises, vous répond une machine Altair 8080, et effectivement, c'est une machine américaine qui est apparue dans les années 70, mais malheureusement, le premier micro-ordinateur personnel qui a été commercialisé, est un Micral N d'une société française ».

 

Ces « hallucinations » des modèles IA renforcent la nécessité de développer des IA locales, avec des datasets représentatifs des cultures et des contextes locaux. LINAGORA s’engage ainsi, avec le soutien de la communauté OpenLLM-France, dans la création de LUCIE, une IA générative open source, avec « 30 % de données en français », un modèle compact, économe en énergie et centré sur les langues européennes, une étape essentielle pour l’autonomie technologique en France et en Europe.

« La première itération qu'on a fait, c'est un modèle qui, dans la constitution de son dataset, contenait moins de 1 % de français. Dans Lucie, on a 30 % de français, 30 % d'anglais, 20 % de code et de mathématiques, parce que ça aide les modèles à raisonner. Les 10 % qui restent sont réparti sur les 3 autres langues majeures Européennes : l'allemand, l'italien et l'espagnol.
 

Enjeux environnementaux et économiques : vers des modèles plus sobres

L'impact environnemental de l'entraînement des modèles d'IA est un sujet de plus en plus discuté. Michel-Marie MAUDET indique que 

« chaque requête sur ChatGPT consomme environ un litre d'eau », 

Un chiffre alarmant dans un contexte où la durabilité devient une priorité mondiale. LINAGORA adopte une approche pragmatique en développant des modèles IA plus petits et plus économes, tels que LUCIE. Cette stratégie vise à concilier performance technologique et responsabilité écologique. L’enjeu n’est pas uniquement environnemental, mais aussi économique. Michel-Marie MAUDET souligne que 

« Microsoft augmente chaque année de 15 à 25 % les tarifs d’Office 365 ». 

La dépendance croissante à des services étrangers coûteux pousse les entreprises françaises à chercher des alternatives. En créant des IA souveraines, les entreprises locales peuvent non seulement réduire leurs coûts, mais aussi contribuer à l’économie nationale en développant des technologies exportables et alignées sur les valeurs européennes de transparence et d’inclusivité.


 

Workshop avec les chercheurs de l'IMTBS

Image
Image
Image

 

Conférence sur OpenLLM à l'IMTBS

Image
Image
Image

 

Image
Image
Image

 

 

Comment puis-je vous aider ?

CAPTCHA
5 + 1 =
Trouvez la solution de ce problème mathématique simple et saisissez le résultat. Par exemple, pour 1 + 3, saisissez 4.
Cette question sert à vérifier si vous êtes un visiteur humain ou non afin d'éviter les soumissions de pourriel (spam) automatisées.