NLP for French and non-English languages
Vous le savez ! Notre DG, Michel-Marie MAUDET, est sur tous les fronts.
Il y a quelques semaines au Ministère de l'Interieur et des Outre-mer, et récemment, dans les locaux de la startup La Javaness, pour un engagement permanent auprès de tous les acteurs de notre écosystème innovation.
Dans le cadre du premier Pie & AI Paris meetup aux côtés de Lu W., Van Tuan DANG, Jonathan Tu NGUYEN, Andrew Ng et de la communauté DeepLearning.AI...
Ce fût un moment d'échanges et de partages entre experts et passionnés d'IA autour des enjeux et problématiques liées NLP, TAL.
Évidemment, l'occasion de présenter les travaux d'OpenLLM France.
3 messages clés à retenir:
1- Sous-représentation de certaines langues, comme les français, dans le traitement automatique du langage:
Les chiffres Llama 2 de meta sont explicites en la matière:
- + de 87% est en anglais ;
- 0.16% est en français ;
- 0.17% est en allemand ;
2- Au-delà des langues, le véritable enjeu est bien la sous-représentativité de notre modèle culturel, social et économique en France et en Europe.
3- Ne soyons pas dupes, les LLM commerciaux issus de géants de la Tech ne sont pas réellement Open Source et manquent cruellement de transparence, ce qui pose un problème éthique évident.