- Administratif
- Toute la matière
- > Acte
- > Bien
- > Collectivité territoriale
- > Compétence
- > Contrat et marché
- > Droit économique
- > Droit fondamental et liberté publique
- > Environnement
- > Finance et fiscalité
- > Fonction publique
- > Institution administrative
- > Police
- > Pouvoir public
- > Procédure contentieuse
- > Responsabilité
- > Service public
- > Urbanisme
- Affaires
- Civil
- Toute la matière
- > Arbitrage - Médiation - Conciliation
- > Bien - Propriété
- > Contrat et obligations
- > Droit international et communautaire
- > Famille - Personne
- > Filiation
- > Loi et traité
- > Mariage - Divorce - Couple
- > Procédure civile
- > Profession juridique et judiciaire
- > Responsabilité
- > Société et association
- > Succession - Libéralité
- > Sûretés
- > Voie d'exécution
- Européen
- Immobilier
- IP/IT et Communication
- Pénal
- Toute la matière
- > Atteinte à l'autorité de l'état
- > Atteinte à la personne
- > Atteinte aux biens
- > Criminalité organisée et terrorisme
- > Droit pénal des affaires
- > Droit pénal général
- > Droit pénal international
- > Droit social
- > Enquête
- > Environnement et urbanisme
- > Etranger
- > Instruction
- > Jugement
- > Mineur
- > Peine et exécution des peines
- > Presse et communication
- > Propriété intellectuelle
- > Santé publique
- Social
- Toute la matière
- > Accident, maladie et maternité
- > Contrat de travail
- > Contrôle et contentieux
- > Droit de la sécurité sociale
- > Droit international et communautaire
- > Etrangers
- > Grève
- > Hygiène - Sécurité - Conditions de travail
- > IRP et syndicat professionnel
- > Négociation collective
- > Protection sociale
- > Rémunération
- > Rupture du contrat de travail
- > Santé publique
- > Temps de travail
- Avocat
Article
Pourquoi le grand modèle de langage Falcon 180B est en accès libre ?
Pourquoi le grand modèle de langage Falcon 180B est en accès libre ?
Si Falcon 180B n’est pas le premier modèle de langage ( LLM ) disponible sous licence open Source, le choix de l’Institut d’innovation technologique des Émirats arabes unis (Technology Innovation Institute – TII) de le diffuser en libre accès est loin d’être anodin. Le modèle défendu aurait pour objectif de démocratiser les technologies de l’IA et de la rendre plus éthique en privilégiant la transparence grâce à un accès libre de la technologie. Par ailleurs, en permettant aux utilisateurs de contribuer au développement de Falcon 180B, les concepteurs visent à profiter de l’expertise d’une large communauté d’utilisateurs alors que ce LLM égale voire dépasse déjà les performances des plus grands LLM propriétaires. En tout état de cause, le choix révèle une autre façon d’exercer les droits de propriété intellectuelle.
Le grand modèle de langage (appelé également grand modèle linguistique ou grand modèle de langue, modèle de langage de grande taille ou encore modèle massif de langage : v. Wikipédia, entrée « grand modèle de langage ») Falcon 180B (en anglais LLM pour large language model), qui s’érige parmi les plus performants de sa génération, vient d’être mis à disposition selon les termes de la licence TII Falcon 180B, version 1.0 par l’Institut d’innovation technologique des Émirats arabes unis (Technology Innovation Institute – TII). Cette licence open source, inspirée de la licence Apache 2.0, contient les conditions d’utilisation, de redistribution et de modification que l’on trouve habituellement dans les licences libres de logiciels (J.-Cl PLA, v° L’œuvre libre, 2019, fasc. n° 1975). Rappelons que sur le fondement du droit d’auteur et du droit des brevets, les licences open source visent à permettre une diffusion large de l’œuvre et de ses formes dérivées et à offrir aux utilisateurs la possibilité de contribuer aux évolutions successibles de cette dernière.
Ce faisant, l’Institut d’innovation technologique des Émirats arabes unis (TII) enclenche trois dynamiques que nous analyserons successivement. La première est celle de rendre accessible intellectuellement l’IA, ce qui répond aux préoccupations éthiques du moment. Ensuite, la démarche permet de miser sur le travail collaboratif des spécialistes des LLM pour mieux concurrencer les autres outils comme GPT-4 d’OpenAI et PaLM 2 Large de Google qui reposent sur un modèle propriétaire. Enfin, le choix d’appliquer l’open source à la technologie de l’IA (d’autres IA sont disponibles en open source comme LLaMA, StableLM, RedPajama et MPT) file la tendance actuelle qui consiste à libéraliser l’accès aux contenus numériques à la faveur de l’entraînement des IA.
L’accès libre pour un LLM éthique ?
Imaginées pour les logiciels, les licences en open source autorisent l’utilisation, la copie, la diffusion et la modification des codes logiciels accessibles sous la forme source de sorte qu’il est possible de les étudier et d’en connaître exactement les fonctionnalités. Appliqué au LLM, l’open source offrirait la possibilité aux utilisateurs de maîtriser la technologie mise à disposition, de connaître précisément son fonctionnement et de mieux appréhender les résultats obtenus. La transparence ainsi introduite pourrait répondre au souhait, notamment du Parlement européen, que les systèmes d’IA utilisés dans l’UE soient sûrs, transparents, traçables, non discriminatoires (J. Sénéchal, L’IA Act déjà obsolète face aux IA de nouvelle génération ? L’exemple de ChatGPT, Dalloz actualité, 1er févr. 2023). Toutefois, pour atteindre de tels objectifs, il convient d’être attentif aux deux faces de l’accès libre, l’une vise l’accès à la connaissance intellectuelle de la technologie, l’autre dépend des usages permis.
S’agissant de la connaissance intellectuelle de la technologie, on relève que la version 1.0 de la licence TII Facon 180B prévoit que les utilisateurs auront accès à « l’œuvre et ses travaux dérivés sous forme de source ou d’objet » (art. 2 et 3). Il s’agit de la version initiale du LLM Falcon 180B et toutes les déclinaisons qui en seront faites au fur et à mesure des ajouts et des modifications excepté les créations qui demeurent séparables de l’œuvre et de ses dérivés quand bien même elles seraient liées par une interface.
Selon les définitions énoncées à l’article 1er, la « forme source » comprend notamment le code source d’un logiciel, les ensembles de données d’entraînement utilisés pour l’entraînement ou le réglage d’un modèle d’apprentissage automatique ou d’un modèle d’intelligence artificielle, la source de la documentation et les fichiers de configuration. Quant à la « forme objet »,...
Sur le même thème
-
Panorama rapide de l’actualité « Technologies de l’information » de la semaine du 29 avril 2024
-
La loi HADOPI, tel un phénix
-
La mesure de confiscation de l’Athlète de Fano est compatible avec la Convention européenne des droits de l’homme
-
Prochaine édition: mardi 14 mai
-
Rappels en matière de preuve de la contrefaçon de brevet
-
Panorama rapide de l’actualité « Propriété intellectuelle » des semaines du 15 au 30 avril 2024
-
Panorama rapide de l’actualité « Technologies de l’information » des semaines des 15 et 22 avril 2024
-
[PODCAST] Cybersanté : l’IA s’active en conscience
-
IA et RGPD : les premières recommandations de la CNIL
-
Absence de rétroactivité du nouveau régime de prescription des actions en nullité de titres de propriété industrielle
Sur la boutique Dalloz
Code de la propriété intellectuelle 2024, Annoté et commenté
01/2024 -
24e édition
Auteur(s) : Pierre Sirinelli; Julie Groffe-Charrier; Antoine Latreille