Accueil
Le quotidien du droit en ligne
-A+A
Interview

Open data des décisions des tribunaux judiciaires : une nouvelle étape novatrice

Depuis le 22 décembre 2023, les jugements rendus en matière civile par plusieurs tribunaux judiciaires sont diffusés en open data sur le site de la Cour de cassation. Retour sur cette nouvelle étape décisive de l’open data des décisions de justice sur Judilibre, et les prochaines avancées à venir avec Sandrine Zientara-Logeay, présidente de chambre à la Cour de cassation, directrice du service de documentation, des études et du rapport.

le 11 janvier 2024

La rédaction : Depuis le 22 décembre 2023, des jugements rendus en matière civile par plusieurs tribunaux judiciaires sont diffusés en open data sur le site de la Cour de cassation. Que pouvez-vous nous dire de cette nouvelle étape qui vient d’être franchie ?

Sandrine Zientara-Logeay : Effectivement, depuis la fin de l’année 2023, et conformément à l’engagement qu’elle avait pris, la Cour de cassation diffuse en open data les décisions rendues publiquement à compter du 15 décembre 2023, en matière civile, sociale et commerciale, par neuf tribunaux judiciaires parmi les plus importants. Il s’agit des Tribunaux judiciaires de Bobigny, Bordeaux, Lille, Lyon, Marseille, Paris, Rennes, Saint-Denis-de-La-Réunion et Versailles. Ces décisions sont désormais consultables et téléchargeables gratuitement sur le site de la Cour de cassation avec le moteur de recherche Judilibre.

Avec cette étape, le projet entre dans sa phase véritablement novatrice, emblématique du modèle français, quasi unique en Europe, d’une diffusion en open data des décisions rendues publiquement, non pas sélective, mais exhaustive.

En effet, toutes les décisions motivées de la Cour de cassation étaient déjà diffusées gratuitement depuis 2002 sur le site Légifrance, et celles des cours d’appel rendues en matière civiles étaient accessibles, de manière payante, notamment aux éditeurs, aux avocats et aux legaltech à partir de la base de données JURICA. Avec les décisions civiles des tribunaux judiciaires, sont diffusées des décisions qui n’étaient, jusqu’alors, accessibles, d’aucune manière, ni au grand public, ni à la communauté des juristes, ni aux magistrats eux-mêmes.

À ce jour, ce sont ainsi plus de 800 000 décisions qui sont diffusées en open data sur le site Judilibre, dont plus de 518 000 de la Cour de cassation, plus de 296 000 des cours d’appel et plus de 620 des tribunaux judiciaires.

La rédaction : Quels défis la Cour, qui s’est vue confier la diffusion en open data des décisions judiciaires par le décret du 29 juin 20201, a dû relever pour parvenir aujourd’hui à ce résultat ?

Sandrine Zientara-Logeay : Les défis n’ont pas manqué ! Techniques, d’abord tant pour la réception de ces décisions, que pour leur diffusion sous forme anonymisée, dans un format téléchargeable et avec un moteur de recherche performant. Ceci a été rendu possible, avec le soutien du ministère, grâce à l’intervention d’un prestataire extérieur, mais surtout grâce à un laboratoire d’innovation, au sein de la Cour, actuellement composé d’une équipe de data scientist, de data engineer, de développeurs et de devops. Ce laboratoire a notamment développé un logiciel de pseudonymisation des décisions de justice qui repose sur l’intelligence artificielle, avec une interface d’annotation permettant de vérifier et corriger la pseudonymisation automatique. Le moteur de pseudonymisation a déjà un taux de réussite de plus de 99 % sur les noms propres. Il est régulièrement réentraîné pour en améliorer la performance : l’objectif est d’assurer à terme la pseudonymisation de plusieurs millions de décisions par an, en réduisant au strict minimum la relecture humaine. Ce dispositif est une vraie réussite pour la Cour et intéresse beaucoup les autres États européens, qui nous sollicitent très souvent à son sujet. Le laboratoire d’innovation travaille actuellement à la pseudonymisation automatique des avis des avocats généraux et des rapports des conseillers, afin de permettre à terme, et s’agissant des arrêts publiés de la Cour de cassation, une très large diffusion de ces travaux.

Au Service de documentation, des études et du rapport (SDER), les équipes mobilisées sur le projet open data, dans ses différents aspects informatiques, numériques, juridiques, sous la responsabilité d’un conseiller référendaire, Edouard Rottier, sont composées d’une trentaine de personnes, d’horizons variés, scientifiques, magistrats, fonctionnaires, contractuels, stagiaires.

Le défi a aussi été celui de l’accompagnement des juridictions, qui a pu être mené à bien grâce à une excellente coopération avec le ministère de la Justice, en particulier le secrétariat général et la direction des services judiciaires, qui nous a permis de travailler de concert au plus près des besoins des juridictions concernées et dans le souci d’adapter les applicatifs métiers et de ne pas alourdir la charge de travail des magistrats et des services de greffe.

Le défi a enfin été celui de la diffusion d’un nombre de plus en plus massif de décisions dans le respect des normes internes et européennes du droit de la protection des données et de la vie privée.

La rédaction : À ce propos, pouvez-vous nous préciser comment la protection de la vie privée est assurée ?

Sandrine Zientara-Logeay : Les décisions de justices sont évidemment susceptibles de comporter des données très sensibles, de sorte qu’il a fallu construire un dispositif rendant compatible l’open data et la protection de la vie privée. La loi du 23 mars 2019 a posé un principe d’occultation dite « socle », obligatoire, des noms et prénoms des personnes physiques mentionnées dans la décision, lorsqu’elles sont parties ou tiers. En outre sont prévues des occultations complémentaires, facultatives, décidées par le président de la formation de jugement, des éléments permettant la réidentification de la personne, en cas de risque d’atteinte à la sécurité ou au respect de la vie privée de ces personnes ou de leur entourage. Il s’agit par exemple des numéros identifiants, des adresses, des dates ou dans certains cas du nom des personnes morales…

Avant diffusion, les décisions, grâce au logiciel que je viens de décrire, sont pseudonymisées à la Cour de cassation, en fonction des choix effectués par les magistrats qui rendent la décision.

Dans un souci d’harmonisation, pour la mise en open data des décisions des cours d’appel qui a débuté en avril 2022, la Cour a défini des recommandations d’occultation complémentaire par type de contentieux, après avoir mis en balance le risque d’atteinte à la vie privée avec la nécessaire intelligibilité de la décision, au regard de l’importance du point de vue du droit de celle-ci, en s’appuyant sur les travaux de plusieurs comités thématiques réunissant des spécialistes des divers contentieux, magistrats de la Cour et des cours d’appel.

La même méthode a été suivie pour les tribunaux judiciaires et dans une dépêche, en date du 6 novembre 2023, le premier président Christophe Soulard a fait connaitre les recommandations d’occultations complémentaires proposées par la Cour. Fort du retour d’expérience sur la diffusion des décisions des cours d’appel, des occultations complémentaires supplémentaires ont été préconisées, telles celles du nom des personnes morales dans le droit patrimonial de la famille, pour mieux prendre en compte le risque d’atteintes à la vie privée, accru compte tenu de la masse des décisions qui seront diffusées. L’ensemble des recommandations pour les cours d’appel a été aligné sur celui des tribunaux judiciaires par souci de cohérence, les décisions rendues successivement dans une même affaire étant susceptibles de donner lieu à un chaînage sur Judilibre2.

Il faut aussi savoir que toute personne peut introduire, à tout moment, devant un magistrat de la Cour de cassation une demande d’occultations supplémentaires ou de levée d’occultation des éléments d’identification figurant dans une décision diffusée en open data. La décision de ce magistrat peut faire l’objet d’un recours devant le premier président de la Cour de cassation dans les deux mois.

Je précise que pour l’instant la Cour de cassation a été saisie de très peu de demandes, moins d’une vingtaine3. Néanmoins avec le changement d’échelle que représente la diffusion de toutes les décisions des tribunaux judiciaires, il est probable que ces saisines augmentent substantiellement dans les années à venir.

Le premier président de la Cour de cassation a en outre décidé d’instaurer en 2024 un comité transversal de suivi des recommandations réunissant des représentants des tribunaux judiciaires, des cours d’appel ainsi que de la Cour de cassation. Ce comité aura pour mission d’apprécier la cohérence de l’ensemble des recommandations en vigueur et, le cas échéant, d’envisager leur modification au regard de la réévaluation régulière des risques.

L’ensemble de ce dispositif a été récemment approuvé par la CNIL dans sa Délibération du 7 décembre 20234 qui a accueilli favorablement les garanties mises en œuvre pour réduire les risques.

La rédaction : Quelles seront les prochaines étapes ?

Sandrine Zientara-Logeay : Pour l’année 2024, nous allons poursuivre la mise en open data des décisions civiles des tribunaux judiciaires avec un deuxième lot de juridictions. L’objectif est de mettre à disposition d’ici la fin de l’année les deux tiers des décisions civiles rendues publiquement par les tribunaux judiciaires, ce qui pourrait correspondre à plus de 300 000 décisions par an.

Nous travaillons aussi avec le ministère et les tribunaux de commerce au développement d’outils de transmission des décisions avec les consignes d’occultation afférentes, dans l’objectif de commencer à diffuser avant la fin de l’année 2024 les décisions des tribunaux de commerce, dans le respect du calendrier fixé par l’arrêté du 28 avril 20215.

Enfin les travaux exploratoires sur la question plus complexe encore, tant juridiquement, que judiciairement et techniquement, de la diffusion des décisions rendues en matière pénale se poursuivront aussi en 2024.

Conformément à l’arrêté précité, modifié par arrêté du 27 juin 2023, la diffusion des décisions des conseils de prud’hommes est prévue d’ici le 30 septembre 2025.

La rédaction : À ce stade du développement de l’open data des décisions, comment définiriez-vous ses principaux enjeux pour la justice ?

Sandrine Zientara-Logeay : À mon sens, il ne s’agit, principalement, ni d’une déclinaison numérique du principe de publicité de la justice, ni d’un renforcement de l’accès au droit positif (c’est-à-dire à la règle de droit telle qu’interprétée par la jurisprudence). En effet, au moment de l’adoption de la loi du 7 octobre 2016 pour une République numérique, la France était déjà très avancée dans la diffusion de la jurisprudence, au sens classique du terme, par rapport aux autres États européens.

Les enjeux du modèle français de diffusion exhaustive de l’open data, tels qu’ils ont été envisagés par le législateur étaient davantage économiques (visant le développement du marché de la donnée), démocratiques (visant la transparence sur la manière dont jugent les juridictions, dans leur activité courante) et jurimétriques (visant à la modernisation des méthodes de travail).

Sur le plan quantitatif, la croissance du secteur des legaltech et le développement de l’intelligence artificielle générative appliquée à la justice, dont la masse des décisions mises en open data constitue le carburant, comme le nombre très important des consultations par le public du site Judilibre de la Cour, qui s’élève pour l’année 2023 à plus de 6,2 millions, attestent de l’intérêt que suscite la diffusion des décisions de justice.

Au-delà de ces aspects, la diffusion en open data constitue un progrès pour les professionnels du droit à condition qu’ils puissent se repérer dans la masse indifférenciée des décisions de justice des cours d’appel et des tribunaux judiciaires mises en ligne. C’est la raison pour laquelle, dans la suite des recommandations formées par le rapport de juin 2022 sur la diffusion des données décisionnelles et la jurisprudence (L. Cadiet, C. Chainais et J.-M. Sommer [ss-dir.], S. Jobert et E. Jond-Necand [rapporteur]), le premier président a décidé de relancer le processus de hiérarchisation des décisions des juridictions du fond, afin que celles qui présentent un intérêt juridique particulier, sur la base de critères substantiels ou formels, puissent être distinguées comme tels sur le moteur de recherche Judilibre. Le SDER, en lien avec la direction des services judiciaires, aura la responsabilité de la mise en œuvre d’un dispositif rénové de sélection par les juridictions du fond de leurs décisions présentant un intérêt particulier. Ce dispositif, en cours de construction, devrait s’appuyer sur un comité d’accompagnement et sur un suivi qualitatif et quantitatif des transmissions au SDER.

Pour les magistrats eux-mêmes, ceux de la Cour de cassation comme ceux des juridictions des premier et second degrés, l’open data peut aussi constituer une opportunité. Il peut en effet contribuer à la valorisation de leur jurisprudence, au dialogue des juges, via la connaissance partagée de la jurisprudence en train de se construire, en particulier sur les contentieux émergents et les questions nouvelles.

Les projets d’observatoire des litiges judiciaires, de hiérarchisation de la jurisprudence des juges du fond ou de développement de programmes d’intelligence artificielle appliqués à la jurisprudence, portés par le SDER, ont ainsi vocation à faire de l’open data un atout pour les juridictions.

Pour en revenir à l’intelligence artificielle, le SDER espère aussi, grâce à son laboratoire d‘innovation et en intégrant des programmes de recherche de grande ampleur, contribuer à la création d’outils d’aide à la recherche et d’aide à la décision, dans le respect de l’office du juge. Il existe un vrai besoin d’outils performants, fiables et transparents. La Cour de cassation est garante de la prévisibilité de la jurisprudence, mais aussi de sa vitalité, c’est-à-dire de sa capacité à évoluer. Son objectif n’est pas de développer, à partir de l’IA, des instruments de justice prédictive, qui risquent de venir figer la jurisprudence et réduire l’office du juge. Il s’agit pour la Cour de s’inscrire pleinement dans l’écosystème de la recherche publique sur l’intelligence artificielle appliquée aux décisions et ce faisant de contribuer utilement à l’analyse des enjeux éthiques et judiciaires et aux débats sur la régulation de la réutilisation des données judiciaires.

Bref, l’open data est porteur de transformations majeures dans l’accès au juge, la façon de dire le droit et de rendre la justice, qui implique de l’aborder de manière à la fois innovante et vigilante.

 

1. NDLR : Décr. n° 2020-797 du 29 juin 2020 relatif à la mise à la disposition du public des décisions des juridictions judiciaires et administratives
2. NDLR : À terme, le moteur de recherche Judilibre donnera accès, dans une affaire donnée, à toutes les décisions rendues depuis la première instance jusqu’à la cassation.
3. NDLR : Sur 19 saisines, les magistrats ont fait droit à la demande dans 4 cas.
4. NDLR : Délib. n° 2023-128 du 7 déc. 2023 portant avis sur un projet de décret modifiant le décr. n° 2021-1276 du 30 sept. 2021 relatif aux traitements automatisés de données à caractère personnel dénommés « Décisions de la justice administrative » et « Judilibre ».
5. NDLR : Arr. du 28 avr. 2021 pris en application de l’art. 9 du décr. n° 2020-797 du 29 juin 2020 relatif à la mise à la disposition du public des décisions des juridictions judiciaires et administratives.

 

Propos recueillis par Laurent Dargent, Rédacteur en chef

Sandrine Zientara-Logeay

Sandrine Zientara-Logeay est présidente de chambre, directrice du service de documentation, des études et du rapport depuis septembre 2022