Les participant·e·s, provenant essentiellement de bureaux privés, d’universités, du Contrôle fédéral des finances et du Contrôle parlementaire de l’administration, ont échangé sur leurs pratiques via un sondage en ligne (Slido) et en groupe : objectifs et fréquence d’usage, outils préférés, premières expériences recueillies. L’événement a pu avoir lieu grâce au soutien de la SEVAL et du Kompetenzzentrum für Public Management (KPM) de l’Université de Berne, ainsi qu’à l’engagement du comité SwissJEE (Julia Lehmann, Julián Salazar et Philipp Zogg). Merci à eux ainsi qu’à tous les participants !
***
🎯 État des lieux – Tous les participants utilisent l’IA au moins une fois par semaine, de manière hétérogène, sans qu’il y ait encore de pratiques clairement établies. L’événement a néanmoins permis d’identifier une vingtaine d’outils d’intelligence artificielle utilisés principalement dans les domaines de la correction de textes, de la recherche d’informations, de la transcription et de l’aide à l’analyse qualitative et quantitative de textes.
🔍 Outils d’IA utilisés – Une large palette d’outils IA est déjà utilisée par les participants dans le domaine de l’évaluation et des sciences sociales appliquées, notamment pour la transcription automatique d’entretiens (par exemple, Teams, Töggel, Read AI) et l’analyse de textes (MaxQDA AI) ; la correction, la synthèse, l’amélioration et la traduction de textes (DeepL Write, DeepL, Grammarly) ; la recherche d’informations (Perplexity, Claude AI, ChatGPT, Copilot, Mistral AI) et sur l’état de la recherche dans un domaine donné (Consensus, Scispace) ; l’aide à la synthèse d’informations (ChatPDF, Scispace) et à l’écriture (Avidnote, Scispace, jenni ai, Paperpal) ; et finalement pour la visualisation et la génération d’images (Napkin, DallE).
💡 Possibles applications en évaluation – Les participants ont ensuite comparé leurs pratiques avec les premiers insights du Groupe de travail SEVAL sur l’IA ainsi qu’avec l’expertise de Jan Ulrich Hense (2025)[1] qui présente dans sa publication des cas concrets d’application. Certaines utilisations se recoupent, d’autres ne sont pas encore courantes : création et révision de textes, exploration et synthèse documentaire, génération d’idées, revues de littérature, création de modèles d’impact, conception de questionnaires, transcription, analyse de données qualitatives et quantitatives, ainsi que visualisations.
🕵️♂️ Défis identifiés – Les principales préoccupations des JEE concernent la validité des sources et les hallucinations de l’IA, ce qui nécessite une vérification approfondie des contenus générés. La protection des données représente également un enjeu majeur, questionnant le stockage des informations et nécessitant une collaboration encore peu rôdée avec des experts informatiques en la matière.
🧰 Premières recommandations –L’utilisation de l’IA peut être optimisée par une formulation précise des requêtes et la fragmentation des demandes en unités petites et spécifiques. La mise en commun, au niveau institutionnel, de certains « prompts » souvent utilisés pourrait également démocratiser leur accès et améliorer les résultats. Une collaboration plus étroite avec des experts informatiques semble également pertinente pour garantir la protection des données. Finalement, une déclaration transparente de l’usage de l’IA dans les projets d’évaluation semble devenir une pratique recommandée pour maintenir l’intégrité professionnelle.
Cette rencontre a confirmé l’intérêt croissant pour l’IA dans le domaine de l’évaluation, tout en soulignant l’importance de l’esprit critique et d’une intégration éthique et réfléchie de ces outils dans les projets. Il en ressort également qu’il reste un potentiel important à exploiter et l’envie de maîtriser davantage les diverses possibilités existantes actuellement sur le marché. Une prochaine rencontre est prévue fin 2025 pour échanger sur les expériences faites d’ici là. Toutes et tous les intéressé.e.s sont les bienvenu.e.s !
Déclaration d’usage de l’IA : Pour réaliser cette note et à titre d’exercice, nous avons d’abord téléchargé la présentation PowerPoint de cette rencontre sur Claude AI et ChatGPT. Nous avons ensuite demandé à ces deux IA de rédiger un résumé de 300 mots pour une publication de la SEVAL. En tirant le meilleur parti des outputs des deux IA, le texte a alors été remanié et complété par l’auteur humain. La note a par la suite été corrigée et simplifiée sur DeepL Write, puis enfin relue par le deuxième auteur humain. Elle a finalement été traduite du français vers l’allemand en utilisant DeepL, avant d’être attentivement relue et corrigée par le deuxième auteur – germanophone. Cette approche a permis d’être plus exhaustif, de dépasser le blocage d’écriture initial et d’être plus rapide.
[1] Hense, Jan Ulrich (2025). Anwendungen Künstlicher Intelligenz in der Evaluation: Stand von Forschung und Praxis. PrEval Expertise 1/2025, Frankfurt/M. https://preval.hsfk.de/publikationen/preval-expertisen/expertise-1/2025
[2] Hense, Jan Ulrich (2025). Anwendungen Künstlicher Intelligenz in der Evaluation: Stand von Forschung und Praxis. PrEval Expertise 1/2025, Frankfurt/M. https://preval.hsfk.de/publikationen/preval-expertisen/expertise-1/2025