Le Grand Lexique de l’Intelligence Artificielle : le glossaire pour mieux comprendre l’IA

Chez Micelia, notre ambition est de démystifier l’IA pour qu’elle soit compréhensible par tous.

Voici un glossaire complet, reprenant les principaux concepts utilisés par les experts et la littérature spécialisée, avec des explications simples et imagées.

‍

A

Adversarial AI (IA antagoniste)

‍Techniques visant à tromper un modèle en introduisant des données malveillantes ou ambiguës lors de l’entraînement, pour le rendre plus robuste ou l’induire en erreur.

AI Act

Règlement européen encadrant le développement, l'utilisation et la commercialisation de systèmes d'intelligence artificielle. Il classe les systèmes en niveaux de risques (minimal, limité, élevé, interdit) et impose des obligations en conséquence (transparence, supervision humaine, etc.).

‍Algorithme

‍Suite d’instructions permettant de traiter des données et produire un résultat. Comparable à une recette permettant de transformer les ingrédients en plat fini.

‍Annotation

‍Étiquetage manuel, semi-automatique voire automatique, de données (par ex. une image de chien avec son label indiquant qu'elle représente un chien). Utilisé en phase d’apprentissage supervisé comme vérité terrain.

Apprentissage actif

‍Méthode semi-supervisée où l’opérateur sélectionne des exemples pour annoter, afin d’optimiser l’entraînement.

Apprentissage automatique (Machine Learning)

Méthode d’intelligence artificielle qui permet d'apprendre des règles à partir des données, sans programmation explicite.

Apprentissage auto-supervisé

Approche de machine learning où le modèle apprend à partir de données non étiquetées en créant lui-même des pseudo-labels.

Apprentissage non-supervisé

Approche de machine learning où le modèle apprend à partir de données non étiquetées, sans supervision humaine.

Apprentissage par renforcement

Approche de machine learning où le modèle apprend par essai/erreur avec une récompense associée à un objectif, comme un joueur apprenant une stratégie gagnante.

Apprentissage profond

L'apprentissage profond utilise des réseaux neuronaux artificiels formant de nombreuses couches pour résoudre des tâches complexes. Très utile face à de grands volumes de données.

Apprentissage supervisé

Approche de machine learning où le modèle où l'algorithme s'entraîne à une tâche déterminée en utilisant un jeu de données étiquetées.

Apprentissage par transfert (Transfer Learning)

‍Utilisation d’un modèle déjà entraîné sur une tâche pour l'adapter à une autre avec peu de données.

Apprentissage continu

‍Un système qui s’améliore en intégrant de nouvelles tâches oun données après son déploiement, sans perdre les apprentissages passés (learning en production).

‍

B

Bagging

Le Bagging, ou Bootstrap Aggregating, est une technique d’assemblage (ensemble learning) puissante et polyvalente. Au lieu de se fier à un seul modèle, le Bagging exploite la sagesse de la foule en créant de multiples versions d’un même modèle, chacune entraînée sur un sous-ensemble différent de données d’entraînement. Random Forest est l’exemple le plus connu.

Base de données

Une base de données est un ensemble d'informations structurées et organisées de manière à être facilement accessibles, gérées et mises à jour. C’est un élément essentiel à tout projet IA.

Batch

Un batch est un lot de données. La taille du batch correspond au nombre de données qui sont "montrées" à l'algorithme avant que les poids/paramètres du modèle soient recalculés.

Batch Normalization

Une des techniques de régularisation les plus puissantes en Deep Learning pour faciliter le processus d’apprentissage. La normalisation par lots vise à accélérer l’apprentissage et améliorer la stabilité de l’entraînement.

Bayésien.nes

Les méthodes bayésiennes sont des méthodes d’inférence statistique qui consistent à attribuer une probabilité aux hypothèses, puis à mettre à jour ces probabilités en fonction des observations, selon le théorème de Bayes.

Biais

Distorsion statistique dans les données ou les modèles, qui entraîne des résultats partiaux ou injustes. Exemple : un modèle de recrutement entraîné sur des données historiques biaisées peut favoriser un genre ou une origine.

Bibliothèque (ou library)

Ensemble de fonctions et d’outils prêts à l’emploi permettant de créer, entraîner ou déployer des modèles IA. Exemples : TensorFlow, PyTorch, scikit-learn.

Big Data

‍Données numériques massives caractérisées par leur volume, leur vélocité et leur variété. Elles sont notamment utilisées pour entraîner et généraliser les modèles d’IA.

Bounding box (boîte englobante)

Rectangle délimitant un objet détecté dans une image. Utilisé en vision par ordinateur pour la détection d’objets. Par exemple : encadrer une voiture dans une image de rue.

Boosting

Technique d’apprentissage séquentielle qui combine des apprenants faibles pour former un modèle fort, chaque itération corrigeant les erreurs des précédentes afin d’améliorer la précision.

C

Chatbot

Aussi appelé agent conversationnel, il s’agit d’un logiciel qui vise à simuler le dialogue en langage naturel avec un utilisateur. Certains reposent sur des arbres décisionnels classiques quand d’autres s’appuient sur de grands modèles de langage.

ChatGPT

ChatGPT est un agent conversationnel, communément appelé chatbot, développé par OpenAI et lancé le 30 Novembre 2022. Il se base sur les différentes versions du modèle GPT (ajourd'hui GPT-5).

Chunk

Morceau ou segment de données, souvent utilisé dans les modèles LLM pour découper les documents en parties plus petites à traiter (ex : chunk de 512 tokens).

Classification

Tâche consistant à assigner une étiquette ou catégorie à une donnée (ex. spam ou non spam pour un e-mail).

Classifieur

Modèle ou algorithme chargé d’effectuer la classification. Ex : un modèle SVM ou un arbre de décision sont des classificateurs.

Clustering

Il s’agit d’une méthode permettant de diviser un ensemble de données en différents sous-ensembles homogènes, partageant des caractéristiques communes, des clusters.

CNN

Réseau de neurones convolutifs en français. Un Convolutional Neural Network (CNN) est une architecture spécifique de réseaux de neurones utilisée en Deep Learning notamment.

Compilateur

Système qui traduit des instructions écrites en langage de haut niveau, comme celles de PyTorch ou TensorFlow, en langage machine, ou code, GPU ou CPU hautement efficace.

Compute

‍Puissance de calcul nécessaire à l’entraînement ou l’inférence (CPU, GPU, TPU). Mesurée en FLOPS, elle impacte performance et coût.

Computer Vision (vision par ordinateur)

‍Domaine applicatif de l'IA concernant l'extraction d'informations depuis des images ou vidéos : détection et reconnaissance d’objets, visages, etc.

Context engineering

L'ingénierie contextuelle consiste à construire l'intégralité des informations accessibles pour un LLM : pas seulement un prompt, mais toutes les données, exemples et conseils pertinents nécessaires à la tâche.

Contrastive Learning

L'apprentissage contrastif en français. C’est une technique d'apprentissage automatique qui apprend aux modèles à distinguer des échantillons différents tout en regroupant les éléments similaires sans que les données ne soient étiquetées.

Convolution

Opération mathématique utilisée dans les réseaux de neurones convolutifs (CNN), principalement pour l’analyse d’images. Elle permet d’extraire des motifs comme les contours, textures, etc.

Copilot

Comme ChatGPT, Copilot est un chatbot basé sur un grand modèle de langage (LLM). Il est développé par Microsoft et a été lancé le 7 février 2023.

Courbe ROC

La courbe ROC est une représentation visuelle des performances du modèle pour différents seuils de décision.

CPU

Le CPU (Central Processing Unit), autrement dit unité centrale de traitement ou processeur, il est l’une des pièces les plus importantes d’un ordinateur. En effet, il va permettre d’effectuer les échanges entre tous les composants d’un PC.

Cross-validation

Méthode qui sert à tester la performance des modèles sur l'ensemble des données par échantillonnage successif des données d'entraînement et de validation.

‍

D

Data / Données

Matière première de l’IA : ce sont les informations (textes, images, chiffres, sons…) utilisées pour entraîner, tester ou prédire avec un modèle.

Data Augmentation

‍Techniques d’enrichissement de jeu de données (ex. rotation, bruit, transformation) pour améliorer la généralisation des modèles.

Data Engineering

Discipline s’axant sur la structuration des flux de données. Elle consiste à les collecter, les stocker et les organiser pour mieux les traiter de manière appropriée et optimale.

Data Mining

Fouille de données, extraction automatique de connaissances à partir de grands ensembles de données.

Data Processing

Discipline consistant à traiter des données brutes pour les transformer en informations lisibles et exploitables pour de l’IA.

Data Science

Science des données, discipline englobant l’analyse et la valorisation des données par l’IA.

Dataset

‍Ensemble structuré de données (images, texte, transactions) utilisé pour entraîner ou évaluer un modèle IA.

Database

Base de données en français. Système de stockage et de gestion de données, souvent plus complexe et dynamique. Une base de données peut comporter de nombreux datasets différents.

Deepfake

‍Contenus audio/vidéo générés par IA imitant de façon réaliste une personne existante, souvent à des fins trompeuses.

Deep Learning (Apprentissage profond)

‍Sous-catégorie du Machine Learning utilisant de très grands réseaux de neurones multicouches pour extraire des représentations complexes.

Deep Search (ou Raisonnement Profond)

Approche avancée en intelligence artificielle qui combine des modèles de langage (LLM) avec des capacités de raisonnement sur plusieurs étapes pour résoudre des problèmes complexes ou répondre à des questions multi-niveaux.
Exemple : plutôt que de répondre directement à "Quel est le lien entre la Révolution industrielle et l’intelligence artificielle ?", un système de deep search va explorer des sous-questions intermédiaires, construire une chaîne logique, et fournir une réponse riche et cohérente.

Détection

Tâche de repérer la présence et la position d’un objet dans une image. Elle s’accompagne souvent d’une bounding box. Exemple : détecter tous les piétons dans une image de rue.

Descente de Gradient

Algorithme d’optimisation qui ajuste les paramètres d’un modèle en suivant la direction opposée au gradient pour minimiser une fonction de coût.

Diffusion

Un modèle de diffusion est un modèle génératif qui apprend à créer des données nouvelles en inversant un processus de bruit progressif.

Distillation

La distillation des connaissances est une méthode d’optimisation de modèle où un modèle complexe (“teacher”) transfère son savoir à un modèle plus petit (“student”). L’idée est de réduire la taille, le coût de calcul et la latence tout en conservant les performances du modèle original.

‍

E

Encodeur

L'encodeur est le premier bloc d'un auto-encodeur, un type d’architecture de réseau de neurones conçu pour compresser efficacement (encoder) les données d’entrée vers leurs caractéristiques essentielles, puis reconstruire (décoder) l’entrée d’origine à partir de cette représentation compressée.

Edge AI (IA embarquée)

‍Exécution d’algorithmes d’IA directement sur des appareils périphériques (IoT, mobile), réduisant latence et préservant la confidentialité.

Embedding

Les embeddings sont des représentation vectorielle, et donc des représentations numériques, de données comme du textes des images ou des vidéos dans un espace d'embedding et qui capturent les relations entre les entrées.

Entraînement (Training)

Processus d’apprentissage d’un modèle à partir de données. Il consiste à ajuster ses paramètres internes (poids) pour qu’il minimise l’erreur sur un ensemble d’exemples connus.

Entrepôt de données

Système centralisant et stockant de grands volumes de données provenant de diverses sources pour en faciliter l'analyse et l'exploitation.

Epoch

L’Epoch (époque) désigne le nombre de fois où l’entièreté des données d’entraînement ont été observées par le modèle.

Evaluation

Processus visant à comprendre et valider la fiabilité de tout modèle d'IA, en s'appuyant sur les résultats obtenus en introduisant l'ensemble de données de test dans le modèle et en le comparant aux réponses réelles.

Explicabilité

Capacité à comprendre et justifier les décisions d’un système d’IA. Cela inclut savoir pourquoi un modèle a pris telle ou telle décision, essentiel pour la confiance, la conformité et l’éthique.

Extraction de caractéristiques

L’extraction de caractéristiques est l'étape au cours de laquelle sont induites depuis des données brutes (son, image, texte, tableau numérique, etc.) des caractéristiques sur lesquelles le système d’IA doit se reposer pour effectuer la tâche pour laquelle il est conçu.

‍

F

Feature (Caractéristique)

Variable ou attribut utilisé par un modèle pour faire des prédictions. Ex : pour prédire le prix d’un bien immobilier, les features peuvent être la surface, la localisation, le nombre de pièces…

Few-Shot Learning

Capacité d’un modèle à apprendre à partir d’un petit nombre d’exemples. Plutôt que d’avoir besoin de milliers d’entrées annotées, on montre au modèle 1 à 10 exemples, et il généralise la tâche.
Exemple : apprendre à reconnaître un nouveau type d’insecte à partir de 5 images seulement. C’est une alternative légère au fine-tuning, très utilisée avec les modèles de langage comme GPT.

Fine-tuning

Affinage d’un modèle pré-entraîné sur un nouveau jeu de données spécifique, pour adapter ses performances à un cas d’usage particulier. Exemple : affiner GPT pour comprendre un jargon métier.

Fonction d’activation

‍Fonction mathématique au sein d’un neurone artificiel déterminant s’il s’active selon certaines conditions.

Fonction de perte (Loss function)

‍Mesure de l’écart entre prédictions du modèle et réalité ; guide l’apprentissage.

Framework (Cadre de développement)

Ensemble d’outils, de bibliothèques et de bonnes pratiques structurées pour créer et déployer des systèmes IA. Les frameworks accélèrent le développement, assurent la reproductibilité et facilitent le passage de la recherche à la production.
Exemples célèbres : TensorFlow (par Google), PyTorch (par Meta) ,Hugging Face Transformers (pour les LLMs)

‍

G

GAN (Generative Adversarial Network)

‍Modèle génératif composé de deux réseaux (générateur vs discriminant) en compétition, capable de créer des images ou sons réalistes.

GenAI (IA générative)

‍Famille de modèles capables de créer des contenus originaux (texte, image, son…) à partir d’un prompt ou instruction.

Généralisation

Capacité d’un modèle à bien fonctionner sur des données nouvelles, jamais vues pendant l'entraînement.

‍

H

Human-in-the-loop (HITL)

‍Approche mixte où l’humain intervient pour guider, corriger ou valider les décisions de l’IA.

Hyperparamètre

‍Paramètre choisi avant l’apprentissage (ex. taux d’apprentissage, taille du batch), qui impacte le comportement du modèle.

Hyperparameter Optimization

‍Recherche automatique des meilleurs hyperparamètres via méthode (grid search, Bayesian optimization).

‍

I

IA faible / étroite

‍Systèmes conçus pour une tâche spécifique, sans intelligence générale ou conscience.

IA forte (AGI)

‍Intelligence artificielle générale hypothétique, comparable à l’intelligence humaine dans tous les domaines.

IA hybride

‍Combinaison d’approches symboliques (règles explicites) et statistiques (deep learning), pour allier performance et explicabilité.

Inférence

Phase pendant laquelle un modèle déjà entraîné est utilisé pour faire une prédiction ou une recommandation à partir de nouvelles données.

Intersection over Union (IoU)

Mesure de performance utilisée en détection d’objets. Elle compare la zone d’une bounding box prédite avec la zone de vérité terrain (ground truth). Une IoU proche de 1 indique une excellente détection.

Itération

Cycle complet d’un processus d’apprentissage ou d’optimisation (ex. un passage complet sur l’ensemble des données d’entraînement). Plusieurs itérations sont nécessaires pour converger vers un bon modèle.

‍

J

Jeton textuel (Token)

‍Unité linguistique (mot ou sous-partie) traitée par un LLM lors de la génération ou l’analyse.

‍

L

Latence

Temps nécessaire entre l’envoi d’une requête à un modèle et la réception de sa réponse. En IA, faible latence = réponse rapide, très important en temps réel (voiture autonome, assistants vocaux…).

Layer (Couche)

Niveau d’un réseau de neurones où s’effectuent des calculs. Les modèles IA sont empilés en couches successives, chaque couche apprenant des représentations de plus en plus complexes.

LLM (Large Language Model / Grand modèle de langage)

‍Modèle entraîné sur d’énormes corpus textuels pour générer ou comprendre du langage naturel à grande échelle.

LoRA

Méthode permettant d'adapter un modèle d'IA, notamment les modèles de diffusion, à des tâches plus spécifiques sans avoir besoin de réentraîner l'ensemble du modèle

‍

M

Machine Learning (Apprentissage automatique)

Sous-domaine de l’IA où les systèmes apprennent automatiquement à partir des données, sans être explicitement programmés. On distingue l’apprentissage supervisé, non supervisé, et par renforcement.

MCP (Model Context Protocol)

Norme qui permet aux grands modèles de langage (LLM) de se connecter de manière sécurisée et bidirectionnelle à diverses sources de données et outils externes.

Modèle

‍Structure algorithmique dotée de paramètres (poids) apprise à partir de données pour accomplir une tâche spécifique.

Modèle discriminatif

‍Algorithme qui prédit l’appartenance d’un exemple à une classe (ex. classifier un email comme spam ou non).

Modèle génératif

‍Algorithme capable de générer de nouvelles données similaires aux données d’entraînement.

Modèle de fondation (Foundation Model)

‍Modèle pré-entraîné sur d’énormes volumes de données avec capacité générale adaptable à de nombreuses tâches.

Modèle pré-entraîné

‍Modèle initialement entraîné sur un grand corpus, puis affiné sur une tâche spécifique (fine tuning).

‍

N

Nearest Neighbors Search (Recherche de plus proches voisins)

Méthode utilisée pour retrouver, dans une base de données, les éléments les plus similaires à un point donné.

‍

O

On Premise

Déploiement d’un système (modèle IA, base de données…) sur l’infrastructure informatique locale d’une entreprise, plutôt que sur le cloud. Avantage : contrôle et confidentialité. Inconvénient : coûts d’entretien.

Open Data

Ensemble de données libres d’accès, pouvant être utilisées, modifiées et redistribuées par tous. Les gouvernements, institutions publiques, universités ou entreprises publient ces données pour favoriser la recherche, la transparence, et l’innovation.

Outlier (Valeur aberrante)

Donnée qui diffère significativement du reste de l’échantillon. Les outliers peuvent fausser l’apprentissage si non traités. Ex : un revenu de 1 million € dans un jeu de données de salaires typiques.

Overfitting (Surapprentissage)

‍Quand un modèle apprend trop les détails du jeu d’entraînement au détriment de sa capacité à généraliser à de nouvelles données.

‍

P

Pipeline de données

‍Chaîne d’étapes de traitement des données : collecte, nettoyage, transformation, stockage, partage.

Poids (Weights)

‍Paramètres du modèle appris durant l’entraînement, représentant l’impact de chaque connexion entre neurones.

Poisoning (Empoisonnement de données)

‍Injection de données malveillantes dans le jeu d’entraînement pour manipuler le comportement du modèle.

Prompt (Instruction générative)

‍Commande textuelle donnée à un modèle génératif pour générer du contenu contextuel (texte, image…).

‍

R

RAG (Retrieval-Augmented Generation)

Technique combinant recherche documentaire et génération : un modèle LLM va chercher l’info dans une base de données externe (ou documents) avant de répondre, augmentant ainsi la précision et la fraîcheur.

Random Forest (Forêt aléatoire)

Algorithme d’apprentissage automatique supervisé, composé de plusieurs arbres de décision (d’où la métaphore de la forêt).

Reinforcement Learning and Human Feedback (RLHF)

‍Renforcement combiné avec retours humains pour corriger et guider l’apprentissage, utilisé dans les LLMs modernes.

RIG (Retrieval-Informed Generation)

Variante du RAG où le système de génération est encore plus profondément guidé par les documents récupérés, parfois jusqu’au niveau de chaque mot. Cela permet des réponses très ancrées dans la source.

‍

S

Segmentation

Tâche de découpage d’image où chaque pixel est classifié. Elle permet de distinguer finement les objets et leurs contours. Exemple : distinguer chaque cellule dans une image microscopique.

Shadow AI

‍Utilisation d’outils d’IA sans supervision IT officielle, avec risques de sécurité et gouvernance.

Singularité (Technologique)

Hypothétique moment où l’IA dépasserait l’intelligence humaine dans tous les domaines et amorcerait une croissance auto-accélérée incontrôlable. Sujet de débats scientifiques et éthiques.

SLM (Small Language Model)

Modèle de langage de taille plus réduite que les LLMs, souvent déployé localement (edge, on-premise). Avantage : rapidité, confidentialité, coût. Exemple : LLaMA-2-7B.

Slop (IA slop)

‍Contenu de mauvaise qualité généré automatiquement, sans contrôle éditorial, inondant le web.

‍

T

Tâche (Task)

Dans le contexte de l’IA, une tâche désigne le problème spécifique que l’on cherche à résoudre avec un modèle.

Test de Turing

‍Test de capacités conversationnelles proposé par Alan Turing pour déterminer si une machine imite humainement l’intelligence.

Transformeur (Transformer)

‍Architecture de réseau neuronal à base d’attention utilisée pour les LLMs et modèles génératifs.

‍

U

Unsupervised Learning (Apprentissage non supervisé)

‍Machine apprend des structures dans des données non étiquetées, par exemple avec clustering ou PCA.

‍

V

Vision par ordinateur

‍Voir sous Computer Vision ci‑dessus.

VLM (Vision Language Model)

Modèle multimodal capable de traiter à la fois du texte et des images. Il peut par exemple répondre à des questions sur une image, générer des légendes ou traduire des éléments visuels en mots.

‍

Z

Zero-Shot Learning

Capacité d’un modèle à effectuer une tâche sans avoir vu aucun exemple spécifique au préalable.

‍