Pour qu'un ordinateur puisse reconnaître un texte, une image ou un son, il doit d'abord s'entraîner, c'est le « machine learning ».
Pour cela, on va lui soumettre d'immenses quantités de données, de préférence de type image / description, l'on parle d'images catégorisées ou de traductions vérifiées.
Vous comprenez ici mieux pourquoi l'on vous demande souvent de mettre un nom sur un visage.
Sur
"copains d'avant" ou Facebook, c'est d'abord vous et pas une quelconque IA qui est le meilleur
informateur.
Extrait du colloque conjointement diffusé le 28 sept. 2023 par le Campus de l’Innovation pour
les Lycées et par Sciences Po, ce colloque propose de nous interroger sur l’intelligence
artificielle et les nombreux défis qu’elle nous impose. Il s'adresse principalement aux
élèves de première et terminale issus des réseaux d'éducation prioritaire.
Partie
extraite. Benoît Sagot, directeur de recherche à l’Inria et professeur invité à occuper la
chaire annuelle Informatique et sciences numériques du Collège de France, nous initiera à
« L’apprentissage profond, au cœur de l’IA moderne ».
Pour tout savoir sur les LLM en 3h 30, une vidéo en anglais d'Andrej Karpathy, un informaticien slovaco-canadien qui a été directeur de l'intelligence artificielle et du pilotage automatique chez Tesla.
On pense, souvent un peu vite, que la réalité est une donnée que nous percevons, oubliant par-là que c'est d'abord une construction de notre cerveau.
Pour réaliser ce que vous faites ici facilement, une IA doit analyser des milliers et des milliers voire des millions de visages avec un nom.
Par exemple pour reconnaître un chat il faut plusieurs dizaines de milliers de photos de chats identifiés comme tels.
Dans son
article de 1950, Alan Turing
affirmait que les systèmes d’IA seraient un jour si performants au jeu de l’imitation humaine
qu’un
interrogateur humain n’aurait pas plus de 70 % de chances de faire la différence entre la
machine et
l’humain en 5 minutes d’interaction.
Autrement dit, pour qu’une machine passe le test de
Turing,
elle doit obtenir un score de 30 %.
Dans une expérience, 500 participants sont divisés en 4 groupes dont l’un devait discuter avec un humain. Les conversations ont duré cinq minutes. Les participants devaient ensuite annoncer si leur interlocuteur était selon eux humain ou non.
Les taux de réussite étaient les suivants :
Pour tester les IA (Benchmark), l'on peut aussi avoir recourt a divers jeux de tests. En voici quelques-uns :
Le "Dernier examen de l'humanité" (Humanity's Last Exam - HLE) est un benchmark révolutionnaire développé conjointement par Scale AI et le Center for AI Safety (CAIS), conçu pour tester les limites de la connaissance de l'IA aux frontières de l'expertise humaine SafeScale. Il s'agit d'un benchmark multimodal comprenant 2 500 questions difficiles réparties sur plus d'une centaine de sujets académiques.
La répartition est la suivante. Mathématiques (41%), physique (9%), biologie/médecine (11%), sciences humaines/sociales (9%), informatique/IA (10%), ingénierie (4%), chimie (7%), et autres (9%). Chaque question a une solution connue, non ambiguë et facilement vérifiable, mais ne peut pas être résolue rapidement par une recherche internet.
Ce benchmark soulève des questions fondamentales sur l'avenir de l'éducation :
Plus qu'un simple benchmark technique, c'est un marqueur civilisationnel qui interroge la place de l'intelligence humaine dans un monde où l'IA pourrait bientôt surpasser nos meilleures performances intellectuelles.
Cette phrase, vous la voyez assez régulièrement, accompagnée d'un CAPTCHA ou “Completely Automated Public Turing test to tell Computers and Humans Apart”, autrement une variante de tests de Turing permettant de différencier de manière automatisée un utilisateur humain d'un ordinateur. Ce test de défi-réponse est utilisé en informatique pour vérifier que l'utilisateur n'est pas un robot.
Dans la
première version, l'on vous
demandait de reconnaître des lettres. Sauf que très vite les robots les reconnaissaient aussi.
Sont alors arrivées les photos de rues et de feu rouges.
Notons ici que vous travaillez gratuitement pour enrichir la base de connaissance des IA,notamment en matière de conduite automobile en résolvant des problèmes difficiles à résoudre pour un robot. Du "machine learning" à votre insu.
Combien des cases de passages piétons auriez-vous coché ?
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
Ce
CAPTCHA tend à disparaître au profit
d'une simple case à cocher. Simple, n'est pas ici exactement le mot, puisque que c'est la
manière même (temps, déplacement de la souris etc.) qui va déterminer si vous êtes un humain.
Ce dernier type de vérification va d'ailleurs aussi être remplacé par une analyse de comportement face à l'écran.
Ce sera la fin du CAPTCHA.
La base de
données MNIST pour "Modified ou Mixed National Institute of Standards and Technology", est
une base de données de chiffres écrits à la main. C'est un jeu de données très utilisé en
apprentissage automatique.
La reconnaissance de l'écriture manuscrite est un problème difficile, et un bon test pour les algorithmes d'apprentissage. La base MNIST est devenue un test standard. Elle regroupe 60 000 images d'apprentissage et 10000 images de test.
Mais avant d'aspirer tout le web, cela a commencé bien plus modestement.
Quand un tout jeune enfant regarde une photo, il peut identifier des éléments simples : un chat, un livre, une chaise. Aujourd'hui, les ordinateurs sont assez intelligents pour faire la même chose. Et après ? Dans cette passionnante conférence, la spécialiste en vision par ordinateur Fei-Fei Li décrit où nous en sommes : la base de données de 15 millions de photos mise en place par son équipe pour « enseigner » à un ordinateur à comprendre des photos, et un aperçu de ce qui reste encore à faire.
Surgemini.google.com/appcopiez-collez le prompt suivant
Le Generative Adversarial Network (GAN) ou réseaux antagonistes génératifs (RAG) sont une classe d'algorithmes d'apprentissage non supervisé.
L'apprentissage non supervisé désigne la situation d'apprentissage automatique où les données ne sont pas étiquetées (par exemple étiquetées comme « pouce » ou « Le Carnaval d’Arlequin. Peinture de Joan Miró »).
Un GAN est un modèle génératif où deux réseaux sont placés en compétition dans un scénario de théorie
des jeux. Le premier réseau est le générateur, il génère un échantillon (ex. une image), tandis que
son adversaire, le discriminateur essaie de détecter si un échantillon est réel ou bien s'il est le
résultat du générateur.
Ainsi, le générateur est entrainé avec comme but de tromper le
discriminateur.
Qu'est-ce qu'a bien pu faire la start-up chinoise DeepSeek pour secouer le monde de la
tech ?
Pour le comprendre, on se demande comment passer d'un simple compléteur
de texte, à un assistant IA capable de raisonner !
Stable Diffusion, Midjourney ou DALLE 2.
Le principe de ces algorithmes d'intelligence
artificielle qui savent générer des images à partir d'un texte.
Les réseaux de neurones, également connus sous le nom de réseaux de neurones artificiels (ANN) ou
réseaux de neurones simulés (SNN) sont constitués de couches nodales, contenant une couche d'entrée,
une ou plusieurs couches cachées et une couche de sortie.
Chaque nœud, ou neurone artificiel, se
connecte à un autre et possède un poids et un seuil associés. Si la sortie d'un nœud est supérieure
à la valeur de seuil spécifiée, ce nœud est activé et envoie des données à la couche suivante du
réseau. Sinon, aucune donnée n'est transmise à la couche suivante du réseau.
Les réseaux de neurones s'appuient sur des données d'entraînement pour apprendre et améliorer leur précision au fil du temps.
Quatre des applications importantes des réseaux neuronaux.
Les réseaux neuronaux artificiels apprennent en permanence en utilisant des boucles de
rétroaction corrective pour améliorer leur analytique prédictive.
En termes simples, vous
pouvez imaginer que les données circulent du nœud d'entrée au nœud de sortie par plusieurs
chemins différents dans le réseau neuronal. Un seul chemin est le chemin correct qui relie le
nœud d'entrée au nœud de sortie correct. Pour trouver ce chemin, le réseau neuronal utilise une
boucle de rétroaction, qui fonctionne comme suit :
Dans l'apprentissage supervisé, les réseaux de neurones "s'entrainent" sur des jeux de données
étiquetés qui fournissent la bonne réponse à l'avance.
Par exemple, un réseau de deep
learning s'entraînant à la reconnaissance faciale traite initialement des centaines de milliers
d'images de visages humains, avec divers termes liés à l'origine ethnique, au pays ou à
l'émotion décrivant chaque image.
En coproduction avec l'INRIA et S24B, une série d'exercices et de vidéos pour mieux comprendre le fonctionnement de l'IA.