Éléments pour l'IA en classe | IA et EMI

Bulles informationnelles

Une grande partie des informations auxquelles nous sommes confrontés chaque jour sont personnalisées. Contenus sur Facebook, Twitter, Instagram ou d’autres médias sociaux, publicités, recommandations, moteurs de recherche,tous adaptent le contenu qu’ils proposent à votre profil.

C'est le modèle économique le plus courant du Web et celui qui a fait la fortune des GAFA.

De la même manière, deux internautes faisant la même recherche sur le même moteur de recherche n'auront pas forcément les mêmes réponses dans le même ordre, ou même les mêmes prix. Ça fait beaucoup de mêmes :-)

Même les journaux s'y mettent et le New York Times ou le China Daily adaptent leur page d’accueil comme Facebook ou Youtube

Objectif ?
Votre attention ! Autrement dit votre temps de cerveau disponible.

Pourquoi ?
Tout simplement pour vous proposer le plus de pubs possibles

Combien ?
6 milliards, c'est le marché de la pub digitale

Comment ?
Différents moyens dont l'achat de mots clés sur Google et consors, le référencement priorisé (pour apparaître en haut des réponses), les publicités ciblées sur les réseaux sociaux, entre autres…

L'économie de l'attention

Et tout est bon pour vous vendre de la pub, y compris raconter n'importe quoi, faire le buzz, quitte à détruire la vie de personnes qui n'ont rien demandé, même si c'est illégal.

Sauf que liker, c'est être responsable.

C'est quoi l'économie de l'attention ? / Décodage - Info ou Mytho ?

Facebook, Twitter, Snapchat, Instagram... Les géants du numérique sont accusés de vouloir nous rendre accros à leurs applis parce que ton attention, c'est de l'argent. Décodage !

source : Rubrique d'Éducation aux médias et à l'information du magazine GEO Ado

Il existe des plateformes sur lesquelles ce ne sont pas des algorithmes qui décident de votre environnement informationnel mais des humains.

Citons par exemple tournesol, qui permet de comparer deux vidéos entre elles selon plusieurs critères pour considérer un contenu d'utilité publique ou non. À partir des avis des contributeurs, l'algorithme génère un score qui retranscrit l'utilité de la vidéo à partir des préférences des utilisateurs.

tournesol.apptournesol.app/

Deux ouvrages et 2 vidéos pour aller plus loin

lumni

Les algorithmes sont-ils totalitaires ?

Les algorithmes sont des applications très utiles mais restreignent la diversité de nos choix. Ils comportent un effet-bulle (on n’échange plus qu’avec des gens comme nous) et ils portent avec eux une logique omniprésente de la notation et du classement.

source : Lumni

La semaine des médias 2018 - Les bulles informationnelles ?

Facebook, Google et les autres connaissent parfaitement les goûts et orientations politiques des internautes. Du coup, ils leur refilent ce qu’ils aiment, uniquement. Le reste du monde et les opinions différentes n’existent plus. On vit alors enfermé dans une bulle informationnelle.

source : RTS

Mais est-ce si vrai ?

Sur Facebook, Twitter ou autre, l’information qui nous arrive est sélectionnée et hiérarchisée par des programmes informatiques qui nous donnent à voir ce qui est censé nous intéresser le plus, en fonction des contenus que nous partageons le plus, ou sur lesquels nous cliquons. Cela crée nécessairement un biais.
Ce biais ce sont les “bulles de filtres” qui nous empêcheraient de voir d’autres opinions que celles que l’on partageait déjà.

Xavier de La Porte dit qu'il faut ici retenir 3 points.

  • Si beaucoup de gens s’informent via les réseaux sociaux - et donc sont susceptibles de subir la bulle de filtre - ce n’est pas la majorité.
  • Les gens qui s’informent principalement par les réseaux sociaux ont tendance à être exposés à plus grande diversité de sources que ceux qui s’informent ailleurs. Ceux qui lisent les journaux n’en achètent en général qu’un, qu’ils ont choisi.
  • Plein de gens ne cherchent pas particulièrement à s’informer. Mais parmi ceux-là, ceux qui fréquentent les réseaux sociaux tombent incidemment sur des articles et des vidéos partagés dans les réseaux, et sont donc plus enclins, finalement, à être en contact avec des informations.

Les “bulles de filtres”

source : Xavier de La Porte

Biais cognitifs et fake news

Fakenews VS cerveau 🧠 avec @HugoDecrypte

Pourquoi les fake news ont-elles tant de succès ? Comment les combattre ? Avec HugoDécrypte, nous avons mis les gants. 🥊 Prêts à "démonter" les infox et partager les techniques autour de vous ? C'est parti dans #ChezJamy 🤓

source : Jamy - Epicurieux

L'internet des objets

L'Internet des objets (The Internet of Things ou IoT) est un réseau d'appareils physiques, de véhicules, d'appareils électroménagers et d'autres objets intégrés à l'électronique, aux logiciels, aux capteurs et à la connectivité, qui permet à ces objets de collecter et d'échanger des données. L'IoT permet à ces appareils d'être connectés et contrôlés sur Internet, pour interagir les uns avec les autres et avec les gens de manière nouvelle et innovante.

Dans l'éducation, les appareils IoT peuvent être utilisés pour faciliter l'apprentissage à distance, permettant aux étudiants d'accéder aux ressources pédagogiques et de se connecter avec les enseignants de n'importe où.

Quand l'internet des objets est associé à l'intelligence artificielle (combinaison entre l’IA et l’IoT appelée aussi AIoT), elle devient caméras de sécurité, véhicule autonome ou ville intelligentes (Smart City).

Pour plus d'informations, voir le module dédié.

emi.re => Informatique et objets

Les puces IA

Les GPU Nvidia H100, H200 et désormais B100 ou B200 sont conçus pour entraîner des modèles d’IA, puis pour exécuter les modèles qu’ils ont entraînés. Ils ont fait la fortune de Nvidia.
Les américains dominent actuellement très largement le marché des puces IA avec une dizaine de fournisseurs (Alphabet (Google), AMD, Apple, AWS, Cerebras, Groc, Cerebras, IBN; Intel, Qualcomm, tensTorrent). Mais l'on assite également à la montée en puissance de Huawei.

Les voitures autonomes sont-elles morales ?

Les voitures autonomes ont-elles une morale ?

Le dilemme du tramway fait réfléchir depuis un demi-siècle : est-ce qu’il vaut mieux laisser mourir 5 personnes ou choisir de n’en tuer qu’une en actionnant un aiguillage ? Mais si vous deviez vous-même pousser une personne pour en sauver 5 ?

Ce dilemme trouve une nouvelle actualité tout aussi traumatisante : qu’en pensent les voitures autonomes ? Doivent-elles avoir une morale, et laquelle ?

Voir également le site : www.moralmachine.net/hl/fr

source : ARTE

Petite histoire de la traduction automatique

Cette histoire commence dans les années 1950, est d'abord celle d'une longue déception. On pensait alors que la traduction automatique allait rapidement résoudre un grand nombre de problèmes et beaucoup de traducteurs se sont mis à craindre pour leur emploi.

Dans la réalité, il a fallu attendre les toutes dernières années pour que la traduction soit réellement efficace (qui s'aperçoit que la page qu'il lit est en fait une traduction instantanée).

S'il reste indispensable, pour l'instant, de passer par l'humain pour les textes réellement importants, la traduction s'est soudain mise à fonctionner.

Il n'en reste pas moins vrai que plus aucun professeur de langue n'aurait plus l'idée de donner un devoir à la maison consistant à traduire un texte.
Google translate, Bing translator ou deepl sont passés par là.

Comment ca s'est mis à marcher ?

Inside Google Translate

Comment fonctionne la traduction automatique ? Eh bien non pas à partir de règles mais de modèles statistiques.

Au début, les chercheurs tentaient d'apprendre un certain nombre de règles grammaticales comme on le ferait pour un humain.
Sauf qu'il y a beaucoup d'exceptions…

Du coup plutôt que d'essayer de tenter d'inculquer les règles, on s'est dit qu'il valait mieux que le système les apprenne de lui-même.

Et pour cela, trouver ces règles à partir de milliers et de milliers de documents que l'on sait correctement traduits.

source : Google

Pourquoi est-ce si difficile ? Pourquoi rien ne se passé des années 50 jusqu'aux années 80 ? Et pourquoi soudain cela marche ? Pourquoi les réseaux de neurones se sont mis a fonctionné ?

source : Le code a changé / Xavier de La Porte

https://www.deepl.com/fr/translator

Le lip synk ou synchronisation labiale

« La synchronisation labiale (parfois appelée lip sync par anglicisme) est, dans le domaine de l'audiovisuel, l'ensemble des techniques destinées à faire en sorte que semblent synchronisés, d'une part, le mouvement des lèvres d'une personne ou d'un personnage, et d'autre part, les paroles ou les sons qu'il est censé prononcer, dans les situations où l'un et l'autre sont enregistrés ou diffusés par des moyens différents et qu'il faut les réunir.
source : Wikipedia

En vidéo, la synchronisation labiale consiste à remplacer une voix dans une autre langue par les mouvements labiaux du locuteur dans sa langue d'origine et à les faire correspondre. Problèmes de traduction, de tons spécifiques, cette synchronisation n'est pas simple et est longtemps restée affaire de spécialistes.

C'est et ce sera de plus en plus souvent une tâche assistée ou réalisée par une IA.

3 exemples

Traduction, biais, sexisme…

Activités

Exercice sur les biais, le sexisme…

Pour mettre en lumière les éventuels biais ou clichés véhiculés par les algorithmes, l'on pourra, par exemple, utiliser google translate.

Pour cela, l'on va traduire un même texte contenant des professions au féminin plusieurs fois dans diverses langues en utilisant les petites flèches.

Que pouvons-nous constater ?

Moteur de réponses ou de recherche ?

Un moteur de réponse est une évolution du moteur de recherche dont le but est de fournir à l'internaute des réponses à ses questions plutôt que des listes de ressources pouvant répondre à ses questions.

Le mode d'interrogation se rapproche du langage naturel et plus cette suite de mots clés éventuellement reliés par des opérateur logiques.

Testons avec cette question
A quelle heure a lieu le lever Lune ce jour à Saint-Denis de La Réunion ?

Droit de fouille et droit d'auteur

Artistes face à l'IA : que reste-t-il du droit d'auteur ?

IA comme intelligence artificielle et DA comme droit d'auteur. Quatre lettres qui ne s'entendent pas toujours et qui s'entremêlent en générant de nouvelles problématiques. A la une de la presse, les tribunes de créateurs inquiets abondent, qu'ils soient artistes visuels, romanciers ou journalistes. Tous s'alarment de ces IA génératives qui puisent dans leurs œuvres sans leur donner de monnaie d'échange.

source : Le Meilleur des mondes. France Culture

Le droit de fouille ou « DATA MINING »

Le droit de fouille ou « data mining » est la faculté donnée notamment aux créateurs d’outils d’intelligence artificielle, d’aller puiser dans les données de tiers accessibles sur Internet, afin d’améliorer les résultats générés par ces IA.

IA et EMI

Ce droit résulte des articles 3 (fouille des textes et de données à des fins de recherche scientifique) et 4 (exception ou limitation pour la fouille de textes et de données) de la directive européenne n°2019/790 du 17 avril 2019 sur le droit d’auteur et les droits voisins dans le marché unique numérique. Ces droits ont été intégrés aux articles L122-5 et suivants du code de la propriété intellectuelle.

Il reste cependant possible de s'opposer à cette fouille. Cette opposition n’a pas à être motivée et peut être exprimée par tout moyen. Dans le cas de contenus mis à la disposition du public en ligne, cette opposition peut notamment être exprimée au moyen de procédés lisibles par machine, y compris des métadonnées, et par le recours à des conditions générales d’utilisation d’un site internet ou d’un service.

IA et EMI

Le débat suscité par l’IA s’est particulièrement focalisé sur le respect des droits d’auteur. Or, l’enjeu essentiel ne tient-il pas au fait que de nombreux résultats générés par l’IA concurrencent désormais directement les créations ayant servi à leur élaboration.

Philosophie de l'IA

Ressembler à un humain signifie-t-il être intelligent ?

Qui L’une des critiques adressées au test de Turing en tant que test d’intelligence est qu’il mesure plus la ressemblance du comportement de l’ordinateur avec celui de l’être humain que son intelligence.

De nouveaux tests sont apparus, par exemple celui de la chambre chinoise.

philomedia.bephilomedia.be

Wikipédia

Enthoven vs. ChatGPT : QUI EST L'IMPOSTEUR ?

L'IA serait incapable de trouver une problématique . Lecture critique du livre d'Enthoven. Démonstration.

source : https://www.youtube.com/@MonsieurPhi

Voir également les débatLes limites de l'IA — ENTHOVEN vs M. PHI

source : La Tronche en Biais surYoutube.

La preuve définitive que ChatGPT ne comprend rien

Sur l'argument de la chambre chinoise.

source : https://www.youtube.com/@MonsieurPhi

Éthique

Les implications sociétales de l’IA

Les implications sociétales de l’IA La deuxième partie de ce cours sur l'IA traite des implications sociétales de l'IA.

Partialité des algorithmes avec une discrimination fondée sur l’appartenance ethnique, le sexe ou d’autres facteurs lors de la prise de décisions concernant les demandes d’emploi, les prêts bancaires, etc.

Les réseaux sociaux peuvent facilement amplifier les partis pris existants, même s’ils sont très légers au départ.

Autre question, celle de la désanonymisassion, c’est-à-dire la levée de l’anonymat de données dont nous pensions qu’il était assuré.

Ce ne sont ici que quelques points de ceux abordés dans ce cours en ligne gratuit.

course.elementsofai.com/
cafe pedagogique

L’Intelligence Artificielle est-elle compatible avec les humanités ?
Un article du Café pédagogique vous propose de faire le point.

Lien vers l'article

« La présente Recommandation a pour objet de servir de base afin de mettre les systèmes d’IA au service de l’humanité, des individus, des sociétés, de l’environnement et des écosystèmes, ainsi que de prévenir les préjudices. Elle a également pour vocation de favoriser l’utilisation pacifique des systèmes d’IA. »

Cependant, trois éléments occupent une place centrale dans cette approche éthique :

  • Les systèmes d’IA sont des technologies de traitement des informations qui intègrent des modèles et des algorithmes, lesquels génèrent une capacité d’apprentissage et d’exécution de tâches cognitives conduisant à des résultats tels que l’anticipation et la prise de décisions dans des environnements matériels et virtuels.
  • Les questions éthiques concernant les systèmes d’IA se rapportent à toutes les étapes du cycle de vie de ces systèmes, compris ici comme allant de la recherche, la conception et le développement au déploiement et à l’utilisation, et incluant la maintenance, l’exploitation, la commercialisation, le financement, le suivi et l’évaluation, la validation, la fin de l’utilisation, le démontage et la mise hors service.
  • Les systèmes d’IA soulèvent de nouveaux types de questions éthiques qui comprennent, sans s’y limiter, leur impact sur la prise de décisions, l’emploi et le travail, les interactions sociales, les soins de santé, l’éducation, les médias, l’accès à l’information, la fracture numérique, la protection des consommateurs et des données personnelles, l’environnement, la démocratie, l’état de droit, la sécurité et la police, le double usage et les droits de l’homme et les libertés fondamentales, y compris la liberté d’expression, la protection de la vie privée et la non-discrimination.
    En outre, de nouveaux défis éthiques sont générés par la reproduction et le renforcement potentiels des biais existants par les algorithmes d’IA, ce qui exacerbe des formes déjà existantes de discriminations, de préjugés et de stéréotypes.

Guide au format PDF

Plus d'infos

Pour le dataïsme, l’univers consiste en flux de données (data), et ce sont exactement les mêmes lois mathématiques qui s’appliquent aux algorithmes biochimiques et électroniques. Ce faisant, il fait tomber la barrière entre animaux et machines et attend des algorithmes électroniques qu’ils finissent par surpasser les algorithmes biochimiques.

La société toute entière est alors perçue comme un système de traitement de données.

Centralité des données
Les données sont vues comme le fondement de la connaissance et de la prise de décision. Elles sont collectées, analysées et utilisées pour comprendre des phénomènes complexes, prédire des comportements, et optimiser des processus dans divers domaines, allant des affaires à la santé publique.

Tout est quantifiable
"Tout est nombre" : telle était la devise de l'école pythagoricienne qui proclamait que les dieux avaient ordonné l'univers par des nombres. Le dataïsme postule que presque tous les aspects de la vie humaine et des systèmes naturels peuvent être quantifiés et analysés sous forme de données. Cela inclut les comportements, les pensées, les interactions sociales, les processus biologiques, etc.

Automatisation et intelligence artificielle
Le développement et l'intégration de l'intelligence artificielle et des algorithmes dans divers secteurs sont vus comme des moyens de traiter et d'exploiter les données de manière efficace. Les machines et les systèmes automatisés sont perçus comme capables de surpasser les capacités humaines dans l'analyse et la prise de décision basée sur les données.

Optimisation et efficacité
Les données sont utilisées pour améliorer les performances, réduire les coûts et maximiser les résultats dans des domaines variés, comme l'économie, la gestion des ressources, et même la politique.

Transparence et accessibilité
Dans une vision idéaliste du dataïsme, les données devraient être accessibles à tous et utilisées de manière transparente. Cela pose cependant des défis et des questions éthiques concernant la confidentialité, la sécurité, et la manipulation des données.

Éthique et gouvernance des données
La montée du dataïsme soulève des questions éthiques importantes concernant la propriété des données, la vie privée, la surveillance, et le contrôle.