L'outil de référence pour atteindre l'excellence en sciences

Archives de la catégorie ‘1ère S’

NSI : Continuité pédagogique 3 juin au 10 juin

Travail à rendre pour le 10 juin.

Rendre les questions A, B, C, D (bas de page), dans la rubrique Messagerie > Envoyer un fichier sur picassciences.com avant le 10 juin.

Les algorithmes d’intelligence artificielle

Pour cette semaine, nous allons nous intéresser à un algorithme d’intelligence artificielle, qui permet d’identifier les éléments d’une photo. Vous pouvez essayer un algorithme de classification à l’adresse suivante : https://cloud.google.com/vision/docs/drag-and-drop

Prenez n’importe quelle photo, l’algorithme sera capable de la classifier.

Comment ça marche ?

Source : https://www.science.lu/fr/bande-dessinee/frontiere-entre-sciences-biomedicales-informatiques

L’algorithme des k plus proches voisins : principe général

Le principe

Un exercice corrigé

Voici ci dessous, un espace à deux dimensions, comportant des points numérotés. On connait pour certains de ces points, leur classe, affichée entre parenthèses. Ici, c’est très simple, ils sont soit A, soit B (soit chien, soit chat pour revenir à l’exemple du début).

Les points 1 à 4 sont déjà classés ; on applique donc l’algorithme en commençant par classer le point 5. L’exercice est directement corrigé ci-dessous, mais prenez quelques minutes pour réfléchir par vous même au problème.

1) Sans utiliser la règle graduée mais uniquement à l’aide des coordonnées des points, expliquer comment calculer la distance entre le point 5 et le point 4.

2) Appliquer la méthode des kPPV (k Plus Proches Voisins) avec k=3 à partir du pont 5 (k = 3 veut dire qu’on va regarder les 3 plus proches voisins pour classer le point 5). Ecrire la classe résultante à côté du point. Préciser la démarche en prenant quelques points comme exemples.

3) Montrer par au moins un exemple que le résultat de la classification dépend de l’ordre de présentation des exemples.

Correction :

1) Penser au théorème de Pythagore

2) Pour chaque point à classer, à partir du cinquième, on cherche quels sont les 3 autres points les plus proches de lui déjà classés, et on regarde quelle est la classe la plus représentée parmi ces 3 points.

Exemple :…. La classification résultant de l’application de l’algorithme des kPPV avec k=3 est donc : 5B – 6A – 7B – 8A – 9A – 10A – 11B – 12A – 13B – 14A

3) Si le point tiré en 10e position avait été tiré en 8e position, il aurait été affecté à la classe B, au lieu de la A précédemment, car les 3 points les plus proches déjà 2 classés auraient été les 5 (classe B), 6 (A) et 7 (B). De même pour le nouveau point tiré en 8e position. Autre exemple : si le point tiré à la 9e position avait été tiré en 8e, il aurait été associé à la classe B (au lieu de la A), de même que le nouveau point tiré à la 9e position.

L’algorithme des k plus proches voisins : exemple pratique

Point technique

Pour faire fonctionner le code ci dessous, vous aurez besoin d’installer les librairies suivante avec un pip install

pip install pandas
pip install sklearn
pip install matplotlib

Vidéo : Comment installer une libraire dans python ? (déjà vue) https://youtu.be/GceNOBY1UXQ

Historique

En 1936, Edgar Anderson a collecté des données sur 3 espèces d’iris : « iris setosa », « iris virginica » et « iris versicolor ».

Pour chaque iris étudié, Anderson a mesuré (en cm) :

Par souci de simplification, nous nous intéresserons uniquement à la largeur et à la longueur des pétales. Pour chaque iris mesuré, Anderson a aussi noté l’espèce (« iris setosa », « iris virginica » ou « iris versicolor »)

Vous trouverez 50 de ces mesures dans un fichier iris.csv

En résumé, vous trouverez dans ce fichier :

  • la longueur des pétales
  • la largeur des pétales
  • l’espèce de l’iris (au lieu d’utiliser les noms des espèces, on utilisera des chiffres : 0 pour « iris setosa », 1 pour « iris virginica » et 2 pour « iris versicolor »)

Données CSV (pour voir à quoi ressemblent les données) : http://pixees.fr/informatiquelycee/n_site/asset/iris.csv

Activité à rendre

Programme 1 à télécharger et à exécuter dans pyzo.

Question A : Ajoutez des commentaires pour légender l’utilité de chaque groupe de lignes.

Programme 2 à télécharger et à exécuter dans pyzo.

Question B :

Déplacer le point noir en modifiant le code pour obtenir les trois classes successivement

Etapes algorithmiques de choix des k plus proches voisins :

  • on calcule la distance entre notre point (largeur du pétale = 0,75 cm ; longueur du pétale = 2,5 cm) et chaque point issu du jeu de données « iris » (à chaque fois c’est un calcul de distance entre 2 points tout ce qu’il y a de plus classique)
  • on sélectionne uniquement les k distances les plus petites (les k plus proches voisins)
  • parmi les k plus proches voisins, on détermine quelle est l’espèce majoritaire. On associe à notre « iris mystère » cette « espèce majoritaire parmi les k plus proches voisins »

Question C : Faire varier k autour d’une position fixe. Consignez vos observations dans trois cas.

Question D : QCM

Dans le quadrillage ci-dessus 14 points sont dessinés, dont 7 de la classe C1, avec des ronds noirs •, et 7 de la classe C2, avec des losanges ◇.

On introduit un nouveau point A, dont on cherche la classe à l’aide d’un algorithme des k plus proches voisins pour la distance géométrique habituelle, en faisant varier la valeur de k parmi 1, 3 et 5.

Quelle est la bonne réponse (sous la forme d’un triplet de classes pour le triplet (1,3,5) des valeurs de k) ?

Réponses possibles

A (C1, C2, C3)

B (C2, C1, C2)

C (C2, C2, C2)

D (C2, C1, C1)

Vous justifierez votre réponse

Pour aller plus loin