L’importance du jeu de données pour le deep learning

Par Olivier il y a 1 an
Temps de lecture estimé 2 min

Lorsque l’on crée une Intelligence Artificielle, il est évident que nous attendons d’elle qu’elle soit pertinente, que son niveau d’exactitude soit le plus important possible... qu’elle ne se trompe pas.

Qu’est-ce que le jeu de données ?

Le jeu de données, ou dataset, est une collection d’éléments variés que nous allons utiliser pour apprendre à notre IA à reconnaître un objet, une forme ou une personne. On parle a minima de plusieurs milliers, voire de millions d’exemples, qui peuvent être vrais ou faux.

Pour rappel, à son commencement, votre IA est comme un enfant… Elle ne sait pas grand-chose et c’est à vous de lui transmettre la connaissance. Il faut donc pouvoir lui apprendre ce qui correspond mais également ce qui ne correspond pas à ce que vous souhaitez qu’elle reconnaisse.

C’est là tout l’enjeu de la constitution du jeu de données. Celui-ci doit être représentatif de nombreux cas de figure.

L’importance de l’exhaustivité

À titre d’exemple, si vous cherchez à créer une IA pour identifier et reconnaître des moutons, vous devrez créer un jeu de données qui inclut non seulement les jolis petits moutons blancs qui représentent la majeure partie de nos têtes de bétail, mais vous ne devez pas oublier qu’il existe également des moutons noirs, des moutons avec ou sans cornes, avec ou sans queue, avec peu ou beaucoup de laine…

Pensez également à lui montrer d’autres espèces pour que votre IA sache faire la différence : des chèvres, des chiens, des lapins… tout ce qui pourrait l’aider à faire la différence entre un mouton et les autres espèces qui pourraient de près ou de loin lui ressembler.

Quelle importance ?

Nous insistons sur les jeux de données car ils représentent selon nous le principal enjeu d’une IA performante. Si votre IA se trompe, ce n’est pas qu’elle n’est pas douée, c’est avant tout qu’elle n’est pas suffisamment « cultivée », qu’elle ne connaît pas suffisamment de cas de figure, qu’elle n’est pas complètement « éduquée » (si vous faites le parallèle avec un enfant).

Dans la vie de tous les jours, une IA qui fournirait de mauvais résultats, ça peut être bloquant pour vos projets. Si nous cherchons à identifier la présence d’humains sur des photographies et que votre IA ne sait pas que les humains peuvent présenter des formes et des couleurs diverses… alors votre IA se trompera.

En résumé

Le jeu de données est un élément capital dans la réussite de la mise en place de votre IA.

Tout comme les sondages d’opinion, il faut que le dataset soit le plus représentatif possible afin que votre modèle de machine learning soit le plus pertinent possible.

À lire également

Comment créer votre intelligence artificielle ?

Découvrez notre approche pour mettre en place une IA en 7 étapes, de l’identification des objectifs à son exploitation.
Par Olivier, il y a 1 an
Temps de lecture : 7 min
Nous
contacter
Appelez-nous
01 45 21 05 21
Ou envoyez-nous un message
Contactez-nous
Newsletter
Restez connecté avec l’agence pour être informé de nos prochaines publications et annonces.