Attention aux données

Le précédent modèle de votre camarade avait été appris sur trop peu de données, et était de plus été sur-appris. Cette fois, votre camarade a utilisé environ 30% de la donnée pour apprendre son modèle et un ensemble de validation d'à peu près la même taille. Cependant, votre camarade admet ne pas avoir utilisé de critère d'arret pour éviter un sur-apprentissage, ni de techniques d'augmentation de données. Son modèle atteint ainsi 100% d'accuracy sur l'ensemble d'apprentissage et seulement 73% d'accuracy sur l'ensemble de validation. Afin de lui montrer que cela n'est pas acceptable car comporte un risque de fuite de données, vous vous engagez à retrouver au moins 5 données ayant été utilisées pour l'apprentissage.

Un avion très secret

Exemple d'un avion trèèèèès secret.