Base de données exemple pour l'apprentissage supervisé Laboratoire III
Andres Perez-Uribe
Il s'agit d'utiliser une base de données qui contient treize caractéristiques correspondants à trois différents types de vins italiens. Cette base de données devrait vous permettre d'entrainer un réseau de neurones pour créer un modèle de ces trois types de vin que par la suite, devrait être capable de reconnaitre le type de vin en fonction des treize caracteristiques mésurées. 1. Données
La base de données fait partie d'une collection de base de données, utilisées comme "benchmarking" des algorithmes de "Machine learning". Cette collection s'appelle "UCI Machine Learning Repository" et se trouve à l'adresse: http://www.ics.uci.edu/~mlearn/MLRepository.htmlLe fichier wine_names.txt explique le données et donne quelques références sur l'origine et l'utilisation de cette base de données, ainsi que certains études clés réalisés avec.
Le fichier wine_data.txt contient les données.
2. Pre-traitement des données
Pour faciliter l'apprentissage d'un réseau de neurones, il faut normaliser les variables en entreée. D'autre part, le type de vin, qui est indiqué par la première colonne du fichier "wine_data.txt" doit être codé, par exemple en utilisant un codage binaire:type 1 -> 0 0 1
type 2 -> 0 1 0
type 3 -> 1 0 0La topologie du réseau de neurones serait alors 13-N-3 puisqu'il y a 13 paramètres en entreée associes à trois valeurs de sortie. Il reste N, le nombre de neurones dans la couche cachée à choisir. Essayez N=10 pour commencer.
Le fichier wine_norm_bin.ptf (changer l'extension txt par ptf) contient déjà les informations concernant les vins italiens pre-traitées et prêtes à utiliser avec FENNIX.
3. Entraînement et test d'un réseau de neurones
Suivre la Guide rapide du logiciel FENNIX.
SBI 2008