Classification supervisée de documents

Avec l'amélioration des capacités des ordinateurs, un gain de temps et
de stockage permet à présent d'envisager la gestion électronique de
toutes sortes de documents textuels pour en optimiser l'organisation et
la récupération.
Après avoir rappelé les bases et les particularités des systèmes de
classification, cet ouvrage définit différentes façons d'évaluer leur
qualité et l'optimisation de certaines de ces mesures. S'appuyant sur
les expériences de l'auteur, il offre ensuite conseils et mises en garde
pour une bonne préparation des données (extraction des termes, calcul
de leur force, choix des paramètres, etc.) et décrit en détails différentes
méthodes de classification supervisée (méthodes Winnow, Rocchio,
SVM), leurs propriétés et les résultats obtenus sur un jeu d'essai
concret.
Indispensable guide, cet ouvrage s'adresse aux étudiants et chercheurs
qui souhaitent approfondir le problème de la classification de
documents dans des classes prédéfinies, mais aussi aux ingénieurs et
développeurs ayant à mettre en place un outil de classification.