Exploration de données et méthodes statistiques : data analysis & data mining avec le logiciel R

La statistique envahit pratiquement tous les domaines d'application,
aucun n'en est exclu ; elle permet d'explorer et d'analyser des corpus
de données de plus en plus volumineux : l'ère des big data et du data
mining s'ouvre à nous ! Cette omniprésence s'accompagne bien souvent
de l'absence de regard critique tant sur l'origine des données que sur la
manière de les traiter. La facilité d'utilisation des logiciels de traitement
statistique permet de fournir quasi instantanément des graphiques et
des résultats numériques. Le risque est donc grand d'une acceptation
aveugle des conclusions qui découlent de son emploi, comme simple
citoyen ou comme homme politique.
Les auteurs insistent sur les concepts sans négliger la rigueur, ils décrivent
les outils de décryptage des données. L'ouvrage couvre un large spectre
de méthodes allant du pré-traitement des données aux méthodes de
prévision, en passant par celles permettant leur visualisation et leur synthèse.
De nombreux exemples issus de champs d'application variés sont
traités à l'aide du logiciel libre R, dont les commandes sont commentées.
L'ouvrage est destiné aux étudiants de masters scientifiques ou d'écoles
d'ingénieurs ainsi qu'aux professionnels voulant utiliser la statistique de
manière réfléchie : des sciences de la vie à l'archéologie, de la sociologie
à l'analyse financière.