Culture générale pour tous

Tout savoir sur le Data mining

Data Mining et statistique décisionnelle
L’intelligence des données

Auteur : Stéphane TUFFÉRY
Editeur : TECHNIP
Année : 01/2010 (3ème édition)
Nombre de pages : 705
ISBN 10 : 271080946x
ISBN 13 : 9782710809463

9782710809463-data-mining-statistique-decisionnelle_g

Le data mining et la statistique sont de plus en plus répandus dans les entreprises et les organisations soucieuses d’extraire l’information pertinente de leurs bases de données, qu’elles peuvent utiliser pour expliquer et prévoir les phénomènes qui les concernent (risques, consommation, fidélisation...).

Cette troisième édition, actualisée et augmentée de 170 pages, fait le point sur le data mining, ses méthodes, ses outils et ses applications, qui vont du scoring jusqu’au web mining et au text mining. Nombre de ces outils appartiennent à l’analyse des données et à la statistique classique (classification automatique, analyse discriminante, régression logistique, modèles linéaires généralisés, régression régularisée...), mais certains sont plus spécifiques au data mining, comme les arbres de décision, les réseaux de neurones, les SVM, l’agrégation de modèles et la détection des règles d’associations.

Ces outils sont disponibles dans des logiciels de plus en plus puissants et conviviaux. Un chapitre de l’ouvrage aide d’ailleurs le lecteur à se diriger dans cette offre logicielle et détaille les fonctionnalités des trois principaux : SAS, IBM SPSS et aussi R, qui bénéficie d’un développement conséquent dans cette troisième édition. Ces logiciels sont aussi utilisés pour illustrer par des exemples de nombreuses explications théoriques : une nouvelle partie de 50 pages est consacrée à une étude de cas complète de credit scoring, qui va de l’exploration des données jusqu’à l’élaboration de la grille de score.

Les aspects méthodologiques vont de la conduite des projets jusqu’aux facteurs de réussite et aux pièges à éviter, en passant par l’évaluation et la comparaison des modèles, leur intégration dans les processus opérationnels, sans oublier les contraintes juridiques dès que l’on traite des données à caractère personnel.

« Ce livre très riche et agréable à lire, malgré sa technicité, est destiné aux statisticiens et praticiens du data mining, aux utilisateurs et gestionnaires de bases de données mais aussi à tous les décideurs et aux étudiants en sciences économiques. » (Bulletin APMEP)

Mise à jour : 10 décembre 2012

Imprimer la page Modifier la taille des caractères Modifier la taille des caractères