Recherche livre data mining/big data
dans Statistiques
Bonjour,
Je recherche un ouvrage (idéalement une référence en anglais) sur le Data Mining présentant les attributs suivants :
1- Couvre les thèmes/outils essentiels du sujet (incl. différents types d'algorithmes existants, machine learning, stockage et préparation des données, data visualization, ...) sans s'enfoncer dans le micro-détail purement intellectuel
2- Est mathématiquement rigoureux / exhaustif (i.e. les preuves sont données systématiquement). J'ai un niveau de Master en maths, donc capable de comprendre des maths pas trop spécialisées
3- Présente la "big picture" et si possible des exemples concrets, de façon intelligente (i.e. critique) plutôt qu'une liste encyclopédique de théorèmes
L'objectif :
- est d'être capable de "hit the ground running" dans un contexte d'ingénierie R&D
- n'est pas d'être un PhD/théoricien sur un sujet précis, ni inversement d'être un analyste appliquant toujours les mêmes méthodes sans en comprendre/pouvoir en challenger les fondamentaux
Si cela fait du sens je suis prêt à regarder plusieurs volumes différents (2 ou 3). Ma priorité étant de partir d'emblée sur de solides références (plutôt que de démarrer avec des intros trop légères et devoir compléter à de multiples reprises).
Je m'interroge à présent sur l'ouvrage "Data Mining: the textbook" qui semble remplir ces critères (mais dur de dire sans l'avoir lu plus en détails, et semble légèrement encyclopédique).
D'avance merci pour vos recommandations,
J.
Je recherche un ouvrage (idéalement une référence en anglais) sur le Data Mining présentant les attributs suivants :
1- Couvre les thèmes/outils essentiels du sujet (incl. différents types d'algorithmes existants, machine learning, stockage et préparation des données, data visualization, ...) sans s'enfoncer dans le micro-détail purement intellectuel
2- Est mathématiquement rigoureux / exhaustif (i.e. les preuves sont données systématiquement). J'ai un niveau de Master en maths, donc capable de comprendre des maths pas trop spécialisées
3- Présente la "big picture" et si possible des exemples concrets, de façon intelligente (i.e. critique) plutôt qu'une liste encyclopédique de théorèmes
L'objectif :
- est d'être capable de "hit the ground running" dans un contexte d'ingénierie R&D
- n'est pas d'être un PhD/théoricien sur un sujet précis, ni inversement d'être un analyste appliquant toujours les mêmes méthodes sans en comprendre/pouvoir en challenger les fondamentaux
Si cela fait du sens je suis prêt à regarder plusieurs volumes différents (2 ou 3). Ma priorité étant de partir d'emblée sur de solides références (plutôt que de démarrer avec des intros trop légères et devoir compléter à de multiples reprises).
Je m'interroge à présent sur l'ouvrage "Data Mining: the textbook" qui semble remplir ces critères (mais dur de dire sans l'avoir lu plus en détails, et semble légèrement encyclopédique).
D'avance merci pour vos recommandations,
J.
Réponses
-
Peut-être The Elements of Statistical Learning de Hastie et al. Tu as aussi le livre du MIT Deep Learning de Goodfellow et al, mais comme son nom l'indique c'est consacré au Deep Learning, et niveau rigueur le deep learning c'est pas ça.
Je ne connais pas de livre répondant à tous tes critères, c'est-à-dire à jour avec l'état de l'art, rigoureux mathématiquement, avec explication des algorithmes, et suffisamment pragmatique pour parler de la préparation des données en pratique.
Je ne connais pas le livre dont tu parles mais il semble orienter plus pratique que théorie. -
Bonsoir,
Il y a trois livres qui peuvent vous intéresser et qui évite au maximum les anglicismes du même auteur Stéphane TUFFERY :
- "Data Mining et statistique décisionnelle", quatrième édition, 2012, Technip.
- "Étude de cas en statistique décisionnelle", 2009, Technip.
- "Modélisation prédictive et Apprentissage statistique avec R", 2015, Technip.
Je ne connais pas de livres tout-en-un alliant toutes les qualités que vous énumérez.
Vous pouvez consulter le site kdnuggets.com pour vous faire votre idée en vous prévenant d'une certaine outrance pour leur domaine comme le savent le faire parfois nos amis outre-atlantique.
Cordialement. -
Bonjour
J'ai oublié de mentionner un livre qui me plaît beaucoup avec l'idée d'Analyse des données dite "à la française" :
"Analyse statistique multidimensionnelle : Visualisation et inférence en fouille des données", quatrième édition, L. Lebart, M. Piron, A. Morineau, 2006, Dunod.
Avec ce livre, il y a beaucoup à faire si il vous accroche.
Bon courage. -
Merci !
Je vais tenter "The Elements of Statistical Learning de Hastie et al." :-) -
Bonjour,
C'est une valeur sûre depuis plus de 15 avec, "An introduction to statistical Learning" de Hastie et al. mais, dans le premier, un seul chapitre est consacré à l'apprentissage non-supervisé.
Cordialement. -
Y'a une seconde édition de 2009 qui augmente considérablement le contenu.
-
Bonsoir,
Je ne savais pas qu'il y avait une édition augmentée !
Merci pour cette information ainsi que la courtoisie de votre message. Ceci dit clos.
Cordialement.
Connectez-vous ou Inscrivez-vous pour répondre.
Bonjour!
Catégories
- 165.4K Toutes les catégories
- 62 Collège/Lycée
- 22.2K Algèbre
- 37.6K Analyse
- 6.3K Arithmétique
- 61 Catégories et structures
- 1.1K Combinatoire et Graphes
- 13 Sciences des données
- 5.1K Concours et Examens
- 23 CultureMath
- 51 Enseignement à distance
- 2.9K Fondements et Logique
- 10.8K Géométrie
- 84 Géométrie différentielle
- 1.1K Histoire des Mathématiques
- 79 Informatique théorique
- 3.9K LaTeX
- 39K Les-mathématiques
- 3.5K Livres, articles, revues, (...)
- 2.7K Logiciels pour les mathématiques
- 26 Mathématiques et finance
- 342 Mathématiques et Physique
- 5K Mathématiques et Société
- 3.3K Pédagogie, enseignement, orientation
- 10.1K Probabilités, théorie de la mesure
- 804 Shtam
- 4.2K Statistiques
- 3.8K Topologie
- 1.4K Vie du Forum et de ses membres