Big Data et machine Learning.

incomplĂšte

Résumé

Le Big Data s’est imposĂ© comme une innovation majeure pour toutes les entreprises qui cherchent Ă  construire un avantage concurrentiel grĂące Ă  l’exploitation de leurs donnĂ©es clients, fournisseurs, produits, processus, machines, etc.
Ce livre est un guide pour comprendre les enjeux d’un projet Big Data, en apprĂ©hender les concepts sous-jacents (en particulier le machine learning) et acquĂ©rir les compĂ©tences nĂ©cessaires Ă  la mise en place d’un data lab.
Il combine la prĂ©sentation de notions thĂ©oriques (traitement statistique des donnĂ©es, calcul distribuĂ©…), d’outils (Ă©cosystĂšme Hadoop, Storm…) et d’exemples de machine Learning.
Cette deuxiÚme édition comporte des ajouts sur le deep learning et les réseaux de neurones, ainsi que des compléments et des mises à jour sur les moteurs de recommandations et Spark. Les compléments en ligne seront enrichis de nouveaux jeux de données pour un début de mise en pratique.

sommaire :

PremiĂšre partie – Les fondements du Big Data
Chapitre 1 – Les origines du Big Data : 1.1 La perception de la donnĂ©e dans le grand public ; 1.2 Des causes Ă©conomiques et technologiques ; 1.3 La donnĂ©e et l’information ; 1.4 La valeur ; 1.5 Les ressources nĂ©cessaires ; 1.6 De grandes opportunitĂ©s
Chapitre 2 – Le Big Data dans les organisations : 2.1 La recherche de l’Eldorado ; 2.2 L’avancĂ©e par le cloud ; 2.3 La crĂ©ation de la valeur ; 2.4 Les « 3V » du Big Data ; 2.5 Un champ immense d’applications ; 2.6 Exemples de compĂ©tences Ă  acquĂ©rir ; 2.7 Des impacts Ă  tous les niveaux ; 2.8 « B » comme Big Data ou Big Brother ?
Chapitre 3 – Le mouvement NoSQL : 3.1 Bases relationnelles, les raisons d’une domination ; 3.2 Le dogme remis en question ; 3.3 Les diffĂ©rentes catĂ©gories de solutions ; 3.4 Le NoSQL est-il l’avenir des bases de donnĂ©es ?
Chapitre 4 – L’algorithme MapReduce et le framework Hadoop : 4.1 Automatiser le calcul parallĂšle ; 4.2 Le pattern MapReduce ; 4.3 Des exemples d’usage de MapReduce ; 4.4 Le framework Hadoop ; 4.5 Au-delĂ  de MapReduce

DeuxiĂšme partie – Le mĂ©tier de data scientist
Chapitre 5 – Le quotidien du data scientist : 5.1 Data scientist : licorne ou rĂ©alitĂ© ? ; 5.2 Le data scientist dans l’organisation ; 5.3 Le workflow du data scientist
Chapitre 6 – Exploitation et prĂ©paration de donnĂ©es : 6.1 Le dĂ©luge des donnĂ©es ; 6.2 L’exploitation de donnĂ©es ; 6.3 La prĂ©paration de donnĂ©es ; 6.4 Les outils de prĂ©paration de donnĂ©es
Chapitre 7 – Le Machine Learning : 7.1 Qu’est-ce que Le Machine Learning ? ; 7.2 Les diffĂ©rents types de Machine Learning ; 7.3 Les principaux algorithmes ; 7.4 RĂ©seaux de neurones et Deep Learning ; 7.5 Illustrations numĂ©riques ; 7.6 SystĂšmes de recommandation
Chapitre 8 – La visualisation des donnĂ©es : 8.1 Pourquoi visualiser l’information ? ; 8.2 Quels graphes pour quels usages ? ; 8.3 ReprĂ©sentation de donnĂ©e complexes

TroisiĂšme partie – Les outils du Big Data
Chapitre 9 – L’Ă©cosystĂšme Hadoop : 9.1 La jungle de l’Ă©lĂ©phant ; 9.2 Les composants d’Apache Hadoop ; 9.3 Les principales distributions Hadoop ; 9.4 Spark ou la promesse du traitement Big Data in-memory ; 9.5 Les briques analytiques Ă  venir ; 9.6 Les librairies de calcul
Chapitre 10 – Analyse de logs avec Pig et Hive : 10.1 Pourquoi analyser des logs ? ; 10.2 Pourquoi choisir Pig ou Hive ? ; 10.3 La prĂ©paration des donnĂ©es ; 10.4 L’analyse des parcours clients
Chapitre 11 – Les architectures gamma : 11.1 Les enjeux du temps rĂ©el ; 11.2 Rappels sur MapReduce et Hadoop ; 11.3 Les architectures gamma
Chapitre 12 – Apache Storm : 12.1 Qu’est-ce que Storm ? ; 12.2 Positionnement et intĂ©rĂȘt dans les architectures gamma ; 12.3 Principes de fonctionnement ; 12.4 Un exemple trĂšs simple

Notes

Cet ouvrage est l’objet d’une prĂ©sentation sous la rubrique « Notes de lecture » de la revue Tangente n° 173.

Données de publication

Éditeur Dunod Paris , 2016 Collection InfoPro – Management des systĂšmes d’information Format 17,5 cm x 25 cm, 272 p.

ISBN 2-10-075463-7 EAN 9782100754632

Public visé tout public

Type ouvrage (au sens classique de l’édition), vulgarisation, popularisation Langue français Support papier

Classification