[Lecture] Maîtrisez l’utilisation des technologies Hadoop

La bonne résolution à prendre en cette rentrée scolaire 2018 ? Maitriser Hadoop 😉 Et pour ça, nous vous conseillons l'ouvrage français de référence : Maîtrisez l'utilisation des technologies Hadoop, par Juvénal Chokogoue.

Nous vous avions déjà parlé du premier ouvrage de Juvénal, intitulé Hadoop – Devenez opérationnel dans le monde du Big Data.

L'expert est de retour avec un nouvel ouvrage, consacré une nouvelle fois à l'une des thématiques centrales du Big Data — Hadoop.

Alors que le premier ouvrage apportait une vision plus théorique et conceptuelle d'Hadoop, on est ici sur la mise en production, le moment où il est l'heure de "mettre la main à la pâte".

Alors, quoi de neuf dans cet ouvrage ?

Tour d'horizon de l'écosystème Hadoop

Avouons le : qui souhaite se lancer demain dans Hadoop fera face à un nombre important de technologies à prendre en main, et ne saura pas forcément pas où commencer. Bonne nouvelle : Juvénal Chokogoue vous propose avec cet ouvrage une véritable boussole pour naviguer dans l'océan Hadoop. Plongeant dans les détails des différentes technologies, cet ouvrage se veut complémentaire au précédent — même si vous pourrez compulser celui-ci sans avoir dévoré le premier.

Alors, qu'est-ce qu'on trouve dans cet ouvrage ?

Les modèles de calcul

Calcul batch, traitement parallèle, MapReduce, in-memory... Des gros mots ? Non, des termes cruciaux pour prendre en main Hadoop, expliqués en détails dans Maîtrisez l'utilisation des technologies Hadoop. On trouvera dans cette première partie de l'ouvrage une présentation de Mahout et Hama, ainsi que de l'un des projets phare des années 2010 : Spark.

Hadoop et abstraction

Hadoop, c'est bien, parler avec lui, c'est mieux 😉 Car oui, une fois la machine Hadoop mise en route, encore faut-il savoir lui dire des mots doux. C'est ce que présente la deuxième partie de l'ouvrage, en introduisant à Hive et Pig (Apache encore), puis à SQL sur Hadoop.

Stockage, stockage, stockage

Traiter des données, c'est de la lecture, mais aussi de l'écriture !

La troisième partie de l'ouvrage s'intéresse donc aux structures de stockage liées à Hadoop, tant sous l'angle des données, de leur structures, que de l'implémentation concrète de bases. On trouvera dans cette partie une introduction au NoSQL, à Apache Lucene et HBase, ainsi qu'à ElasticSearch.

Gérer un cluster Hadoop

La quatrième partie de l'ouvrage se concentre sur l'orchestration d'un cluster Hadoop, en présentant notamment YARN et Zookeeper, deux outils qui permettent notamment de gérer la coordination dans un cluster, les pannes, la sécurité ou encore les packages.

Hadoop et temp réel

L'une des forces d'Hadoop est de pouvoir faire du temps réel : en clair, l'information et les données afluent en continue, et on les traite dans la foulée (vous vous imaginez bien qu'en pratique, c'est un peu plus sophistiqué 😉 ).

Pour faire face au déluge de données, on appelera Storm, permettant de prendre en main en temps réel les données. Rassurez-vous, il n'y a pas à prendre peur devant la tempête — vous trouverez tout ce qu'il faut dans ce livre !

Outils annexes

Bien, nous avons déjà fait le tour d'un bon paquet d'outils de l'écosystème... qui en plus, n'arrête pas de grandir (de nouveaux outils voient le jour très régulièrement).

La sixième partie de ce livre se consacre à la présentation d'outils "annexes" à l'écosytème Hadoop, avec notamment Oozie et Sqoop, ainsi que Hue et Ambari.

L'essayer, c'est l'adopter

Maintenant que nous avons un bon panorama de l'écosystème, on se lance ?

Ça tombe bien, la dernière partie de se livre porte sur l'adoption à grande échelle d'Hadoop, avec une présentation des différentes solutions et distributions d'Hadoop. On y trouvera Cloudera, MapR, les solutions IBM, celles dans le Cloud, les outils Amazon... Bref, vous avez le choix.

Devenez imbattable sur Hadoop !

Pour qui Maîtrisez l'utilisation des technologies Hadoop ?

Eh bien, pour tous ceux qui souhaitent devenir incollable sur les technologies de la galaxie Hadoop : étudiants, experts Big Data, Consultants, développeurs, Data Scientists...

Bref, qui veut tirer profit des technologies Big Data fera de cet ouvrage son nouveau livre de chevet (ou de moins, le gardera bien au chaud, sur son bureau, à portée de main) — on y trouvera des réponses aux questions fondamentales que l'on se pose quand on souhaite se lancer dans le traitement des données.

Fiche technique

Maîtrisez l'utilisation des technologies Hadoop —Initiation à l'écosystème Hadoop
Auteur(s) : Juvénal Chokogoue
Editeur(s) : Eyrolles
Collection : Blanche
Nombre de pages : 432 pages
Date de parution : 31/05/2018
EAN13 : 9782212674781

Acheter en ligne

Colin FAY

Rédigé par: Colin FAY

Créateur et rédacteur en chef de Data Bzh.