[Lecture] Hadoop – Devenez opérationnel dans le monde du Big Data

Conseil lecture : un guide complet pour découvrir la technologie Hadoop !

Il ne faut pas se leurrer : se lancer dans les nouvelles technologie du Big Data n’est pas une mince affaire. Surtout quand on sait que le secteur reste un domaine ultra mouvant, et dans lequel les méthodologies, technologies, et objectifs changent (presque) tous les ans.

Pourtant, s’il est bien une technologie qui a fait ses preuves et qui est aujourd’hui bien implantée (et qui n’est pas prête de repartir), c’est bien Hadoop.

Libre et open source, Hadoop est un écosystème qui permet de traiter d’immense volume de données, en orchestrant la gestion de calcul de manière distribuée, de la gestion au traitement. Très schématiquement, il s’agit de répartir sur de nombreux ordinateurs un processus que l’on va découper en morceaux.

Vous l’aurez compris, au delà d’une simple complexité technique, il s’agit ici d’un changement de paradigme de pensée qu’opère Hadoop : on ne lance plus un calcul dans une machine en attendant que cette dernière s’occupe de réaliser ce qu’on lui demande.

Et c’est ce pont qu’effectue ce livre :

  • D’abord en présentant Hadoop et son histoire (pour rappel, le projet est né chez Google avant de migrer chez Apache),

  • Ensuite en migrant vers une approche plus conceptuel du fonctionnement d’Hadoop : notamment avec les techniques de MapReduc, mais aussi en détaillant ce qu’est une architecture distribuée, un cluster, les différents système de traitement et de stockage…

  • Avant de terminer par un panorama technique de l’utilisation d’Hadoop (SQL dans Hadoop, Apache Storm…).

Bref, un véritable tour d’horizon qui permet de se faire une idée claire de l’écosystème, et vous donnera peut-être les clés pour vous lancer, ou du moins pour ne plus vous sentir démuni face au mystérieux éléphant jaune (la mascotte d’Hadoop 😉 ).

Dans une volonté pédagogique assumée, Juvénal Chokogoue, auteur du livre, termine chaque chapitre par une série d’exercices visant à tester ce que vous avez retenu des pages que vous venez de lire. Bien sûr, chacun de ces exercices est complété par des réponses fournies, disponibles à la fin de l’ouvrage.

Et parce qu’on est jamais mieux servi que par l’exemple, ce livre est ponctué de cas d’usage concret de l’adoption de technologie Hadoop par des entreprises comme Air France ou EDF.

Acheter en ligne

Rédigé par: Colin FAY

Créateur et rédacteur en chef de Data Bzh.