#DataScience — 3 livres à lire en août

Ah, août. Son grand soleil, son ciel bleu, ses plages, et septembre qui approche à grands pas. Et parce qu’il faut profiter des après-midi à la mer pour réviser avant la rentrée, retrouvez notre sélection de 3 livres à consulter avant de reprendre la route du travail.

Le trio de tête des aoûtiens amoureux de data :

1. Data Science — Généralité

The art of data scienceThe Art of Data ScienceRoger D. Peng and Elizabeth Matsui

Plus besoin de présenter le désormais connu Robert Peng (dont nous avions présenté l’un des livres dans notre sélection de juillet) — le professeur a travaillé avec une autre professeur de l’université d’Hopkins, Elizabeth Matsui, pour proposer ce livre qui vous offre un panorama complet sur la gestion des projets de data science.

Au programme : savoir poser les bonnes questions avant de vous lancer, explorer les données, utiliser des modèles statistiques pour détecter des tendances, interpréter et communiquer vos résultats. Le tout dans un format accessible, qui lancera les futurs passionnés et rafraîchira les connaissances des data scientists aguerris.

Et, s’il vous fallait une raison de plus, cet ebook est disponible gratuitement sur leanpub.

Go go go !

2. Programmation — R

Book ggplot2 par Hadley Wickhamggplot2. Elegant Graphics for Data AnalysisHadley Wickham

Rockstar de l’univers R, Hadley Wickham est notamment créateur du package ggplot2, extension incontournable de data visualisation. Après une première édition en 2010, l’auteur publie cette année une version mise à jour, véritable bible expliquant le fonctionnement de son package de A jusqu’à Z.

Au menu : de l’installation basique du package à la création de thèmes, en passant par la gestion des échelles, par les statistiques avec ggplot2, ou encore la théorie des tidy data, ce livre vous offre une vision globale de ce package indispensable, pour pouvoir réaliser des graphiques personnalisés et fidèles à ce que vous imaginez. Ce livre deviendra très vite un indispensable qui traînera sur votre bureau, et que vous pourrez consulter à la moindre question sur ggplot2 !

Et puis, 4,5 étoiles sur 5 sur Amazon, ça en dit long non ?

3. Statistiques — Généralité

stats-avec-RStatistique avec R — Cornillon P.A., Guyader A., Husson F., Jégou N., Josse J., Kloareg M., Matzner-Løber E., Rouvière L.

Immanquable dans la langue de Molière sur les statistiques avec le logiciel R, cet ouvrage offre un panorama quasi complet des opérations statistiques et comment les réaliser avec R. La première partie est réservée à un tour d’horizon du logiciel — installation, écriture, packages… — et la seconde aux statistiques : chaque chapitre effectuant un rapide rappel théorique, avant de décrire dans le détail les process à suivre en R.

Parmi les opérations abordées : moyennes, anova, arbre de décision, clustering… et d’autres ! Un must à mettre dans toutes les mains : les statisticiens aguerris à la recherche d’un manuel pour utiliser R, les ninjas de R à la recherche d’un ouvrage statistique, ou encore les débutants en R comme en statistiques.

Rédigé par: Colin FAY

Créateur et rédacteur en chef de Data Bzh.

Une réponse sur “#DataScience — 3 livres à lire en août”

Les commentaires sont fermés.