#DataScience — 3 livres à lire en juillet

Qui dit été dit soleil, plage, et après-midi au bord de la piscine à feuilleter son livre de l'été. Envie de profiter des beaux jours pour affûter vos connaissances en data science ? Voici notre sélection d'ouvrage à dévorer au mois de juillet :

Retrouvez ci-dessous un trio soigneusement sélectionné par notre équipe pour vos longues soirées d'été :

1. Data Science — Généralité

Data Science : fondamentaux et études de cas. Machine Learning avec Python et R — Eric Biernat, Michel Lutz

Data Science : fondamentaux et études de casParmi les (peu nombreux) ouvrages en français sur les data sciences, l'ouvrage de E. Biernat et M. Lutz reste le must. Les deux français offrent ici un livre à avoir dans sa bibliothèque pour qui souhaite un panorama technique des méthodes incontournables en science des données, en se concentrant sur l'usage de python et de R.

Parfois un brin technique si vous prenez ce livre en main en tant que novice, cet ouvrage reste une véritable bible qui vous offre un tour d'horizon quasi-exhaustif des algorithmes à maitriser pour tirer de l'information des masses immenses de données.

Et parce qu'il faut aller plus loin que les algorithmes, la dernière partie de l'ouvrage se concentre sur des techniques annexes, mais essentielles, dans la vie d'un data scientist — évaluation de performance des modèles de prédiction, gestion des valeurs manquantes... et bien d'autres, tout en gardant en vue la mise en pratique de l'apprentissage.

2. Programmation — R

R Programming for Data Science — Roger D. Peng.

R Programming for Data ScienceCréateur de la spécialisation Data Science de la Johns Hopkins University, Roger Peng fait partie des auteurs majeurs du monde de la science des données.

Dans cet ouvrage, le professeur offre un tour d'horizon ultra complet sur l'usage de R, en partant du b.a.-ba (qu'est-ce qu'un vecteur, ou liste ou une matrice, comment importer des données dans R...) pour aller jusqu'au manipulations un brin plus complexes (dplyr, loops et fonctions, debugger R...).

Avec une évolution en complexité croissante de chapitre en chapitre, vous pouvez prendre ce livre en main si vous débutez R, mais aussi si vous êtes utilisateur chevronné qui a besoin de se rafraichir la mémoire.

3. Statistiques — Généralité

OpenIntro Statistics — David Diez, Mine Cetinkaya-Rundel

OpenIntro StatisticsSi vous souhaitez profiter de l'été pour réviser vos classiques, cette "introduction" (de plus de 430 pages, tout de même) aux statistiques revient sur tous les indispensables de la statistiques pour la science des données et le machine learning.

Au programme (entre autres) : qu'est-ce qu'une probabilité, une distribution, une inférence ? Comment fonctionne la régression linéaire, et comment l'utiliser pour vos prédictions ? ...

Les points forts de cet ouvrage : des exercices à la fin de chaque chapitre pour vous permettre d'exercer les concepts étudiés, mais aussi des vidéos en ligne directement accessibles depuis le pdf.

Colin FAY

Rédigé par: Colin FAY

Créateur et rédacteur en chef de Data Bzh.