¿Quieres aprender análisis de datos y ya eres programador? Los siguientes libros pueden ser de gran ayuda. Este post está basado en un artículo inglés que encontramos, pero con los recursos que recomienda actualizados y algunos otros de nuestra cosecha.

Casi todos están en inglés pero incluímos unos cuántos en español y, en los que nos fue posible, tienes descarga directa.

0. R en español

Empecemos por los pocos recursos en español. Encontré dos libros enfocados en aprender R (ojo: sin profundizar en el análisis de datos) en español.

R para principiantes de Juan Bosco Mendoza

Portada de R para principiantes

R para principiantes pretende ser un material introductorio al lenguaje de programación R, dirigído a personas que nunca han usado R o ningún otro lenguaje de programación, ni tiene conocimiento previo de probabilidad y estadística.

Es un libro que te lleva de la mano desde la instalación hasta la exploración visual de los datos, mediante el uso de la gráficas generadas por R, de manos de un practicante asiduo del lenguaje.

Lée R para principiantes aquí.

R para principiantes de Emmanuel Paradis, traducido por Jorge A. Ahumada.

Es una introducción al lenguaje R explicando un poco los detalles de funcionamiento para poder sentar las bases de uso avanzado, para principiantes en programación. Toca algunas nociones muy básicas de estadística para proporcionar ejemplos.

Puedes descargarlo aquí..

1. Think Stats, Segunda Edición

The thesis of this book is that data combined with practical methods can answer questions and guide decisions under uncertainty.

Este libro enseña estadística básica con Python y el proceso de análisis de exploración y análisis de datos básico, con un enfoque en los programas más que en las matemáticas.

Lee Think Stats, segunda edición.

Extra: La editorial tiene todos sus libros para leer en formatos digitales gratuitos. Una oportunidad que no puedes perderte, sólo que su sitio no es fácil de navegar así que visita la página de inicio

2. Bayesian Methods for Hackers

Este libro explica cómo aplicar métodos de inferencia bayesiana para programadores que no tienen tanto conocimiento de estadística y matemáticas, enfocados en el lado de la programación.

Descarga el libro aquí

3. Undestarding Machine Learning: From Theory to Algorithms

Este libro Shai Shalev-Shwartz y Shai Ben-David nos enseñan los fundamentos de machine learning y cómo transformar estos principios en algoritmos usables.

Este libro incluye un análisis de la complejidad computacional implicada.

Descarga Undestarding Machine Learning aquí

4. The Elements of Statistical Learning

“Estamos inundados de información pero secos de conocimiento” - Rutherford D. Roger

Esta frase que abre el libro explica la necesidad de entender y aplicar correctamente métodos estadísticos de análisis de datos para entender bien el mundo, dada la explosión de información que estamos viendo gracias a la digitalización de todas las industrias y de las ciencias.

El libro se enfoca en los métodos de análisis y sus fundamentos conceptuales en vez de en los detalles matemáticos.

Descarga The Elements of Statistical Learning

5. An Introduction to Statistical Learning

Portada del libro An Introduction to Statistical Learning

Está dirigido a personas que no estudiaron algo relacionado con matemáticas (como la mayoría de los programadores), para introducirlos a al aprendizaje estadístico práctico, inspirado por el libro del punto 4.

Este libro es adecuado para personas sin preparación ni en estadística ni en ciencia de la computación. Usa R para aprender los conceptos.

Descarga An Introduction to Statistical Learning

6. Foundations of Data Science

Este libro intenta enseñar los fundamentos de análisis de datos desde una perspectiva computacional, para darles a los lectores un fundamento para los siguientes 40 años de la era de la computación, argumentando que la primera época, la enfocada en compiladores, algoritmos y lenguajes ha pasado y que ahora el foco debería estar en el análisis y procesamiento de datos.

Empieza estableciendo las bases matemáticas y el entendimiento necesario de los conceptos estadísticos para luego avanzar a la aplicación de estos.

Puedes descargarlo aquí.

7. A Programmer’s Guide to Data Mining

Guide to data mining

Es una guía práctica para minería de datos y sistema de recomendación, con la técnica de aprender haciendo, con ejercicions en Python. Es libro menos serio (en sentido de seriedad formal) de los que hemos visto hasta ahorita, tiene memes, bromas e imágines divertidas.

Blood, sweat and code

Puedes descargar el libro aquí

8. Mining of Massive Datasets

MMDS cover

Este libro está basado en el curso CS246 de Stanford del mismo nombre. Está enfocado en la minería de datos en grandes cantidades, es decir que no puedan ser mantenidos en la memoria principal.

“Data mining is about applying algorithms to data, rather than using data to “train” a machine-learning engine of some sort.”

En enfoque es en e los algoritmos que podemos aplicarle a los datos para obtener información relevante.

Puedes descargar la segunda edición y ver el beta de la tercera edición.

9. Deep Learning

Deep learning cover book Es un recurso introductorio al campo de machine learning específicamente enfocado en deep learning. Es un buen recurso para programadores que no tienen preparación en estadística porque la primera parte del libro está enfocada en dar las bases matemáticas para comprender los algoritmos y técnicas de deep learning.

Puedes comprar el libro o leerlo directamente desde su página de forma gratuita.

10. Machine Learning Yearning

ML Yearning

Está escrito por Andrew Ng uno de los fundadores de Coursera y un gigante de la inteligencia artificial. Su enfoque principal es enseñarte cómo organizar un proyecto de Machine Learning, cómo hacer que los algoritmos funcionen y den resultados.

Te pide suscripción con correo electrónico para que recibir una copia del borrador gratuita. Puedes registrarte aquí.

11. Los libros OpenIntro

Portadas OpenIntro

OpenIntro es una iniciativa para proveer recursos de aprendizaje de alta calidad a un precio razonable.

Provee todos sus recursos de manera gratuita para descarga. Puedes visitarlos aquí.

12. Los libros de Roger D. Peng y sus colegas

Roger D. Peng libros

Roger D. Peng es un profesor de bioestadística la Escuela Johns Hopkins Bloomberg de Salud Pública. Tiene varios cursos en Coursera sobre análisis de datos, y también lo podemos considerar uno de los grandes contribuidores a la educación sobre análisis de datos.

Ha escito numerosos libros sobre análisis de datos y manejo de proyectos de análisis de datos. Su especialidad es R.

Puedes ver el índice de sus libros aquí, casi todos ellos gratuitos, aunque puedes continuir monetariamente si gustas.

Conclusión

Si sabes inglés, hay más material del que podríamos leer decentemente en un buen tiempo sin tener que gastar un solo peso directamente en esta información. ¿Por qué no aprovecharla?

Cuéantanos si ya leíste uno de ellos y qué te pareció.

Comentar