Los 3 mejores libros de "Deep Learning"

8/17/2018

Hace unas tres semanas, un estudiante de la UPIITA-IPN me preguntó que libro leer para aprender sobre redes neuronales y aprendizaje profundo. Debido a la prisa cotidiana, no pude contestarle como hubiera deseado. Quiero resanar esa recomendación descuidada mediante esta nota.

Voy a reseñar los tres libros que he consultado para aprender más acerca de las redes neuronales artificiales y el aprendizaje profundo. Al ser un tema caliente, hay un par de decenas de libros que puedes comprar en Amazon sobre aprendizaje profundo. Si eres nuevo en este tema y estas interesado en aprender puede ser confuso donde iniciar y saber en qué fuentes de información vale la pena invertir tu tiempo. Considera que hay un océano de opciones y todos tenemos solo 24 horas cada día, así que devorar todos los libros no es, por mucho, la mejor estrategia a seguir.

Nota importante: es posible descargar los tres libros desde Internet a través de sitios rusos, sin embargo, te invito a comprarlos si realmente vas en serio en desarrollar tus habilidades técnicas. Esto lo recomiendo por dos motivos: porque es una forma de agradecer a los autores por dedicar su tiempo de "pavimentar el camino" para que otros puedan recorrerlo más rápido, y dos, porque leer un libro en papel es una experiencia que hace el aprendizaje sea más significativo. Claro que si no tienes dinero suficiente o solo quieres fisgonear el libro, comprarlo no es una buena opción.

1.- Deep Learning with Python

Si tu perfil es de un programador o de un estudiante de ingeniería o de un ingeniero con poco interés en explicaciones profundas, entonces tu buscas un libro práctico con código que te permita poner en acción lo que diga el libro lo más pronto posible. Éste es el libro ideal para ti. Francois Chollet es el autor del libro y es ingeniero-investigador que trabaja en Google en el área de aprendizaje automático. Él va directo a las explicaciones simples para que comprendas cómo funciona el código y puedas desarrollar tus propios proyectos.

Hace un recorrido por los fundamentos matemáticos y de aprendizaje automático para que comprendas rápidamente como funcionan las redes neuronales. Lo más importante es la sección 1 "What is deep learning?" porque le aclara a la gente que se inicia en este tema ¿qué es aprendizaje profundo y qué no?, ¿qué es la inteligencia artificial y qué no?, ¿qué son las redes neuronales?, ¿por qué hay tanto interés en este tema? Esa es una sección que te recomiendo leer, ya mismo.

Después de los fundamentos, te lleva de la mano para que veas ejemplos de como aplicar las redes neuronales convolucionales a problemas de visión computacional como reconocer gatos y perros en imágenes. También te muestra cómo aplicar modelos neuronales recurrentes a secuencias de texto para su clasificación. Te enseña las mejores estrategias que puedas usar para mejorar tus modelos neuronales. Hay una sección exclusivamente para un tópico muy caliente que son los modelos generativos. Estos modelos permiten crear imágenes o texto artificialmente que parezca muy real, tanto que a veces es díficil para un ser humano reconocer si es una imagen real o artificial.

Como he dicho, si tu estas interesado en "hacer" entendiendo lo suficiente, este libro es para ti. El libro es poco profundo en la teoría, en las explicaciones y las matemáticas. Pero es un libro muy generoso en códigos prácticos y útiles. Yo usé unas cuantas secciones de este libro para el curso de Actumlogos.

2.- Deep Learning

Si tu perfil es de un profesor, un investigador, un estudiante de posgrado o eres un ingeniero con intereses en la investigación, entonces entender es más importante que la implementación, ya que la implementación pasa a ser un medio para verificar o falsificar tus tesis. Este libro fue escrito por tres investigadores quienes tienen muchos seguidores y muchas citas en sus publicaciones, y con este libro, tendrán muchas más en el futuro. Ian Goodfellow es considerado padre de los modelos "Generative Adversarial Networks" que son capaces de crear imágenes impresionantemente realistas. Yoshua Bengio y Aaron Courville son muy reconocidos; fueron algunos de los investigadores que le dieron un nuevo impulso a la investigación en redes neuronales, buscando en las arquitecturas neuronales de varias capas.

El libro es dividido en tres partes. Uno, te enseña los fundamentos matemáticos a un nivel más profundo que el libro anterior. Sin embargo, no esperes que sea como un libro de texto, donde te van a enseñar paso a paso, solo te muestran lo que deberías saber de manera rápida, sin ejemplos, y en forma abstracta. Si quieres dominar las bases, tendrás que ir a otros libros especializados en cada tema. Dos, aquí presentan explicaciones detalladas de las redes neuronales multicapa, de las redes convolucionales y de redes recurrentes junto con tres secciones acerca de cómo entrenarlas enfocándose en los métodos de optimización, regularización y la metodología para decidir qué hacer si el modelo no está aprendiendo como deseamos. Aquí hay un sección que leí con mucha más atención que fue la sección 12 "Applications", te la recomiendo. Tres, trata de un collage de varios temas que se manejan más a nivel de investigación, por ejemplo, la representación de aprendizaje donde se busca mejores formas de representar la información para facilitar su clasificación, un tema muy importante para mejorar el desempeño de los modelos neuronales.

Es un libro fácil de leer y muy ameno, pero para quien no este metido en la investigación, puede ser difícil de entender y no hay ejemplos prácticos. Lo recomiendo porque sirve para conocer las explicaciones y los puntos de vista de grandes investigadores como son los autores. Basado en ellos, tu puedes estirar la frontera del conocimiento un poco más.

3.- Hands-On Machine Learning with Scikit-Learn & TensorFlow

Éste es otro libro muy práctico, dirigido a los estudiantes de posgrado, investigadores experimentales y programadores profesionales. El autor del libro es Aurélien Géron, sinceramente no conocía sus logros, hasta que tuve que indagar un poco sobre él para reseñarlo. Él fundó y tiene una consultoría para empresas que necesiten desarrollar sistemas basados de aprendizaje automático para solucionar algún problema práctico en su organización. Por lo cual, su experiencia en el desarrollo de estos proyectos es incuestionable.

El libro es fácil de leer, tiene código por todas partes, gráficas y ejemplos prácticos. Se centra en usar dos herramientas computacionales muy útiles para implementar modelos de aprendizaje automático: Scikit-Learn y Tensorflow. De hecho, así está dividido el libro en dos partes, una en donde te enseña lo básico de aprendizaje automático usando scikit-learn, y otra, en donde trata el tema de redes neuronales basado en tensorflow. Algo muy valioso para los programadores profesionales es un capitulo exclusivo para enseñarles cómo desarrollar tu propio proyecto desde inicio a fin, con la visión adecuada.

En mi opinión, la segunda parte del libro debe reservarse para quienes realmente buscan crear modelos propios con arquitecturas pocos usuales. Si lo que quieres es usar modelos convencionales, usa Keras y lee el primer libro que reseñe en esta nota. En este libro las explicaciones de los porqués son escasas, es un libro enfocado al "Know-How", es decir, al como hacerlo. Por tanto, es un libro muy útil para aprender haciendo.

11 Comentarios

Alberto Munoz link

8/21/2018 08:19:11 am

Excelente review. Aprendo y coincido totalmente con las recomendaciones. Solo agregarí la sugerencia de seguir las referencias a papers donde están algunas explicaciones y demostraciones in extenso que sirven para entender la complejidad de los algoritmos y sus alcances. Suerte !!

Responder

Erik Zamora

8/21/2018 08:38:13 am

Muchas gracias. Totalmente de acuerdo, hay artículos que deben ser leídos en la formación. Quizá haga una reseña sobre algunos de estos artículos.

Ricardo

9/14/2018 06:45:24 am

Gracias por compartir Prof., me pregunto si nos podría recomendar algo para Machine Learning o Reinforcement Learning.
Un saludo.

Erik Zamora link

9/15/2018 06:06:16 am

(práctico) Python Machine Learning por Sebastian Raschka

(teorico y extenso) The Machine Learning: A Probabilistic Perspective por Kevin P Murphy

(teorico y mi favorito) Learning From Data por Malik Magdon-Ismail, Hsuan-Tien Lin Yaser S. Abu-Mostafa (Autor)

Sobre Reinforcement Learning
Te recomiendo mejor este curso https://www.udacity.com/course/deep-reinforcement-learning-nanodegree--nd893

IVAN MONARES

9/25/2018 08:07:57 am

Excelente reseña Doctor. Ciertamente el mundo de la IA es muy amplio y sus comentarios nos permiten a los principiantes que nos enfoquemos para empezar por buen camino. Muchas gracias.

9/26/2018 06:03:40 am

Mucho exito y gracias!

Gustavo

6/10/2019 04:42:04 pm

Hola,
gracias por el articulo, una consulta:
¿si quiero iniciar comprando el libro deep learning with python, primero necesito comprar un libro que me enseñe python? O se puede deducir con el primero?
Mi fin es aprender lo básico de DL para implementarlo en inteligencia de negocios.

Saludos!

Erik Zamora Gomez

6/18/2019 11:23:18 am

Mi recomendación es que compres el libro y uses stackoverflow y la documentación de python en linea para entender lo que no entiendas. No compres un libro de python. A menos que tu quisieras profundizar aun mas en Python.

Eric Hunter link

10/13/2022 06:16:59 am

Again consider check girl else senior. Front blood quickly. Member claim great team able sit.

Justin Humphrey link

11/3/2022 01:16:37 pm

What service serve top easy tough. Three send organization. Population factor collection staff should raise likely although. Sister though probably institution oil specific there continue.

Vincent Wright link

11/18/2022 02:07:10 am

Matter Congress question across everyone later task. Last least whether think generation current camera.
Pass value maybe person half major design. Concern wonder adult.

Inteligencia Artificial