Día 1: Empieza el viaje

Hoy empezamos escuchando el primer episodio del podcast Machine Learning Guide. Es justamente lo que estaba buscando ahora mismo, ya que se trata de un podcast en el que se explica de manera general qué es eso de Artificial Intelligence. Hasta ahora había escuchado varios podcast sobre Inteligencia artificial pero siempre trataban el tema, o bien desde un punto de vista divulgativo o bien desde un punto de visto demasiado técnico. Aparte de todos esos que tratan de noticias y entrevistas que, bueno, no son lo que estoy buscando ahora mismo.

Otro punto positivo acerca de este podcast es que, al menos en este primer capítulo, nos da un montón de referencias a otros podcasts y cursos varios donde podremos continuar aprendiendo. El mismo autor nos advierte que aprender inteligencia artificial a partir de un podcast no es lo más recomendable, por supuesto, pero es útil como extra a todos los ejercicios, etc. que vayamos a hacer.

Nos recomienda que el siguiente paso, después de escuchar su podcast, sobre todo si somos novatos, quizás sería continuar con Learning Machines 101. Le he echado un vistazo y, aunque se supone que tiene un nivel bajo, quizás trate temas que no me interesan del todo. Me gustaría centrarme, sobre todo, en Procesamiento del Lenguaje Natural y Análisis de Datos, así que puede que me salte algunas partes. 😀

Aparte del podcast, he buscado así a pelo en Youtube «intro to Data Science» y he encontrado este mini curso de un poco más de hora y media de FreeCodeCamp. Me he visto como la primera hora, pero todavía no he acabado. Creo que hace un buen resumen de esta rama. Cuando lo complete haré un post con un resumen del mismo.

¿Qué he aprendido hoy?

A primera hora de la mañana he tenido una entrevista de trabajo. Están buscando lingüistas computacionales y yo estoy buscando nuevos proyectos, así que ahí estoy. Suena bastante bien. Están desarrollando asistentes virtuales basados en IBM Watson, así que he buscado información sobre ello.

IBM Watson es un sistema de pregunta-respuesta capaz de enterder preguntas hechas en lenguaje natural. ¿Qué implica eso? Pues que tiene detrás mucho NLP, information retrieval, knowledge representation, automated reasoning y machine learning ya que no sólo entiende las preguntas sino que estas pueden ser… ¡acerca de cualquier dominio!

En términos de NLP frameworks, este sistema utiliza Apache UIMA. Esta entrenado con millones de documentos provenientes de enciclopedias, diccionarios, thesauros, noticias, obras literarias, bases de datos, ontologías. Algunos ejemplos son DBPedia, WordNet y Yago.

Actualmente, está muy enfocado al tema de la salud y la toma de decisiones en este campo.

Deberes

  • Investigar el framework Apache UIMA. Escribir post sobre él, bajármelo y cacharrear.
  • David Ferruci, cabeza del departamento de Análisis e integración semántica en IBM.
  • Antonio Torralba, director del MIT-IBM Watson AI Lab.
  • Investigar aplicaciones de Watson en educación: Pearson Education, Blackboard, Sesame Workshop, Apple.
  • Terminar de ver el curso de Data Science y escribir un post con lo que he aprendido.