Machine Learning. Algo \"diferente\". Segunda parte

3-Trabajar con los datos

$\"\"$

Gran parte de la informática todavía se trabaja con instrucciones explícitas. En la programación tradicional, se configura la máquina para aceptar una entrada y producir una salida basada en el algoritmo. La entrada es el comando y la salida es una respuesta predeterminada. Eso funcionará bien cuando tenga un programa con cálculos simples. Pero se vuelve un poco más complicado cuando los humanos no podemos instruir explícitamente a la máquina sobre qué hacer.

En estos casos, se necesita un modelo de programación que permita que la máquina aprenda. También debe darle a la máquina cierta capacidad para responder a los feedback. Este es un escenario perfecto para el machine learning.

Imagine que está creando un programa que necesita detectar mensajes spam. Estos mensajes suelen estar llenos de anuncios no deseados o incluso virus. Puede crear fácilmente un programa de filtro de palabras que elimine mensajes con palabras comunes de spam para que pueda filtrar palabras como oro, lotería o ganador. Esto eliminaría una gran cantidad de mensajes de spam, pero sería bastante fácil de suplantar. Pueden cambiar la palabra lotería para que contenga ceros o simplemente usen imágenes. También daría lugar a muchos falsos positivos. Tal vez tu amigo te quería gastar una broma diciéndote que ha ganado la lotería y pot consiguiente, este correo electrónico sería borrado accidentalmente.

Estos tipos de desafíos no funcionan bien cuando se está limitado a instrucciones definidas. No puede simplemente crear un comando de entrada con una respuesta predeterminada. Es por eso que el machine learning cambia las cosas. En lugar de ingresar instrucciones, ingresará datos. En lugar de una respuesta predefinida, trabajará con algoritmos de machine learning para ayudar a la máquina a aprender a responder.

Para comenzar, es conveniente dividir los datos en datos de prueba y datos de entrenamiento. Los datos de entrenamiento son un trozo más pequeño del conjunto de datos que se usarán para encontrar los patrones. A veces, un modelo ayudará a su máquina a dar sentido a los datos con algoritmos estadísticos. Estos algoritmos ayudan a la máquina a realizar predicciones precisas o a ver patrones entre diferentes partes de sus datos.

$\"\"$

Pensemos en cómo el machine learning podría funcionar con nuestro programa de spam. Tomemos 10,000 mensajes de correo electrónico como nuestro conjunto de datos de entrenamiento. Lo usaremos para construir y refinar nuestro modelo antes de probarlo en nuestros datos de prueba de más de un millón de mensajes. Puede usar sus datos de prueba para mostrarle a la máquina diferentes ejemplos de correo no deseado. Entonces podría usar un algoritmo clasificador para ayudar a dividir el correo electrónico en dos grupos:

Una bandeja de entrada
El correo no deseado

Esto a menudo se denomina clasificación binaria. La máquina hace esto al encontrar grupos de palabras que probablemente se encuentren en los mensajes de correo no deseado, luego muestra la probabilidad de que sea spam.

Como experto en machine learning, deberá decidir cuál es el mejor algoritmo de clasificación para usar. Luego ajustará los hiper-parámetros del algoritmo hasta que la máquina haga un buen trabajo para predecir si un mensaje de correo electrónico es o no spam. Una vez que estamos satisfechos, ese será su modelo de datos inicial. Utilizará un algoritmo de machine learning y ajustará los hiper-parámetros necesarios para hacer una predicción precisa.

La clave para recordar es que, aunque el programador ingresa los datos, selecciona los algoritmos y realiza las correcciones, es en última instancia la máquina la que toma la decisión sobre si un mensaje es correo no deseado. En algunos casos, el programador podría no saber cómo la máquina supo que era correo no deseado.

$\"\"$

4-Aplicar Machine learning

Machine learning es utilizado en distintos tipos de industrias. Cuando consultas el tiempo o si estás escribiendo algo en un buscador, ya te estás beneficiando del machine learning. Cualquier organización que tenga una gran cantidad de datos y esté buscando mejores formas de entenderlos, se puede beneficiar de esta tecnología. Sin embargo, se puede aplicar a situaciones no tan complejas.

Piensa en una aplicación web de visionado de videos. Cuando estás viendo un video en un dispositivo móvil o en tu ordenador, el machine learning puede ayudarnos a aprender a mejorar la experiencia de usuario. La aplicación puede recopilar una gran cantidad de datos y, cuando haces clic en videos diferentes, puede grabar lo que estás mirando, dónde estás y la hora del día. Es bastante fácil recolectar grandes cantidades de datos, lo difícil es obtener información útil de esos datos.

El machine learning puede ayudar a tomar toda esa información y aprender más sobre ti. Podrías ver videos que son mucho más relevantes para ti. Tal vez cuando busques algo nuevo, podrías tener una búsqueda personalizada en función de tus intereses. Esta aplicación puede estudiar tu comportamiento y ver cómo puede satisfacer mejor tus necesidades.

Puede parecer extraño, pero que una maquina estudie nuestro comportamiento se está convirtiendo en uno de los negocios más rentables de hoy en día. Empresas como Google, Facebook, Apple y LinkedIn utilizan machine learning para comprendernos mejor. Algunas compañías incluso sorteando la privacidad de sus usuarios, observando sus búsquedas anteriores o tratando de entender mejor a tus amigos.

$\"\"$

De esta forma, cada vez que se usen sus servicios, pueden brindar una experiencia personalizada al usuario. Es por eso que las noticias que muestra Facebook son únicas para casa usuario.

También es la razón por la cual dos personas que introducen exactamente el mismo término de búsqueda en Google pueden obtener resultados completamente diferentes.

Cada vez que estamos en un sitio web y vemos algo que dice \»Recomendado para usted\», es probable que nos estemos beneficiando del machine learning.

Amazon revisa todas sus compras anteriores y luego utiliza algoritmos de machine learning para recomendar artículos.

Netflix utiliza machine learning para encontrar patrones complejos y así recomendar contenidos según lo que ya hemos visto.

YouTube sugiere el próximo video basado en aquellos que se han visto en el pasado.

Lo hacen como una forma de hacer mejores recomendaciones para el usuario. Muchas organizaciones están utilizando machine learning para la traducciones automáticas.

YouTube utiliza un procesamiento del lenguaje natural para transcribir videos y generar subtítulos. Están traduciendo tu discurso en texto en tiempo real. Algunos sitios utilizarán el machine learning para traducir un conjunto de subtítulos en varios idiomas diferentes. Machine learning, está utilizando inteligencia artificial para ayudar a ciertas aplicaciones a encontrar patrones en conjuntos de datos masivos. A menudo, encuentran patrones en los datos que los humanos nunca podrían ver. Esa es una de las cosas más interesantes sobre el machine learning, no es solo una forma mejorada de aprendizaje humano. En cambio, es una forma completamente diferente de encontrar patrones, tomar decisiones y obtener mayores conocimientos. Entonces, si se desea utilizar el machine learning en una organización, se debe pensar en la forma en que aprende la máquina.

De esta forma, e puede comenzar a recopilar los datos que permitirán a las aplicaciones a comprender mejor a sus clientes. Antes de comenzar un proyecto de machine learning, se debe pensar en sus datos.

¿Son de buena calidad?
¿Tienen suficiente información para aprender algo nuevo?

Recuerde que esta es la forma en que su programa de machine learning verá el mundo. Cuanto más amplia es la vista, más probable es que encuentres algo interesante.

La semana que viene en el tercer capítulo hablaremos de los diferentes tipos de Machine Learning y del aprendizaje supervisado.