El errático comportamiento de las personas durante la pandemia confunde a los modelos de Inteligencia Artificial

Los modelos de Machine Learning entrenados en el comportamiento normal están mostrando, en el contexto actual, importantes grietas, obligando, así, a los humanos a intervenir para reorientarlos. En la semana del 12 al 18 de abril, los 10 términos de búsqueda más importantes en Amazon.com fueron: papel higiénico, máscara facial, desinfectante de manos, servilletas de papel, aerosol Lysol®, toallitas Clorox®, …

Los modelos de Machine Learning entrenados en el comportamiento normal están mostrando, en el contexto actual, importantes grietas, obligando, así, a los humanos a intervenir para reorientarlos.

En la semana del 12 al 18 de abril, los 10 términos de búsqueda más importantes en Amazon.com fueron: papel higiénico, máscara facial, desinfectante de manos, servilletas de papel, aerosol Lysol®, toallitas Clorox®, máscara, Lysol®, mascarillas de protección contra gérmenes y mascarilla N95. La gente no sólo buscaba estos productos, sino que, también, los compraba “a granel”. La mayoría de la gente que buscaba mascarillas terminó comprando las mascarillas quirúrgicas Amazon #1 Best Seller, “Face Mask, Pack of 50”.

Cuando se instaló el Covid-19 en gran parte de Occidente, se empezaron a comprar cosas que nunca antes se compraban. El cambio fue repentino: las carcasas de los móviles, los cargadores de teléfono y los Lego desaparecieron de los top ventas de Amazon en cuestión de días. Nozzle, una consultora con sede en Londres especializada en publicidad algorítmica para los vendedores de Amazon, capturó el rápido cambio en este simple gráfico.

$\"\"$

A finales de febrero, se tardó menos de una semana en compilar los 10 principales términos de búsqueda de Amazon en múltiples países con productos relacionados con el Covid-19. De esta forma, se puede rastrear la propagación de la pandemia sobre la base de los productos que ha ido adquiriendo la sociedad: los artículos llegaron primero a Italia, seguidos por España, Francia, Canadá y los EE.UU. El Reino Unido y Alemania están ligeramente rezagados, al igual que en México. “Es una transición increíble en el espacio de cinco días”, dice Rael Cline, director general de Nozzle. Los efectos de la onda expansiva se han visto en todas las cadenas de suministro de los minoristas.

Pero también han afectado a la Inteligencia Artificial, desencadenando vértigo en los algoritmos que se ejecutan en background para la gestión de inventarios y cadenas de suministro, la detección de fraudes, la comercialización, etc. Los modelos de machine learning entrenados en el comportamiento humano, están encontrando que, ahora, lo normal ha cambiado, y algunos ya no funcionan como deberían.

La gravedad de la situación depende de con quién se hable. Según Pactera Edge, una consultora especializada en Inteligencia Artificial, “la Inteligencia Artificial parece estar cayendo en barrena”. Otros dicen que están vigilando con cautela los sistemas automatizados, que solo están a la espera, interviniendo con una corrección manual aquí y allá cuando es necesario.

Lo que está claro, es que la pandemia ha revelado lo entrelazadas que están nuestras vidas con la Inteligencia Artificial, exponiendo una delicada codependencia en la que los cambios en nuestro comportamiento cambian cómo funciona ésta, y los cambios en su funcionamiento, por ende, cambian nuestro comportamiento. Esto también es un recordatorio de que la participación humana en los sistemas automatizados sigue siendo clave. “Nunca puedes sentarte y olvidar cuando estás en circunstancias tan extraordinarias”, dice Cline

Los modelos de aprendizaje automático están diseñados para responder a los cambios. Pero la mayoría también son frágiles; funcionan mal cuando los datos de entrada difieren demasiado de los datos con los que fueron entrenados. Es un error asumir que se puede establecer un sistema de Inteligencia Artificial y desentenderse. Rajeev Sharma, vicepresidente global de Pactera Edge, dice: “La Inteligencia Artificial es un motor que respira y vive”.

Sharma ha estado hablando con varias compañías que luchan con la Inteligencia Artificial “rebelde”:

Una empresa que suministra salsas y condimentos a minoristas en la India necesitaba ayuda para arreglar su sistema automatizado de gestión de inventario cuando los pedidos a granel rompieron sus algoritmos de predicción. Los pronósticos de ventas del sistema en los que la compañía confiaba para reordenar las existencias ya no coincidían con lo que realmente se vendía. “Nunca fue entrenado en un pico como este, por lo que el sistema estaba fuera de lugar”, dice Sharma.
Otra empresa utiliza una Inteligencia Artificial para evaluar el sentimiento de los artículos de noticias y proporciona diariamente recomendaciones de inversión basadas en los resultados. Pero como las noticias en este momento son más sombrías que de costumbre, el consejo va a ser muy sesgado, dice Sharma.
Una gran empresa de streaming, como es Netflix, ha tenido una repentina afluencia de suscriptores ávidos de contenido, también está teniendo problemas con sus algoritmos de recomendación, además de una sobredemanda de contenidos en 4K. La compañía utiliza algoritmos de machine learning y contenedores Docker para sugerir contenido relevante y para dimensionar la calidad de los contenidos, escalando con contenedores para personalizar contenidos a los espectadores y que éstos sigan volviendo y para ofrecerlos a la calidad ofertada. Pero el cambio repentino en los datos de los suscriptores estaba haciendo que las recomendaciones de su sistema fueran menos precisas y la calidad del servicio sufriera una ligera degradación.

Muchos de estos problemas con los modelos surgen porque muchas empresas están comprando sistemas de machine learning, pero carecen de los conocimientos técnicos internos necesarios para mantenerlos. El reciclaje de un modelo sin duda va a requerir de la intervención humana experta.

La crisis actual también ha demostrado que las cosas pueden empeorar más que los peores escenarios incluidos en los sets de entrenamiento de los algoritmos. Sharma cree que se debería entrenar a más a los sistemas de Inteligencia Artificial y no sólo en los altibajos de los últimos años, sino, también, en eventos inesperados como la Gran Depresión de los años 30, la caída de la bolsa del Lunes Negro en 1987 y la crisis financiera de 2007-2008 – en definitiva, en la detección de Cisnes Negros. “Una pandemia como esta es un perfecto detonante para construir mejores modelos de aprendizaje automático”, dice.

Aun así, uno no puede prepararse para cualquier eventualidad. En general, si un sistema de machine learning no ve lo que espera ver, entonces tendrá problemas, dice David Excell, fundador de Featurespace, una compañía de análisis de comportamiento que usa la Inteligencia Artificial para detectar el fraude de tarjetas de crédito. Tal vez, sorprendentemente, Featurespace no ha visto su sistema de Inteligencia Artificial muy afectada. La gente sigue comprando cosas en Amazon y suscribiéndose a Netflix como antes, pero no están comprando artículos de gran valor o gastando en nuevos lugares, que son los comportamientos que pueden levantar sospechas. “El comportamiento de gasto de la gente es una contracción de sus viejos hábitos”, dice Excell.

Los ingenieros de la empresa sólo tuvieron que intervenir para adaptarse a la oleada de personas que compraban útiles para el jardín y herramientas eléctricas, dice Excell. Estos son los tipos de compras anómalas de precio medio que los algoritmos de detección de fraudes podrían detectar. “Creo que, ciertamente, hay más supervisión”, dice Excell. “El mundo ha cambiado, y los datos han cambiado.”

Para que el tono sea el correcto

Phrasee, con sede en Londres, es otra compañía de Inteligencia Artificial con gran experiencia. Utiliza el procesamiento del lenguaje natural y el machine learning para generar emails de marketing de anuncios de Facebook en nombre de sus clientes. Asegurarse de que tiene el tono correcto es parte de su trabajo. Su Inteligencia Artificial trabaja generando muchas frases posibles y, luego, las ejecuta a través de una red neural que elige las mejores. Pero debido a que la generación de lenguaje natural puede ser completamente errónea, Phrasee siempre hace que personas de su equipo comprueben lo que entra y sale de su sistema de Inteligencia Artificial.

Cuando llegó el covid 19, Phrasee se dio cuenta de que podría requerirse más sensibilidad de la habitual y comenzó a filtrar el lenguaje adicional. La compañía ha prohibido frases específicas, como “volverse viral”, y no permite lenguaje que se refiera a actividades desalentadoras, como “ropa de fiesta”. Incluso ha seleccionado emojis que pueden ser leídos como demasiado felices o demasiado alarmantes. Y también ha dejado caer términos que pueden avivar la ansiedad, como “OMG”, “prepárate”, o “abastécete”. “La gente no quiere que el marketing los haga sentir ansiosos y temerosos, ya sabes, como si esta promoción estuviera a punto de agotarse”, dice Parry Malm, el CEO de la firma.

Sin embargo, como microcosmos para la industria minorista en su conjunto, no se puede superar a Amazon. También es donde se hacen algunos de los más sutiles ajustes “entre bastidores”. Mientras Amazon y los 2,5 millones de vendedores terceros que apoya luchan por satisfacer la demanda, está haciendo pequeños ajustes a sus algoritmos para ayudar a repartir la carga.

La mayoría de los vendedores de Amazon dependen de Amazon para cumplir con sus pedidos. Los vendedores almacenan sus artículos en un almacén de Amazon y ésta se encarga de toda la logística, entregándolos a los hogares y manejando las devoluciones. Luego promociona a los vendedores cuyos pedidos gestionan ellos mismos, en vez de los vendedores de su marketplace. Por ejemplo, si se busca un artículo específico, como un Mando de Nintendo Wii, el resultado que aparece en la parte superior, junto al botón prominente “Añadir a la cesta”, es muy probable que sea de un vendedor que utiliza la logística de Amazon que de uno que no la utiliza.

Pero en las últimas semanas Amazon ha dado la vuelta a eso, dice Cline. Para aliviar la demanda en sus propios almacenes, sus algoritmos, ahora, parecen más propensos a promover a los vendedores que manejan sus propias entregas.

Mercados volátiles

Este tipo de ajuste sería difícil de hacer sin intervención manual. “La situación es tan volátil”, dice Cline. “Estabas tratando de optimizar para el papel higiénico la semana pasada, y esta semana todos quieren comprar puzzles o equipamiento para realizar gimnasia.”

Los retoques que Amazon hace a sus algoritmos, tienen efectos en los algoritmos que los vendedores usan para decidir qué gastar en publicidad online. Cada vez que una página web con anuncios se carga, una subasta súper rápida tiene lugar donde los ofertantes automáticos deciden entre ellos quién va a llenar cada casilla de anuncios. Estas subastas, dado que son algoritmos y tienen una reacción de milisegundos, van en general sobre tecnología de contenedores, los cuales son capaces de escalar y desescalar muy rápidamente y hacer posible la subasta en casi tiempo real. La cantidad que estos algoritmos deciden gastar en un anuncio depende de un sinfín de variables, pero en última instancia, la decisión se basa en una estimación sobre cuánto tú (los ojos de la página), vales para ellos. Hay muchas maneras de predecir el comportamiento de los clientes, incluyendo no sólo los datos sobre sus compras pasadas, sino también el casillero en el que las compañías de publicidad lo han colocado en base a su actividad en línea.

Pero ahora uno de los mejores pronósticos de si alguien que hace clic en un anuncio comprará su producto, es el tiempo que muestran que tardarán en entregarlo. Así que una medida que se está aplicando es hablar con los clientes sobre el ajuste de sus algoritmos para tener esto en cuenta. Por ejemplo, si piensas que no puedes entregar más rápido que un competidor, puede que no valga la pena intentar superar su oferta en una subasta de anuncios. Por otro lado, si sabes que tu competidor se ha quedado sin existencias, entonces puedes entrar barato, apostando a que no hará una oferta.

Todo esto sólo es posible con un equipo humano dedicado a vigilar todas las posibles variables. Piense que la situación actual es una revelación para mucha gente que asumió que todos los sistemas automatizados podían funcionar por sí mismos. “Se necesita un equipo de Ciencia de Datos que pueda conectar lo que está pasando en el mundo con lo que está pasando en los algoritmos”, dice Cline. Hay que tener en cuenta que los algoritmos nunca recogerían algunas de estas situaciones.

Cómo benefician los contenedores el ciclo de vida de Machine Learning (ML)

El uso de contenedores puede acelerar en gran medida el desarrollo de modelos de aprendizaje automático. Los entornos de desarrollo en contenedores se pueden aprovisionar en minutos, mientras que los entornos tradicionales de VM o bare-metal pueden llevar semanas o meses. Con la situación actual, hay que tener una infraestructura que nos permita readaptar rápidamente los algoritmos para poder ajustarlos y relanzarlos. El procesamiento de datos y la extracción de características son una parte clave del ciclo de vida de ML. El uso de entornos de desarrollo en contenedores hace que sea fácil levantar clústeres cuando sea necesario y volver a bajarlos cuando haya terminado. De este modo, se ha incrementado su uso durante la pandemia ya que las personas han tenido que trabajar duro para ir readaptando los modelos. Así pues, mientras los algoritmos erráticos seguían operativos, se iban desarrollando las versiones mejoradas y entrenadas a conciencia para que, posteriormente, se realice el cambio de versión sin perdidas de servicio. Durante la fase de capacitación, los contenedores brindan la flexibilidad para crear entornos de capacitación distribuidos en varios hosts, lo que permite una mejor utilización de los recursos de infraestructura. Y una vez que estén capacitados, los modelos se pueden alojar como puntos finales de contenedor e implementarse en las instalaciones, en la nube pública o en donde se desee.

Estos puntos finales pueden ampliarse o reducirse para satisfacer la demanda, proporcionando así la fiabilidad y el rendimiento necesarios para estas implementaciones. Por ejemplo, si está sirviendo un sitio web minorista con un motor de recomendación, puede agregar más contenedores para activar instancias adicionales del modelo a medida que más usuarios comienzan a acceder al sitio web. Posteriormente, cuando la demanda disminuye, puede parar los contenedores al dejar de ser necesarios, lo que mejora la utilización de costosos recursos de hardware.

Conclusiones

Con la filosofía del \»todo conectado\» de moda, el impacto de una pandemia como la que se está viviendo actualmente, se ha sentido a lo largo y ancho, tocando mecanismos que en tiempos más típicos permanecen ocultos. Si buscamos un resquicio de esperanza, ahora es el momento de hacer un balance de esos sistemas recién expuestos y preguntarnos cómo podrían diseñarse mejor, hacerse más resistentes. Aunque las máquinas sean de confianza, tenemos que vigilarlas, para verificar su correcto comportamiento y funcionamiento.

No podemos olvidar que todos estos algoritmos funcionan bajo una infraestructura tecnológica que, a su vez, está soportada por unos contenedores. Sin ellos, junto con las personas que los mantienen, tampoco sería posible su actualización y adaptación a las cambiantes circunstancias.

Con las grandes mutaciones que está sufriendo la sociedad, a todos los niveles, hay que poder reaccionar lo más rápido posible y gracias a las personas involucradas en el desarrollo de los algoritmos de machine learning, mantenimiento de infraestructuras y actualización de contenedores, se está consiguiendo.