Tecnología

El aprendizaje automático se transforma: calidad de los datos y necesidades operativas

Aprendizaje automático

El aprendizaje automático tiene reacciones encontradas. Por un lado, algunos ven el aprendizaje automático como la nueva superpotencia de una empresa que ha «inundado la tecnología empresarial y utiliza enormes cantidades de datos y algoritmos para hacer predicciones». Al mismo tiempo, el aprendizaje automático se ha visto como una moda sobrevalorada y una panacea que no funciona. Si bien ambos pueden ser ciertos, las organizaciones deben incorporar el aprendizaje automático para automatizar el negocio.

IDC estima que «el gasto global en sistemas de inteligencia cognitiva y artificial (IA) alcanzará los 19.100 millones de dólares en 2020, un 54,2 por ciento más que en 2017». Además, “para 2021, más del 40 por ciento de las iniciativas de transformación digital utilizarán servicios de IA”. Incluso las naciones están planeando fortalecer la inteligencia artificial (IA) y las capacidades de aprendizaje automático. Australia proporcionará «US $ 29,9 millones durante cuatro años para proyectos que utilicen las tecnologías». Ignorar las tecnologías de aprendizaje automático porque están sobrevaloradas tiene un alto precio, incluida la pérdida de innovación y luego de negocios.

¿Cómo pueden las empresas utilizar el aprendizaje automático de forma eficaz? Hollywood ofrece los primeros conocimientos sobre Juegos de guerra, estrenada en 1983. En la película, el profesor Stephen Falken crea Joshua, inteligencia artificial de aprendizaje automático, para ayudar a la Fuerza Aérea de EE. UU. a mejorar sus estrategias militares. La trama se complica cuando un adolescente piratea el sistema para jugar un juego de Global Thermal Nuclear War, solo para descubrir que el juego comenzaría una guerra nuclear real. Juegos de guerra proporciona un marco para evaluar casos de uso de aprendizaje automático exitosos y fallidos.

  • Empiece de a poco con el aprendizaje automático (la Fuerza Aérea dio un salto cuando Joshua controló misiles nucleares e intentó ganar una guerra nuclear)
  • Las computadoras necesitan conjuntos de datos de alta calidad (el conjunto de datos inicial de Joshua tenía lagunas para ayudar a la computadora a aprender. Cuando el profesor Falken le presenta a Joshua el juego del tic-tac-toe, la IA puede detectar la inutilidad de la guerra nuclear y detener la cuenta regresiva).
  • Después de todo, el programa de aprendizaje automático tiene que adaptarse al contexto. (Joshua no tenía autoridad para tomar decisiones sobre el lanzamiento de misiles y, afortunadamente, pudo aprender a no lanzar ya que la guerra nuclear no es una victoria).

Empiece poco a poco con el aprendizaje automático

Seth Deland señala que los tomadores de decisiones deben tener una comprensión tecnológica de las tecnologías de aprendizaje automático. Las tecnologías actuales de aprendizaje automático se caracterizan por encontrar patrones y reconocer conocimientos con pasos discretos. Los proyectos que hagan un uso óptimo de esta fuerza tendrán éxito.

Por ejemplo, el proyecto senegalés para esterilizar los machos de mosca tsetsé con rayos gamma ha logrado contener la propagación de la enfermedad del sueño. “El aprendizaje automático deprimió la población de moscas en un 98 por ciento con una disminución simultánea de la enfermedad del sueño”. Las propiedades de luz específicas diferencian a las moscas macho de las hembras. Utilizando un conjunto específico de imágenes, los algoritmos aprendieron cómo clasificar rápidamente una gran cantidad de moscas macho y cómo simplificar la esterilización de la mosca tsetsé masculina.

Dado que el proyecto tsetsé utilizó las fortalezas de las tecnologías de inteligencia artificial con un objetivo específico y discreto, a saber, averiguar el género de las moscas, el enfoque de aprendizaje automático fue exitoso, especialmente porque lleva mucho tiempo y trabajo para los humanos clasificar las moscas tsetsé. .

Por otro lado, puede ser fácil crear un proyecto de aprendizaje automático con un propósito amplio, pero eso no requiere todo para que la tecnología funcione. Terry Moon, arquitecto de información en McCormick, realizó un estudio de viabilidad sobre el uso del aprendizaje automático para la calidad de los alimentos.

Un año después del inicio del proyecto, McCormick congeló el conjunto de datos del proyecto al darse cuenta de que el mantenimiento del aprendizaje automático era demasiado costoso y requería mucho tiempo. Moon cambió de rumbo y consideró cómo manejar la gran cantidad de datos.

Después de que Moon intentó desarrollar algunas API para resolver el problema de datos de McCormick, Moon buscó un proveedor con una plataforma para ayudar. Se conectó con Ravi Shankar y usó la plataforma Denodo para conectar los datos de McCormick juntos, en tiempo real en un punto, con más accesibilidad. Para abordar este problema, McCormick continuó con sus proyectos de aprendizaje automático.

En marzo de 2018, McCormick estaba en funcionamiento con tecnologías de aprendizaje automático y ha expandido esa tecnología durante los próximos tres años. En su experiencia, Moon aconseja a las empresas que se tomen su tiempo con las implementaciones de virtualización de datos, como abordar cuestiones como las pautas para conectarse a un conjunto de sistemas de origen en lugar de a otro.

El aprendizaje automático debe ser de calidad de datos para tener éxito

El aprendizaje automático requiere datos precisos y completos y debe tener datos de calidad. Como informa Paramita Ghosh, «Se necesita mucho esfuerzo manual para limpiar y ejecutar estos datos, y también agregar inteligencia empresarial». Para aquellos que tienen datos de buena calidad de proyectos anteriores, programas o aplicaciones existentes, esto puede ser más fácil punto de partida para la aplicación del aprendizaje automático.

Por ejemplo, RR Donnelley (ahora RRD), una empresa de Fortune 500, agregó un departamento de logística para averiguar cuál es la mejor manera de enviar materiales impresos. El personal de RRD y las universidades escribieron algoritmos que analizaban información geográfica, meteorológica y de tráfico ya confiable y disponible de los teléfonos celulares de los conductores. Estos programas aprendieron y actualizaron su programación y recomendaron cambios espontáneos en las rutas de envío. Los datos de GPS móviles proporcionan información confiable basada en estándares fijos.

Los resultados indican que las ventas netas aumentaron un 3,7 por ciento, en parte debido a la logística. Lección: si tiene fácil acceso a un conjunto de datos estándar confiable, considere usarlo primero para un proyecto de aprendizaje automático.

Ignorar la calidad de los datos introducidos en los algoritmos conduce al fracaso de un proyecto de aprendizaje automático, especialmente los bots de chat. James Mickens explica esto elocuentemente en enero.la Simposio de seguridad de Usenix. Utiliza el ejemplo de Tay, un bot de chat desarrollado por Microsoft, para charlar y aprender de la gente en Internet. Un día, Tay pasó de twittear mensajes alentadores a adorar a Hitler y escupir comentarios racistas y misóginos. Tay fue retirado al día siguiente y Microsoft se disculpó.

Facebook también tuvo problemas con los chatbots de Alice y Bob, quienes desarrollaron su propio lenguaje para conversar consigo mismos y perder el sentido de hablar con la gente. El dispositivo Echo de Amazon, Alexa, intentó ordenar casas de muñecas para algunos californianos después de recibir un comentario en un noticiero matutino como una orden. Las empresas se sentirán avergonzadas sin una buena calidad de datos que la máquina oriente hacia su propósito, especialmente si la máquina aprende a través de chatbots.

Los algoritmos de aprendizaje automático son específicos de la aplicación

Un algoritmo de aprendizaje automático puede tener éxito en un área pero fallar en otra. en el 10 algoritmos de aprendizaje automático que debes conocer, la toma de decisiones varía según el programa. Además, un estilo de aprendizaje automático que falla en un entorno puede tener éxito en otro.

Watson de IBM contribuyó en gran medida a ayudar a KPMG LLP a recaudar impuestos para los departamentos de investigación y desarrollo de la empresa. Watson aprende a través del procesamiento del lenguaje natural utilizando Hidden Markov Model Systems, o HMM. HMM establece palabras como estados y calcula la probabilidad de transiciones lingüísticas, lo cual es muy útil en el lenguaje legal. Después de completar su formación, Watson consiguió el tratamiento fiscal correcto tres de cada cuatro veces.

Esto permite a las empresas hacer un mejor uso del crédito fiscal para investigación y desarrollo del gobierno, lo que da como resultado una documentación de mayor calidad para el IRS y un ahorro de tiempo laboral. Watson pudo mantenerse al día con las muchas variaciones de regulaciones, leyes y procesos legales para producir buenos resultados fiscales para este incentivo de I + D.

Esto contrastaba con su trabajo en un proyecto de cáncer a gran escala. El proyecto Watson Health de IBM no ha sido útil para diagnosticar y tratar el cáncer. En febrero de 2018, Houston MD Anderson Cancer Center perdió $ 39 millones en un proyecto de aprendizaje automático con un presupuesto de $ 2.4 millones.

Expectativas poco realistas de que Watson, que se adapta a los algoritmos de aprendizaje automático haciendo pequeños cambios, podría comprender cómo las variaciones genéticas en el cáncer contribuyeron al proyecto fallido. Si el proyecto se hubiera limitado a las habilidades de aprendizaje de Watson, por ejemplo, para identificar un cáncer en particular basándose en conjuntos de datos de imágenes de tumores, el proyecto podría haber tenido más éxito.

Conclusión

Los casos de uso de aprendizaje automático nos muestran que la tecnología funciona mejor con objetivos específicos, buenos conjuntos de datos y una comprensión de las fortalezas y debilidades del algoritmo. El aprendizaje automático necesita más innovaciones tecnológicas para lograr otros objetivos. Dr. Pierre-Yves Oudeyer, investigador de inteligencia artificial en Inria, el instituto nacional francés de informática en París, sugiere que las máquinas necesitan curiosidad para aprender. Debido a que algunos objetivos comerciales van más allá de los avances actuales del aprendizaje automático, las organizaciones deben mantenerse al día con la tecnología y los casos de uso antes de adoptar el aprendizaje automático.

Imagen utilizada bajo licencia de Shutterstock.com