Romper los mitos de la IA: «Necesitas toneladas de datos para el aprendizaje automático»

Investigadores líderes como Karl Friston describen la IA como «inferencia activa» -creando modelos estadísticos computacionales que minimizan el error de predicción. El cerebro humano funciona de manera muy parecida, también aprendiendo de los datos. Un argumento común es:

«La IA nunca será inteligente porque necesita ver algo miles de veces para aprenderlo, mientras que un humano sólo necesita ver algo una vez.»

Otros lo ponen simplemente: » cuanto más, mejor. » Como describe este artículo de Medium, «cualquiera que tenga la misión de crear un producto de primera clase alimentado por IA necesita grandes cantidades de datos para alimentar a las máquinas», ya que se deben aprender múltiples parámetros y clases:

  1. Aprendizaje de transferencia (incluyendo aprendizaje de una sola vez y de tiro cero)
  2. Soluciones llave en mano
  3. (Alta calidad) pocos datos

1. Aprendizaje de transferencia

«El aprendizaje de transferencia es una técnica prometedora que nos permite transferir el conocimiento aprendido en un conjunto de datos y aplicarlo a otro conjunto de datos». – Bradley Arsenault

El aprendizaje de transferencia esencialmente toma el aprendizaje de un dominio y lo lleva a otro, por lo que no tiene que empezar desde 0. Esto es especialmente útil en dominios altamente específicos con pocos datos disponibles, para visualizarlo: Esta súper guía profundiza en los matices del aprendizaje de transferencia. Además de no tener que empezar desde cero con el aprendizaje de transferencia, existen métodos como el aprendizaje de una sola vez o incluso el aprendizaje de una sola vez, que permiten modelos de formación con datos mínimos; el aprendizaje de una sola vez consiste en inferir la producción requerida basándose en sólo uno o unos pocos ejemplos de formación, como se discute en este documento: One Shot Learning of Object Categories El aprendizaje de tiro cero es una versión más extrema de lo anterior, en la que no se utilizan ejemplos etiquetados para aprender una tarea.

2. Soluciones llave en mano

El segundo método de despliegue de la IA con menos datos es mediante el uso de soluciones llave en mano, que ya están pre-entrenadas en cantidades masivas de datos.

>
He aquí algunos ejemplos: Google Cloud AI «El centro de inteligencia artificial de Google Cloud proporciona capacidades de uso compartido de nivel empresarial, incluidos los canales de inteligencia artificial de extremo a extremo y los algoritmos listos para usar, que permiten a su organización alojar de forma privada contenido de inteligencia artificial para fomentar la reutilización y la colaboración entre los desarrolladores y usuarios internos….». Plataforma Microsoft Azure AI «Only Azure te da el poder con las capacidades de aprendizaje más avanzadas de la máquina. Construya, entrene e implemente rápida y fácilmente sus modelos de aprendizaje de máquinas utilizando Azure Machine Learning, Azure Databricks y ONNX…». Amazon Machine Learning «AWS pre-trained AI Services proporciona inteligencia lista para sus aplicaciones y flujos de trabajo. AI Services se integra fácilmente con sus aplicaciones para abordar casos de uso común, como recomendaciones personalizadas, modernizar su centro de contacto, mejorar la seguridad y la protección y aumentar el compromiso de los clientes…».

3. Pequeños datos

Más datos no siempre son mejores , especialmente si los datos no están etiquetados, no son indicativos del problema en cuestión o están sucios. Puede que tenga millones de filas, pero si se trata de datos complicados que no son relevantes para el problema y que sólo se pueden utilizar con aprendizaje no supervisado, entonces sería mucho mejor tener un conjunto de datos más pequeño, altamente orientado y limpio:

  • ¿Ya tiene los datos que necesita?
  • ¿Cuál es su caso de uso y cuáles son los datos mínimos necesarios para abordarlo?
  • ¿Qué tan avanzada está su organización (realmente) cuando se trata de AI/ML?

Aunque los grandes datos están de moda, no es la única manera de alimentar los modelos ML. Por ejemplo, «los investigadores de Vicarious han desarrollado un modelo que puede romper los CAPTCHAs a un ritmo mucho mayor que las redes neuronales profundas y con una eficiencia de datos 300 veces mayor». Su modelo sólo necesitaba cinco ejemplos de entrenamiento por personaje, en conclusión, más datos pueden ser mejores, y si lo tienes disponible, ¡entonces genial! Sin embargo, si no lo hace, todavía hay formas de implementar la IA en su organización.

Etiquetas

DatosAprendizaje de la máquinaArranquesInteligencia ArtificialHackernoon Top StoryAwsBig Data

Comentarios

Hackerhodl16 de septiembre de 2019

Gracias por decir esto. Esta es una idea errónea común que ha estado ocurriendo durante demasiado tiempo.

Continúe la discusión