¿Qué es la anotación de imágenes? – Introducción a los 5 servicios de anotación de imágenes

La anotación de imágenes es una de las tareas más importantes en la visión por computador. Con numerosas aplicaciones, la visión por computador esencialmente se esfuerza por dar a los ojos de una máquina – la capacidad de ver e interpretar el mundo. A veces, los proyectos de aprendizaje de máquinas parecen desbloquear una tecnología futurista que nunca creímos posible. Las aplicaciones impulsadas por la IA, como la realidad aumentada, el reconocimiento automático de voz y la traducción neural automática, tienen el potencial de cambiar vidas y negocios en todo el mundo. Asimismo, las tecnologías que nos puede dar la visión por computador (vehículos autónomos, reconocimiento facial, drones no tripulados) son extraordinarias, sin embargo, ninguna de estas asombrosas tecnologías de visión por computador sería posible sin la anotación de imágenes. Este artículo explicará lo que es la anotación de imágenes y cinco servicios de anotación de imágenes proporcionados por numerosas empresas de datos de formación de todo el mundo.

¿Qué es la anotación de imágenes?

La anotación de imágenes es la tarea que realiza el ser humano de anotar una imagen con etiquetas. Estas etiquetas son predeterminadas por el ingeniero de Inteligencia Artificial y se eligen para dar al modelo de visión artificial información sobre lo que se muestra en la imagen, dependiendo del proyecto, la cantidad de etiquetas en cada imagen puede variar. Algunos proyectos requieren sólo una etiqueta para representar el contenido de una imagen completa (clasificación de imágenes). Otros proyectos pueden requerir que se etiqueten múltiples objetos dentro de una misma imagen, cada uno con una etiqueta diferente. ¿Cómo funciona la anotación de imágenes? Para crear imágenes comentadas se necesitan tres cosas:

  1. Imágenes
  2. Alguien que anote las imágenes
  3. Una plataforma para anotar las imágenes en

La mayoría de los proyectos de anotación de imágenes comienzan con la contratación y la formación de los anotadores para realizar las tareas de anotación. La IA es un campo muy especializado, pero la anotación de los datos de formación de la IA no siempre tiene que serlo. Mientras que se necesita una educación superior en el aprendizaje de la máquina para poder crear un coche de autoconducción, no se necesita un título de maestría para dibujar cajas alrededor de los coches en imágenes (anotación de caja delimitadora). Por lo tanto, la mayoría de los anotadores no tienen títulos en aprendizaje automático.Sin embargo, estos anotadores deben ser entrenados a fondo en las especificaciones y directrices de cada proyecto de anotación , ya que cada empresa tendrá requisitos diferentes. Una vez que los anotadores son entrenados en cómo anotar los datos, se pondrán a trabajar anotando cientos o miles de imágenes en una plataforma dedicada a la anotación de imágenes. Esta plataforma es un software que debe tener todas las herramientas necesarias para el tipo específico de anotación que se está realizando.

5 Servicios comunes de anotación de imágenes

1. Cajas de encuadernación 2D y 3D

Con las cajas delimitadoras 2D, los anotadores deben dibujar una caja alrededor del objeto que desean anotar dentro de la imagen. A veces estos objetos de destino serán los mismos, es decir, “Por favor, dibuje cajas alrededor de cada bicicleta en esta imagen”. Otras veces, puede haber más de un objeto de destino, “Por favor, dibuje cajas alrededor de cada coche, peatón y bicicleta en esta imagen”. En esos casos, después de dibujar la caja, el anotador tendría que elegir de una lista de etiquetas para atribuir al objeto dentro de la caja. También conocidas como cuboides, las cajas delimitadoras 3D son casi iguales a las cajas delimitadoras 2D, excepto que también pueden mostrar la profundidad aproximada de los objetos de destino que se están anotando. De forma similar a las anotaciones de caja delimitadora 2D, los anotadores dibujan cajas alrededor de los objetos de destino, asegurándose de colocar puntos de anclaje en los bordes del objeto. A veces, una parte del objeto de destino puede estar bloqueada. En tales casos, los anotadores se aproximarían a la ubicación de los bordes bloqueados del objeto de destino.

2. Clasificación de imágenes

Mientras que los bounding boxes tratan sobre la anotación de múltiples objetos en una imagen, la clasificación de imágenes es el proceso de asociar una imagen completa con una sola etiqueta. Un ejemplo simple de clasificación de imágenes es el etiquetado de tipos de animales. A los anotadores se les darían imágenes de animales y se les pediría que clasificaran o categorizaran cada imagen basándose en la especie animal. La alimentación de estos datos de imagen anotados a un modelo de visión por ordenador enseñaría al modelo las características visuales únicas de cada tipo de animal. En teoría, el modelo podría entonces categorizar nuevas imágenes de animales no anotadas en las categorías de especies apropiadas.

<br /> </ i> </ i>
3. Líneas y estrías

Como su título sugiere, la anotación de líneas y splines es el etiquetado de líneas rectas o curvas en las imágenes. A los anotadores se les asignaría la tarea de anotar carriles, aceras, líneas eléctricas y otros indicadores de límites. Las imágenes anotadas con líneas y splines se utilizan principalmente para el reconocimiento de carriles y límites. Desde vehículos autónomos y drones hasta robótica en almacenes y más, las anotaciones de líneas y splines son útiles en una variedad de casos de uso.

4. Polígonos

A veces, los objetos de destino con formas irregulares no se pueden anotar fácilmente con cajas delimitadoras o cuboides. La anotación de polígonos permite a los anotadores trazar puntos en cada vértice del objeto de destino. Este método de anotación permite anotar todos los bordes exactos del objeto, independientemente de su forma Al igual que los cuadros delimitadores, los píxeles dentro de los bordes anotados se etiquetarían con una etiqueta para describir el objeto de destino.

5. Segmentación semántica

Las cajas de encuadernación, los cuboides y los polígonos se ocupan de la tarea de anotar objetos individuales en una imagen. Sin embargo, la segmentación semántica es la anotación de cada píxel dentro de una imagen. En lugar de dar a los anotadores una lista de objetos a anotar, se les da una lista de etiquetas de segmento en las que dividir la imagen.Un buen ejemplo es la segmentación semántica en imágenes de tráfico para vehículos autónomos. Una tarea típica de segmentación semántica podría pedir a los anotadores que “segmenten la imagen por vehículos, bicicletas, peatones, obstáculos, aceras, carreteras y edificios”.Cada segmento suele estar indicado por un código de color único. Los anotadores dibujarían líneas alrededor de los píxeles que desean anotar y seleccionarían la etiqueta apropiada. El resultado final sería algo así: Imagen vía medium.com/intro-to-artificial-intelligence Esperemos que este artículo le haya ayudado a entender los conceptos básicos de cinco servicios de anotación de imágenes bajo demanda en el aprendizaje automático. Si buscas más información sobre la anotación de imágenes y la IA, no dejes de visitar:Image Annotation – an overviewNotes on Image AnnotationImage Annotation for Video Games<br />

Etiquetas

Inteligencia ArtificialCiencia de DatosAprendizaje de MáquinasHistorias Tecnológicas más recientesAnotación de ImágenesServicios de Anotación de ImágenesQué es la Anotación de ImágenesAi

Comentarios

Continúe la discusión