ⓘ Segmentación, procesamiento de imágenes. La segmentación en el campo de la visión artificial es el proceso de dividir una imagen digital en varias partes u obje ..

                                     

ⓘ Segmentación (procesamiento de imágenes)

La segmentación en el campo de la visión artificial es el proceso de dividir una imagen digital en varias partes u objetos. El objetivo de la segmentación es simplificar y/o cambiar la representación de una imagen en otra más significativa y más fácil de analizar. La segmentación se usa tanto para localizar objetos como para encontrar los límites de estos dentro de una imagen. Más precisamente, la segmentación de la imagen es el proceso de asignación de una etiqueta a cada píxel de la imagen de forma que los píxeles que compartan la misma etiqueta también tendrán ciertas características visuales similares.

El resultado de la segmentación de una imagen es un conjunto de segmentos que cubren en conjunto a toda la imagen, o un conjunto de las curvas de nivel extraídas de la imagen véase la detección de bordes. Cada uno de los píxeles de una región son similares en alguna característica, como el color, la intensidad o la textura. Regiones adyacentes son significativamente diferentes con respecto a las mismas características.

                                     

1. Bases de los algoritmos de segmentación

Los algoritmos de segmentación se basan en los siguientes principios:

1. Discontinuidades del nivel de gris. Consisten en segmentar la imagen a partir de los cambios grandes en los niveles de gris entre los píxeles. Las técnicas que utilizan las discontinuidades como base son la detección de líneas, de bordes, de puntos aislados,…

2. Similitud de niveles de gris. Es lo contrario al método anterior, las divisiones de la imagen se hacen agrupando los píxeles que tienen unas características similares. Algunas técnicas que usan esto son la umbralización, el crecimiento de regiones, etc.

                                     

2. Aplicaciones

Algunas de las aplicaciones prácticas de la segmentación de imágenes son las siguientes:

  • Localización de tumores y otras patologías
  • Estudio de la estructura anatómica
  • Cirugía guiada por ordenador
  • Diagnóstico
  • Planificación del tratamiento
  • Medida de volúmenes de tejido
  • Pruebas médicas
  • Sistemas de control de tráfico
  • Reconocimiento de iris
  • Localización de objetos en imágenes de satélite teledetección.
  • Visión por computador
  • Reconocimiento de caras
  • Sensor de huella digital

Se han desarrollado varios algoritmos y técnicas de propósito general para la segmentación de imágenes y dado que no existe una solución general para el problema de la segmentación, a menudo se tienen que combinar varias técnicas para resolverlo eficazmente.

                                     

3. Métodos de agrupamiento Clustering

El algoritmo de K-means es una técnica iterativa que se utiliza para dividir una imagen en K clusters. El algoritmo básico es:

  • Recalcular los centros de los clusters haciendo la media de todos los pixeles del clúster.
  • Repetir los pasos 2 y 3 hasta que se consigue la convergencia por ejemplo, los pixeles no cambian de clusters.
  • Escoger K centros de clusters, ya sea de forma aleatoria o basándose en algún método heurístico.
  • Asignar a cada píxel de la imagen el clúster que minimiza la varianza entre el pixel y el centro del clúster.

En este caso, la varianza es la diferencia absoluta entre un píxel y el centro del clúster. La diferencia se basa típicamente en color, la intensidad, la textura, y la localización del pixel, o una combinación ponderada de estos factores. El número K se puede seleccionar manualmente, aleatoriamente, o por una heurística. Este algoritmo garantiza la convergencia, pero puede devolver una solución que no sea óptima. La calidad de la solución depende de la serie inicial de clusters y del valor de K. En estadística y aprendizaje automático, el algoritmo de las k-medias es un algoritmo de agrupamiento para dividir objetos en k grupos, donde k