Detección de hitos - Enciclopedia
En la informática, la detección de hitos es el proceso de encontrar hitos significativos en una imagen. Originalmente, se refería a encontrar hitos con fines de navegación, por ejemplo, en la visión robótica o en la creación de mapas a partir de imágenes satelitales. Los métodos utilizados en la navegación se han extendido a otros campos, destacando en el reconocimiento facial, donde se utiliza para identificar puntos clave en el rostro. También tiene importantes aplicaciones en la medicina, identificando hitos anatómicos en imágenes médicas.
Aplicaciones
= Navegación =
= Hitos faciales =
La detección de hitos faciales es un paso importante en el reconocimiento facial de personas en una imagen. Los hitos faciales también pueden utilizarse para extraer información sobre el estado de ánimo e intención de la persona. Los métodos utilizados se dividen en tres categorías: métodos holísticos, métodos basados en modelos locales restringidos y métodos basados en regresión.
Los métodos holísticos están preprogramados con información estadística sobre la forma del rostro y los coeficientes de ubicación de los hitos. El método holístico clásico es el modelo de apariencia activa (AAM) introducido en 1998. Desde entonces, se han realizado varias extensiones y mejoras al método. Estas son en gran medida mejoras en el algoritmo de ajuste y pueden clasificarse en dos grupos: métodos de ajuste analíticos y métodos de ajuste basados en el aprendizaje. Los métodos analíticos aplican métodos de optimización no lineal como el algoritmo de Gauss-Newton. Este algoritmo es muy lento, pero se han propuesto mejores algoritmos como el algoritmo de composición inversa proyectada (POIC) y el algoritmo de composición inversa simultánea (SIC). Los métodos de ajuste basados en el aprendizaje utilizan técnicas de aprendizaje automático para predecir los coeficientes faciales. Estos pueden utilizar regresión lineal, regresión no lineal y otros métodos de ajuste. En general, los métodos de ajuste analíticos son más precisos y no requieren entrenamiento, mientras que los métodos basados en el aprendizaje son más rápidos, pero necesitan entrenamiento. Otras extensiones al método básico AAM analizan las ondas en la imagen en lugar de la intensidad de los píxeles. Esto ayuda a ajustar las partes no vistas de la cara que el AAM considera problemáticas.
= Imágenes médicas =
Cefalometría
= Moda =
El propósito de la detección de hitos en imágenes de moda es para fines de clasificación. Esto facilita la recuperación de imágenes con características específicas de una base de datos o una búsqueda general. Un ejemplo de un hito de moda es la ubicación de la falda de un vestido. La detección de hitos de moda es particularmente difícil debido a la deformación extrema que puede ocurrir en la ropa.
Se han utilizado algunos métodos clásicos de detección de características como la transformada de características invariante a escala en el pasado. Sin embargo, ahora es más común utilizar métodos de aprendizaje profundo. Esto se ha visto enormemente ayudado por la publicación de varios conjuntos de datos de moda grandes que pueden utilizarse para el entrenamiento. Estos métodos incluyen modelos basados en regresión, modelos basados en restricciones y modelos atentos. Los problemas específicos de la detección de hitos de moda (deformación) han llevado a modelos de estimación de postura que detectan y tienen en cuenta la postura del modelo que viste la ropa.
Métodos
Hay varios algoritmos para localizar hitos en imágenes. Hoy en día, la tarea generalmente se resuelve utilizando Redes Neuronales Artificiales y, especialmente, algoritmos de Aprendizaje Profundo, pero los algoritmos evolutivos como la optimización de enjambre de partículas también pueden ser útiles para realizar esta tarea.
= Aprendizaje profundo =
El aprendizaje profundo ha tenido un impacto significativo en la detección autónoma de hitos faciales, permitiendo una detección más precisa y eficiente de los hitos en las fotos del mundo real. Con técnicas de visión por computadora tradicionales, la detección de hitos faciales podría ser desafiante debido a las variaciones en la iluminación, la posición de la cabeza y la ocultación, pero las Redes Neuronales Convolucionales (CNN), han revolucionado la detección de hitos permitiendo a las computadoras aprender las características de grandes conjuntos de datos de imágenes. Al entrenar una CNN en un conjunto de datos de imágenes con hitos faciales etiquetados, el algoritmo puede aprender a detectar estos hitos en nuevas imágenes con alta precisión, incluso cuando aparecen en diferentes condiciones de iluminación, ángulos o vistas parcialmente ocultas.
En particular, las soluciones basadas en este enfoque han alcanzado la eficiencia en tiempo real en los GPUs de dispositivos móviles y se han encontrado aplicaciones dentro de las aplicaciones de realidad aumentada.
= Algoritmo evolutivo =
Los algoritmos evolutivos en la etapa de entrenamiento intentan aprender el método de determinación correcta de los hitos. Esta fase es un proceso iterativo y, en consecuencia, se realiza en varias iteraciones. Como resultado de la finalización de la última iteración, se obtendrá un sistema que pueda determinar el hito con una cierta precisión. En el método de optimización de enjambre de partículas, hay partículas que buscan hitos y cada una utiliza una cierta fórmula en cada iteración para optimizar la detección de hitos.
Referencias
Bibliografía
Schwendicke, Falk; Chaurasia, Akhilanand; Arsiwala, Lubaina; Lee, Jae-Hong; Elhennawy, Karim; Jost-Brinkmann, Paul-Georg; Demarco, Flavio; Krois, Joachim (2021). "Deep learning for cephalometric landmark detection: Systematic review and meta-analysis". Clinical Oral Investigations. 25 (7): 4299–4309. doi:10.1007/s00784-021-03990-w. PMC 8310492. PMID 34046742. S2CID 235232149.
Wu, Yue; Ji, Qiang (2019). "Facial Landmark Detection: A Literature Survey". International Journal of Computer Vision. 127 (2): 115–142. arXiv:1805.05563. doi:10.1007/s11263-018-1097-z. S2CID 255101562.
Zhang, Yungang; Zhang, Cai; Du, Fei (2019). "A Brief Review of Recent Progress in Fashion Landmark Detection". 2019 12th International Congress on Image and Signal Processing, BioMedical Engineering and Informatics (CISP-BMEI). pp. 1–6. doi:10.1109/CISP-BMEI48845.2019.8966051. ISBN 978-1-7281-4852-6. S2CID 210931275.