ランドマーク検出 - 百科事典

コンピュータサイエンスにおいて、ランドマーク検出は画像の中で重要なランドマークを見つけるプロセスです。これはもともと、ナビゲーションのためにランドマークを見つけることを意味しており、例えば、ロボットの視覚や衛星画像から地図を作成する場合などに使われます。ナビゲーションに使われる方法は、他の分野にも拡張されており、特に顔認識においては、顔の重要なポイントを識別するために使われます。医療分野でも重要な応用があり、医療画像における解剖学的ランドマークを識別します。

应用


= ナビゲーション =


= 顔のランドマーク =
画像中人の顔のランドマークを見つけることは、顔の認識における重要なステップです。顔のランドマークは、人の感情や意図に関する情報を抽出するためにも使われます。使われる方法は以下の3つのカテゴリーに分けられます:全体的方法、制約付き局所モデル方法、回帰に基づく方法。
全体的方法は、顔の形状やランドマークの場所係数に関する統計情報を事前にプログラムされています。古典的な全体的方法は、1998年に紹介されたアクティブな外観モデル(AAM)です。それ以来、この方法に対する多くの拡張と改善が行われてきました。これらは主にフィッティングアルゴリズムの改善であり、2つのグループに分類できます:解析的フィッティング方法と学習に基づくフィッティング方法。解析的方法は、ガウス・ニュートンアルゴリズムなどの非線形最適化方法を適用します。このアルゴリズムは非常に遅いですが、より良いものが提案されています。例えば、プロジェクト逆合成(POIC)アルゴリズムや同時逆合成(SIC)アルゴリズムなどです。学習に基づくフィッティング方法は、顔の係数を予測するために機械学習技術を使用します。これには線形回帰、非線形回帰、その他のフィッティング方法が含まれます。一般的に、解析的フィッティング方法はより正確であり、トレーニングは必要ありませんが、学習に基づくフィッティング方法はより速く、トレーニングが必要です。基本的なAAM方法に加えて、画像の波形を解析する拡張も行われており、基本的なAAMが困難とする顔の見た目の部分のフィッティングを助けます。


= 医療画像 =


頭蓋計学


= ファッション =
ファッション画像におけるランドマーク検出の目的は、分類のためにです。これにより、データベースや一般的な検索から特定の特徴を持つ画像のリトリーブが助けられます。ファッションのランドマークの例は、ドレスのヒールラインの場所です。ファッションのランドマーク検出は、衣服に極端な変形が発生することが多いため特に難しいです。
過去には、スケール不変特徴変換などの古典的な特徴検出方法が使われていましたが、現在ではより一般的には深い学習方法が使われています。これは、訓練に使える大規模なファッションデータセットが発表されたことにより非常に助けられました。これらの方法には、回帰に基づくモデル、制約に基づくモデル、注視モデルが含まれます。ファッションのランドマーク検出(変形)の特定の問題は、衣服を着たモデルのポーズを検出し、考慮するポーズ推定モデルに導きました。


方法

画像の中でランドマークを見つけるためのアルゴリズムはいくつかあります。今では、このタスクは通常、人工知能ニューラルネットワークや特に深い学習アルゴリズムを使用して解決されていますが、粒子群最適化などの進化的アルゴリズムもこのタスクを実行するのに役立ちます。


= 深い学習 =
深い学習は、現実の写真の中でより正確かつ効率的にランドマークを検出することを可能にすることで、自律的な顔のランドマーク検出に大きな影響を与えました。従来のコンピュータビジョン技術では、光の変化、頭の位置、遮蔽などによる変化のために、顔のランドマークを検出することが難しいことがありましたが、卷積ニューラルネットワーク(CNN)は、コンピュータが大量の画像データセットから特徴を学習できるようにすることで、ランドマーク検出を革命化しました。ラベリングされた顔のランドマークを持つ画像データセットでCNNをトレーニングすることで、アルゴリズムは、異なる照明条件、角度、部分遮蔽のビューの中で高精度に新しい画像の中でこれらのランドマークを検出することを学習できます。
特に、このアプローチに基づく解決策は、モバイルデバイスのGPU上でリアルタイム効率を達成し、拡張現実アプリケーション内でその使用が見られます。


= 進化的アルゴリズム =
進化的アルゴリズムは、トレーニング段階でランドマークの正確な決定方法を学習しようと試みます。このフェーズは反復的なプロセスであり、そのため、いくつかの反復で実行されます。最後の反復が完了すると、ある精度でランドマークを正確に決定できるシステムが得られます。粒子群最適化方法では、ランドマークを探す粒子があり、各粒子は各反復で特定の公式を使用してランドマーク検出を最適化します。


参考文献


参考文献

Schwendicke, Falk; Chaurasia, Akhilanand; Arsiwala, Lubaina; Lee, Jae-Hong; Elhennawy, Karim; Jost-Brinkmann, Paul-Georg; Demarco, Flavio; Krois, Joachim (2021). "Deep learning for cephalometric landmark detection: Systematic review and meta-analysis". Clinical Oral Investigations. 25 (7): 4299–4309. doi:10.1007/s00784-021-03990-w. PMC 8310492. PMID 34046742. S2CID 235232149.

Wu, Yue; Ji, Qiang (2019). "Facial Landmark Detection: A Literature Survey". International Journal of Computer Vision. 127 (2): 115–142. arXiv:1805.05563. doi:10.1007/s11263-018-1097-z. S2CID 255101562.

Zhang, Yungang; Zhang, Cai; Du, Fei (2019). "A Brief Review of Recent Progress in Fashion Landmark Detection". 2019 12th International Congress on Image and Signal Processing, BioMedical Engineering and Informatics (CISP-BMEI). pp. 1–6. doi:10.1109/CISP-BMEI48845.2019.8966051. ISBN 978-1-7281-4852-6. S2CID 210931275.