自動機械学習 - 百科事典

自動化機械学習(AutoML)は、現実の問題に機械学習を適用するタスクを自動化するプロセスです。これは自動化とMLの組み合わせです。
AutoMLは、元のデータセットから始めて、デプロイメントに準備された機械学習モデルを構築するまでの全ての段階を含む可能性があります。AutoMLは、機械学習を適用する増大する課題に対する人工知能に基づく解決策として提案されました。AutoMLの高い自動化度は、非専門家が機械学習モデルと技術を利用できるようにし、彼らが機械学習の専門家になる必要がないことを目指しています。機械学習の適用プロセスを全ての段階で自動化することで、よりシンプルな解決策の生成、その解決策の迅速な作成、そして通常、手動で設計されたモデルを上回るモデルが生成されるという利点も提供されます。
AutoMLで使用される一般的な技術には、ハイパーパラメータ最適化、メタ学習、そして神経アーキテクチャ検索が含まれます。

標準的なアプローチとの比較
典型的な機械学習アプリケーションでは、トレーニングに使用する一連の入力データポイントがあります。元のデータは、すべてのアルゴリズムが適用できる形式ではなかったかもしれません。機械学習に適したデータにするために、専門家は適切なデータ前処理、特徴工程、特徴抽出、特徴選択方法を適用する必要がありました。これらのステップの後、専門家はモデルの予測性能を最大化するためにアルゴリズムの選択とハイパーパラメータ最適化を行わなければなりません。ディープラーニングを使用する場合、神経ネットワークのアーキテクチャも機械学習専門家が手動で選択する必要があります。
これらの各ステップは難しいものであり、機械学習の使用に対する重大な障害となります。AutoMLは、非専門家に対してこれらのステップをシンプルにし、機械学習技術を正しく効果的に使用するようにするために設計されています。
AutoMLは、データエンジニアリング、データ探索、モデルの解釈と予測などの困難なタスクを含むデータサイエンスの自動化のより広範なアプローチ内で重要な役割を果たします。

自動化のターゲット
自動化機械学習は、機械学習プロセスの様々な段階をターゲットにすることができます。自動化するためのステップには以下があります:

データの準備とイングレッション(元のデータと多様な形式から)
列の種類の検出;例えば、ボールルン、离散数値、連続数値、またはテキスト
列の意図の検出;例えば、ターゲット/ラベル、層分けフィールド、数値特徴、カテゴリテキスト特徴、または自由テキスト特徴
タスクの検出;例えば、二値分類、回帰、クラスタリング、またはランク
特徴工程
特徴選択
特徴抽出
メタ学習とトレーニング学習
歪んだデータおよび/または欠損値の検出と処理
モデルの選択 - 使用する機械学習アルゴリズムを選択、通常、複数の競合ソフトウェア実装が含まれます
エンブリング - 複数のモデルを使用することで、単一のモデルよりも良い結果が得られる合意の形
学習アルゴリズムおよび特徴化のハイパーパラメータ最適化
神経アーキテクチャ検索
時間、メモリ、複雑さ制約下でのパイプラインの選択
評価指標とバリデーション手順の選択
問題の検出
漏洩の検出
誤設定の検出
取得した結果の分析
ユーザーインターフェースとビジュアライゼーションの作成

課題と限界
自動化機械学習の周りで多くの重要な課題が取り組まれています。この分野の大きな問題は「手工芸業としての開発」と呼ばれています。この用語は、開発が専門家の手動の決定とバイアスに依存している機械学習の問題を指します。これは、機械学習の目標であるデータの使用と分析から学習し、改善できるシステムの作成と対比されます。基本的には、システムの学習において専門家がどの程度関与すべきか、機械に対してどの程度の自由を与えるべきかの間の葛藤です。しかし、専門家と開発者は、これらの機械を学習用に準備し、ガイドするために必要な労力と知識が必要です。このシステムを作成するには、機械学習アルゴリズムとシステム設計の知識が必要な労力密集型の作業が必要です。
さらに、他の課題にはメタ学習と計算リソースの割り当てが含まれます。

参照
人工知能
人工知能と選挙
神経アーキテクチャ検索
神経進化
自己調整
神経ネットワーク知能
モデルオペレーション
ハイパーパラメータ最適化

参考文献


追加読書
"Open Source AutoML Tools: AutoGluon, TransmogrifAI, Auto-sklearn, and NNI". Bizety. 2020-06-16.
Ferreira, Luís, et al. "A comparison of AutoML tools for machine learning, deep learning and XGBoost." 2021 International Joint Conference on Neural Networks (IJCNN). IEEE, 2021. https://repositorium.sdum.uminho.pt/bitstream/1822/74125/1/automl_ijcnn.pdf
Feurer, M., Klein, A., Eggensperger, K., Springenberg, J., Blum, M., & Hutter, F. (2015). Efficient and robust automated machine learning. Advances in neural information processing systems, 28. https://proceedings.neurips.cc/paper_files/paper/2015/file/11d0e6287202fced83f79975ec59a3a6-Paper.pdf