Автоматизоване машинне навчання

Автоматизо́ване маши́нне навча́ння (АвтоМН, англ. Automated machine learning, AutoML) — це процес автоматизації задач застосування машинного навчання до практичних задач. АвтоМН охоплює весь конвеєр від сирого набору даних до готової для розгортання моделі машинного навчання. АвтоМН було запропоновано як рішення на основі штучного інтелекту для все більших викликів застосування машинного навчання.[1][2] Високий рівень автоматизації в АвтоМН дозволяє неекспертам використовувати моделі та методики машинного навчання не вимагаючи від них ставати експертами в машиннім навчанні. Автоматизація процесу застосування машинного навчання від початку до кінця додатково пропонує переваги створення простіших рішень, швидшого створення цих рішень, та моделей, які часто перевершують розроблені власноруч. АвтоМН використовували для порівнювання відносної важливості кожного з чинників у передбачувальній моделі.[3]

Порівняння зі стандартним підходом

У типовім застосуванні машинного навчання, практики мають набір точок даних входу для застосування в тренуванні. Ці сирі дані можуть не бути в такому вигляді, до якого можливо застосовувати всі алгоритми. Щоби зробити ці дані придатними для машинного навчання, експертові може довестися застосувати відповідні методи попередньої обробки даних, конструювання ознак, виділяння ознак та обирання ознак. Після цих кроків практики мусять відтак виконати обирання алгоритму та оптимізацію гіперпараметрів, щоби максимізувати передбачувальну продуктивність своєї моделі. Кожен із цих кроків може виявлятися складним, спричинюючи значні перешкоди для використання машинного навчання.

АвтоМН різко спрощує ці кроки для неекспертів.

Цілі автоматизації

Автоматизоване машинне навчання може націлюватися на різні етапи процесу машинного навчання.[2] Кроки для автоматизації:

Втілення

Відкриті

  • auto-sklearn, відкритий інструмент АвтоМН, втілений мовою Python, побудований навколо бібліотеки scikit-learn[4]
  • AutoGluon, відкритий інструментарій АвтоМН Amazon, також доступний як шаблон AWS CloudFormation[5]
  • TransmogrifAI, наскрізний інструментарій АвтоМН для структурованих даних, написаний мовою Scala, і який працює на Apache Spark[6]
  • Neural Network Intelligence, відкритий інструментарій АвтоМН Microsoft[7]

Комерційні

  • Azure ML, хмарна служба Microsoft Azure[8]
  • Google Cloud AutoML, рішення АвтоМН на Google Cloud Platform[9]
  • AutoAI в IBM Watson Studio для автоматизації підготовки даних, розробки моделей, конструювання ознак, та оптимізації гіперпараметрів[10]
  • SDK Oracle Accelerated Data Science (ADS),[11] бібліотека Python, що входить до служби Data Science[12] інфраструктури Oracle Cloud

Див. також

Примітки

  1. Auto-WEKA: Combined Selection and Hyperparameter Optimization of Classification Algorithms KDD '13 Proceedings of the 19th ACM SIGKDD international conference on Knowledge discovery and data mining. 2013. с. 847–855. Проігноровано невідомий параметр |vauthors= (довідка) (англ.)
  2. AutoML 2014 @ ICML. AutoML 2014 Workshop @ ICML. Процитовано 28 березня 2018. Проігноровано невідомий параметр |vauthors= (довідка) (англ.)
  3. Li R.Y.M., Chau K.W., Li H.C.Y., Zeng F., Tang B., Ding M. (2021) Remote Sensing, Heat Island Effect and Housing Price Prediction via AutoML. In: Ahram T. (eds) Advances in Artificial Intelligence, Software and Systems Engineering. AHFE 2020. Advances in Intelligent Systems and Computing, vol 1213. Springer, Cham. https://doi.org/10.1007/978-3-030-51328-3_17 (англ.)
  4. auto-sklearn на GitHub
  5. AutoGluon: AutoML for Text, Image, and Tabular Data. AutoGluon. Процитовано 3 квітня 2021. (англ.)
  6. TransmogrifAI: Automated machine learning for structured data. TransmogrifAI. Процитовано 3 квітня 2021. (англ.)
  7. Neural Network Intelligence на GitHub
  8. Azure ML documentation – What is AutoML?. Microsoft. Процитовано 3 квітня 2021. (англ.)
  9. Google Cloud AutoML. Google Cloud. Процитовано 3 квітня 2021. (англ.)
  10. AutoAI with IBM Watson Studio. IBM. Процитовано 3 квітня 2021. (англ.)
  11. The Oracle AutoML Pipeline. Oracle. Процитовано 3 квітня 2021. (англ.)
  12. Data science platform. Oracle. Процитовано 3 квітня 2021. (англ.)

Література

This article is issued from Wikipedia. The text is licensed under Creative Commons - Attribution - Sharealike. Additional terms may apply for the media files.