IT.UA - home page

Меню
Aside section
Назад к списку

Machine Learning - Машинное обучение

Машинное обучение (МО, Machine Learning, ML) — обширный подраздел искусственного интеллекта, изучающий методы построения алгоритмов, способных обучаться.1 

Существуют и другие определения.

Машинное обучение — это «раздел ИИ, исследующий методы, позволяющие компьютерам улучшать свои характеристики на основе полученного опыта».2 

Краткая история и большие надежды

Первую программу на основе алгоритмов, способных самообучаться, разработал Артур Самуэль (Arthur Samuel) в 1952 году, предназначена она была для игры в шашки. Самуэль дал и первое определение термину «машинное обучение»: это «область исследований разработки машин, не являющихся заранее запрограммированными». Более точное определение термину «обучение» дал намного позже Т. М. Митчелл: говорят, что компьютерная программа обучается на основе опыта E по отношению к некоторому классу задач T и меры качества P, если качество решения задач из T, измеренное на основе P, улучшается с приобретением опыта E.3

Уже в 1957 году была предложена первая модель нейронной сети, реализующая алгоритмы машинного обучения, похожие на современные. В настоящее время ведется разработка самых разных систем машинного обучения, предназначенных для использования в таких технологиях будущего, как Интернет Вещей, Промышленный Интернет Вещей, в концепции «умный» город, при создании беспилотного транспорта и во многих других.

О том, что на машинное обучение сейчас возлагают большие надежды, говорят следующие факты.

  • В компании Google считают, что скоро ее продукты «перестанут быть результатом традиционного программирования — в их основу будет положено машинное обучение»;
  • Компании Google, Facebook, Apple, Amazon, Microsoft и китайская фирма Baidu вступили в борьбу за талантливых специалистов в сфере искусственного интеллекта;
  • Марк Цукерберг, генеральный директор Facebook, лично — по телефону и по видеочату — участвует в попытках его компании переманить лучших выпускников;
  • Посещаемость на самых важных академических конференциях в этой сфере увеличилась почти в четыре раза;
  • Такие новые продукты, как Siri от Apple, M от Facebook, Echo от Amazon были созданы с помощью машинного обучения.4

Методы машинного обучения

В самом общем случае различают два типа машинного обучения: обучение по прецедентам, или индуктивное обучение, и дедуктивное обучение. Поскольку последнее принято относить к области экспертных систем, то термины «машинное обучение» и «обучение по прецедентам» можно считать синонимами. Этот метод обучения сейчас, как принято говорить, в тренде, а вот экспертные системы переживают кризис. Лежащие в их основе базы знаний трудно согласовывать с реляционной моделью данных, поэтому промышленные СУБД невозможно эффективно использовать для наполнения баз знаний экспертных систем.

Обучение по прецедентам, в свою очередь, подразделяют на три основных типа: контролируемое обучение, или обучение с учителем (supervised learning), неконтролируемое обучение (unsupervised learning), или обучение без учителя, и обучение с подкреплением (reinforcement learning).5

Помимо названных, разрабатываются и другие методы обучения: активное, многозадачное, многовариантное, трансферное и т.д. Особенно успешно развивается в последние годы «глубокое обучение», при использовании которого могут успешно сочетаться алгоритмы обучения с учителем и без учителя.  

Контролируемое обучение

Этот метод обучения применяется в случаях, когда имеются большие объемы данных, допустим – тысячи фотографий домашних животных с маркерами (метками, ярлыками): это кошка, а это собака. Необходимо создать алгоритм, с помощью которого машина могла бы по фотографии, которую «не видела» раньше, определить, кто на ней изображен: кошка или собака. В роли «учителя» в данном случае выступает человек, заранее проставивший маркеры. Машина сама выбирает признаки, по которым она отличает кошек от собак. Поэтому в дальнейшем найденный ею алгоритм может быть быстро перенастроен на решение другой задачи, например, на распознавание кур и уток. Машина опять-таки сама выполнит сложную и кропотливую работу по выделению признаков, по которым будет различать этих птиц. А нейросеть, которую обучили распознавать кошек, можно быстро научить обрабатывать результаты компьютерной томографии.

Неконтролируемое обучение

Хотя маркированных, размеченных данных накопилось уже довольно много, данных без маркеров (меток) все же гораздо больше. Это изображения без подписей, аудиозаписи без комментариев, тексты без аннотаций. Задача машины при неконтролируемом обучении – найти связи между отдельными данными, выявить закономерности, подобрать шаблоны, упорядочить данные или описать их структуру, выполнить классификацию данных. Неконтролируемое обучение используется, например, в рекомендательных системах, когда в интернет-магазине на основе анализа предыдущих покупок покупателю предлагаются товары, которые могут заинтересовать его с большей вероятностью, чем другие. Или когда на после просмотра какого-то видеоклипа на портале YouTube посетителю предлагают десятки ссылок на ролики, чем-то похожие на просмотренный. Или когда Google в ответ на один и тот же запрос ранжирует ссылки в результатах поиска для одного пользователя иначе, чем для другого, поскольку учитывает историю поисков.

Обучение с подкреплением  

Такое обучение является частным случаем контролируемого обучения, но учителем в данном случае является «среда». Машина (ее в этой ситуации часто называют «агент») не имеет предварительной информации о среде, но имеет возможность производить в ней какие-либо действия. Среда реагирует на эти действия и тем самым предоставляет агенту данные, которые позволяют ему реагировать на них и учиться. Фактически агент и среда образуют систему с обратной связью.

Обучение с подкреплением используется для решения более сложных задач, чем обучение с учителем и без учителя. Оно используется, например, в системах навигации для роботов, которые учатся избегать столкновений с препятствиями опытным путем, получая обратную связь при каждом столкновении. Обучение с подкреплением используется также в логистике, при составлении графиков и планировании задач, при обучении машины логическим играм (покер, нарды, го и др.).

Нейронные сети и глубокое обучение

Для машинного обучения используют различные технологии и алгоритмы. В частности, могут применяться дискриминантный анализ, байесовские классификаторы и многие другие математические методы. Но в конце XX века все больше внимания начали уделять искусственным нейронным сетям (ИНС). Очередной взрыв интереса к ним начался в 1986 г., после существенного развития т.н. «метода обратного распространения ошибки», который с успехом применили к обучению нейронной сети.

ИНС представляет собой систему соединённых и взаимодействующих между собой искусственных нейронов, выполненных на основе сравнительно простых процессоров. Каждый процессор ИНС периодически получает сигналы от одних процессоров (или от сенсоров, или от других источников сигналов) и периодически посылает сигналы другим процессорам. Все вместе эти простые процессоры, соединенные в сеть, способны решать довольно сложные задачи.

Чаще всего нейроны располагаются в сети по уровням (их еще называют слоями). Нейроны первого уровня – это, как правило, входные. Они получают данные извне (например, от сенсоров системы распознавания лиц) и после их обработки передают импульсы через синапсы нейронам на следующем уровне. Нейроны на втором уровне (его называют скрытым, поскольку он напрямую не связан ни со входом, ни с выходом ИНС) обрабатывают полученные импульсы и передают их нейронам на выходном уровне. Поскольку речь идет об имитации нейронов, то каждый процессор входного уровня связан с несколькими процессорами скрытого уровня, каждый из которых, в свою очередь, связан с несколькими процессорами уровня выходного. Такова архитектура самой простой ИНС, которая способна к обучению и может находить простые взаимосвязи в данных.

Глубокое (глубинное) обучение может быть применено лишь по отношению к более сложным ИНС, содержащим несколько скрытых уровней. При этом уровни нейронов могут перемежаться слоями, которые выполняют сложные логические преобразования. Каждый последующий уровень сети ищет взаимосвязи в предыдущем. Такая ИНС способна находить не только простые взаимосвязи, но и взаимосвязи между взаимосвязями. Именно благодаря переходу на нейросеть с глубинным обучением компании Google удалось резко повысить качество работы своего популярного продукта «Переводчик». В частности, качество перевода между английским и французским языками повысилось сразу на 7 баллов, т.е. более чем на 20%. Предыдущая система, выполнявшая фразовый статистический машинный перевод, добилась подобного улучшения за все время своего существования (с 2006 г.).6

Машинное обучение для бизнеса

Рынок машинного обучения быстро растет. В 2016 г. его объем преодолел отметку в $1 млрд, а к 2025 году, судя по прогнозам, он может увеличиться до $39,98 млрд.7 

В конце 2016 года MIT Technology Review и Google Cloud провели совместное исследование на тему «Машинное обучение: новый способ получить конкурентное преимущество». Было опрошено 375 квалифицированных респондентов из разных стран мира, работающих в мелких и крупных компаниях из различных отраслей (промышленность, услуги, финансы). В результате исследования выяснилось, что 60% компаний уже используют машинное обучение (ML), а в трети из них эта технология перешла из стадии инновационной в стадию зрелости. Более того, 26% компаний уже получают за счет ML конкурентное преимущество. Четверть компаний инвестируют в ML свыше 15% от средств, направленных на развитие IT, и в значительной степени возвращают сделанные инвестиции.8 

Машинное обучение и, в частности, нейронные сети целесообразно использовать для решения бизнес-задач в случаях, когда:

  • накоплено большое количество различных данных, но программы для их обработки и систематизации отсутствуют;
  • имеющиеся данные искажены, не полны или не систематизированы;
  • данные настолько различны, что трудно выявить связи и закономерности, существующие между ними.

Бизнес-задачи, которые могут решаться средствами машинного обучения и нейронных сетей:

  • Прогнозирование: спроса, объема продаж, наполнения склада, загрузки оборудования и прочих ресурсов, дальнейшего развития предприятия и т.п.
  • Выявление: тенденций, скрытых взаимосвязей, аномалий, повторяемых элементов и т.п.
  • Распознавание: фото-, видео-, аудиоконтента, попыток мошенничества, лжи, внутренних угроз, внешних атак на систему безопасности и т.п.
  • Автоматизация: работы операторов в онлайн-чатах, телефонных операторов и т.п. 
  • Классификация: анализ состава покупателей, клиентов, заказчиков и сегментация их по различным параметрам.
  • Кластеризация: классификация по параметрам, которые изначально не были известны.
  • Разработка: чат-ботов.9

Примеры реализации машинного обучения

Крупнейшая в мире торговая площадка Alibaba широко использует машинное обучение и другие средства ИИ. В результате ее виртуальные витрины подстраиваются под каждого покупателя, а система поиска выдает для него наилучшие варианты. Чат-бот Ali Xiaomi может самостоятельно справиться с большинством обращений клиентов в техподдержку. Более того, разработанная компанией Alibaba нейронная сеть впервые превзошла результаты человека при прохождении тестов от Стэнфордского университета. В эти тесты входят упражнения на чтение или прослушивание определенной информации, а затем ответы на проверочные вопросы.10

Американская торговая сеть Target обнаружила, что с помощью машинного обучения можно предсказать не только поведение покупателей, но и перемены в их жизни, например, беременность. Алгоритмы Target работают настолько точно, что с помощью данных о покупках могут определить триместр беременности женщины, которая их совершала.11 

Популярный фотохостинг Pinterest использует машинное обучение, чтобы показывать своим пользователям наиболее интересные для них фотографии.12

Лукас Бивальд (Lukas Biewald), генеральный директор компании Figure Eight (бывш. CrowdFlower), которая предлагает множество проектов машинного обучения, считает, что оно уже производит заметные изменения в работе многих фирм. И над этим работают не только компании, которые могут тратить огромные средства на исследования и разработки, такие как Google или Microsoft. На самом деле, уверен Лукас Бивальд, каждая компания из списка Fortune 500 уже работает намного эффективнее и зарабатывает больше денег благодаря именно машинному обучению.13

Из компаний с украинскими корнями следует отметить стартап Neuromation, который в феврале 2017 года в ходе ICO привлек $71,6 млн. инвестиций.

Платформа Neuromation позволяет создавать искусственную учебную среду для глубокого обучения нейронных сетей на большом количестве примеров. Данные для обучения ИНС генерируются с использованием вычислительных мощностей блокчейн-сообщества. Столь оригинальное решение компания приняла потому, что ранее, в процессе работы над системами с использованием компьютерного зрения, столкнулась с проблемой нехватки вычислительных ресурсов. Аренда ресурсов у облачных сервисов Amazon или Google для стартапа оказалась неподъемной. А из-за бума майнинга практически невозможно было купить видеокарты. Так появилась идея брать вычислительные мощности в аренду у майнеров, которая в итоге выросла в создание нейроплатформы.14

Ссылки:

1. http://www.machinelearning.ru/wiki/index.php?title=Машинное_обучение
2. http://people.eecs.berkeley.edu/~russell/temp/q-and-a.html
3. Mitchell, T. (1997). Machine Learning. McGraw Hill. p. 2. ISBN 978-0-07-042807-2
4. https://vc.ru/21767-the-great-ai-awakening
5. http://iitp.ru/upload/publications/6256/vyugin1.pdf
6. https://vc.ru/21767-the-great-ai-awakening
7. https://rb.ru/story/machine-learning-in-business/
8.https://s3.amazonaws.com/files.technologyreview.com/whitepapers/MITTR_GoogleforWork_Survey.pdf
9. http://alhimiya.com/blog/neural-networks.html
10. https://rb.ru/news/ai-alibaba-best/
11. https://rb.ru/story/machine-learning-in-business/
12. http://www.nanonewsnet.ru/news/2017/oracle-rasshirila-iot-cloud-funktsiyami-ii-mashinnogo-obucheniya-novosti
13. https://techcrunch.com/2016/03/19/how-real-businesses-are-using-machine-learning/
14. https://neuromation.io/ru/основанный-украинцами-стартап-neuromation-соб/

 

 

  • Предыдущая
  • следующая
Get in touch

Получить
наше бизнес предложение
Получить
наше бизнес предложение
Заполнить форму