5 советов по изучению машинного обучения для разработчиков и начинающих [REPOST JUNE 2017]

Мы живем в мире, в котором ИИ, искусственный интеллект, постоянно присутствует в СМИ, чтобы описывать будущие технологии, которые повлияют на нашу повседневную жизнь. Алгоритмы машинного обучения большую часть времени лежат в основе системы искусственного интеллекта, и многие разработчики и специалисты в области компьютерных наук хотят разобраться в этом вопросе.

Очевидно, что для изучения алгоритмов машинного обучения и понимания того, как их использовать, доступно множество ресурсов.

Просто процитирую несколько:

-Введение в машинное обучение А. Нг, видеокурс (доступен на сайте Coursera http://bit.ly/1IXp8Lg и на YouTube)

-Машинное обучение Дж. В. Пейсли, видеокурс (доступен на edX http://bit.ly/2s3pjmG)

-Machine Learning A-Z™ К. Еременко, видеокурс на Udemy (http://bit.ly/2s33KTx)

-Машинное обучение для хакеров, Д. Конвей и Дж. М. Уайт, книга R language (http://amzn.to/2t2Plv2)

-Машинное обучение для Интернета А. Изони, книга Python language (http://amzn.to/2sLsgKw)

-Машинное обучение с помощью Python, С. Рашка, книга Язык Python (http://amzn.to/2rJTSi3)

Весь вышеперечисленный материал даст отличное представление о том, как использовать алгоритмы машинного обучения в реальных сценариях и о лежащей в их основе теории.

Я предлагаю погрузиться в содержание, имея в виду следующие советы:

1. Выберите язык программирования и придерживайтесь его. На данный момент (2017 г.) наиболее часто используемыми языками среди специалистов по обработке и анализу данных являются R или Python. У обоих есть отличные библиотеки машинного обучения, на ваше усмотрение.

2. Не гонитесь за хайпом, разбирайтесь в основах. Машинное обучение — это богатая область, и заманчиво сразу перейти к «глубокому обучению» или «нейронным сетям». Тем не менее, вам необходимо понимать основы, чтобы разобраться в этих сложных темах.

3. Сосредоточьтесь на понимании процесса, а не конкретного алгоритма. Количество деталей каждого алгоритма может быть ошеломляющим, но важной частью является понимание потока: как перейти от получения грубого набора данных к прогнозированию с использованием различных алгоритмов.

4. Тратьте 60% времени на код, 40% на теорию. Понимание теории важно, но еще важнее применить ее на практике.

5. Помните о различных перспективах. Часто есть разные способы увидеть одни и те же данные и, как следствие, алгоритмы. Найдите разные объяснения одного и того же алгоритма и попытайтесь найти разные интерпретации структуры данных.