![](https://notissimus.com/wp-content/uploads/2024/02/robot-sidit-za-kompyuterom_kandinsky-2.2-850x450.jpg)
Данные – это новая нефть. А машинное обучение – это огонь. Тот, кто контролирует эти два направления, будет контролировать весь мир. Нет, все вышесказанное – не напыщенная фраза, взятая из антиутопического романа. Это реальность. Новый мировой порядок – это сбор огромного количества данных и их обработка в практические выводы, чего человечество еще не умело делать за всю свою историю. Именно такие технологии позволяют стране опередить других и, в конечном счете, править миром. В результате прогрессивные страны мира относятся к нему очень и очень серьезно.
Прибыльный выбор профессии
Если отбросить международные интриги, наука о данных и машинное обучение – это новая горячая область с невероятными возможностями. Спрос на них зашкаливает (мягко говоря), а специалистов по изучению данных не хватает. Даже посредственных. Как будто мы внезапно открыли множество новых пригодных для жизни планет, а людей для их переселения не хватает. Я мог бы продолжать и продолжать и звучать как заезженная пластинка, но, по-моему, эта инфографика делает свою работу гораздо лучше: Итак, мы видим, что зарплаты начинаются от $50 000+, а для менеджеров могут перевалить за $250 000.
И не только это: средний человек на нашей планете будет генерировать 1,7 МБ данных в секунду. Это 3 500+ ТБ данных за всю жизнь – больше, чем мы можем обработать на данный момент, не говоря уже о том, чтобы использовать для анализа.
Трудно ли заниматься наукой о данных и машинным обучением?
Хороший вопрос! По моему опыту, ответ может быть как “да”, так и “нет”. Искусственный интеллект (и, как следствие, машинное обучение) – сложнейшее занятие, если вы хотите заниматься исследованиями и расширять границы возможностей. Для такой работы недостаточно даже докторской степени по информатике и математике. Но у обычного человека нет ни амбиций, ни времени на такую работу. На другом конце находится то, что я бы назвал прикладной наукой о данных и машинным обучением. То есть вы берете существующие инструменты, методы и алгоритмы и применяете их для решения реальных задач. Эта часть требует самоотдачи, восприятия и творческого мышления (а также знания некоторых простых математических понятий, которые быстро усваиваются), но в отношении настоящих “технических” знаний она гораздо более мягкая, чем та, к которой призывает работа инженера-программиста. Другими словами, это не простая прогулка, но по соотношению вознаграждения и усилий это одна из лучших инвестиций. Теперь, когда вы твердо решили стать специалистом по изучению данных и инженером машинного обучения, давайте начнем изучать лучшие варианты.
Машинное обучение (Google)
Не многие знают, что в Google есть обширный, очень практичный и бесплатный курс по машинному обучению. По словам представителей компании, это часть их обязательств по продвижению технологий AI/ML и сохранению знаний в открытом доступе.
![](https://notissimus.com/wp-content/uploads/2024/02/google-ml-course-1.png)
Самое приятное в этом курсе то, что для него нет предварительных требований, но все же подготовьтесь к тому, что вам придется потратить дополнительное время на самостоятельное изучение концепций статистики. Я имею в виду, что это не обязательно, но если у вас нет опыта в продвинутой статистике, объяснений в этом курсе может быть недостаточно. Еще одна загвоздка заключается в том, что этот курс знакомит с машинным обучением через TensorFlow, который является реализацией ML, разработанной Google. Таким образом, Google в некотором смысле стремится продвинуть свои API для машинного обучения, но, учитывая ценность данного курса, я не вижу, как это может стать камнем преткновения. Если что, TensorFlow – один из самых простых способов освоить ML и пользуется бешеной популярностью.
Наука о данных
Название Гарвард внушает благоговение, так же как и этот курс. Прежде всего, это не курс “Давайте быстро разберемся с грязью”, в котором вы будете ходить на цыпочках вокруг Machine Learning, написав сниппет здесь или скрипт здесь. Этот курс – суровое боевое крещение, требующее упорной работы и значительных затрат времени. К курсу прилагаются бесплатные видео, код (размещенный на GitHub) и решения лабораторных заданий, так что практически вы ничем не ограничены, если хотите пройти его. Идеальная аудитория? Ты… Я не шучу. Я бы сказал, работающим профессионалам с приличным математическим образованием, даже если они, возможно, уже не увлекаются математикой (привычка к умозаключениям и доказательствам – самое необходимое). Но еще раз предупреждаю: вы можете думать, что у вас все хорошо, но этот курс покажется вам чем-то вроде завтрака из закаленных гвоздей – практические задачи достаточно сложны, чтобы заставить вас плакать, но, возможно, это как раз то, что вы ищете!
Машинное обучение
Зайдите в бар, где полно специалистов по обработке данных, и спросите, кто такой Эндрю Нг, и вы получите отпор. В кругах специалистов по науке о данных и машинному обучению Эндрю Нг приобрел статус бога благодаря своему исключительному курсу на Coursera – Machine Learning. А если вы сомневаетесь в авторитете Эндрю Нг, позвольте мне сказать об этом самому: Это платный курс, поскольку он входит в тарифный план Coursera, но финансовые обязательства и решимость – не единственные необходимые условия. Это длинный курс, поскольку Эндрю глубоко погружается в математику, лежащую в основе всех вещей ML, и разбирает популярные алгоритмы. Но, к счастью, это полный курс, и вас шаг за шагом проведут в самые темные глубины и выведут обратно. Очень рекомендую, главным образом потому, что сегодня стало принято щеголять сертификатом об окончании этого курса!
Прикладная наука о данных
Специализации на Coursera состоят из серии курсов, которые призваны помочь вам пройти путь от нуля до профессионала в определенной концепции. Если вы ищете полный, серьезный, но дружелюбный курс по Data Science и Machine Learning с Python, я не могу не порекомендовать вам эту специализацию.
![](https://notissimus.com/wp-content/uploads/2024/02/python-specialization-coursera-1.png)
По окончании курса вы получаете сертификат.
DataCamp
DataCamp предлагает множество курсов по науке о данных, которые также включают в себя несколько навыков и карьерных направлений. От манипулирования данными до машинного обучения – вы получите навыки карьерного роста в Python и R, которые помогут вам добиться успеха в области науки о данных.
![](https://notissimus.com/wp-content/uploads/2024/02/datacamp-1.jpg)
Благодаря байтовому контенту DataCamp вы можете учиться в своем собственном темпе. На этих курсах вы получите практический опыт, который поможет вам усовершенствовать свои навыки работы с данными.
![datacamp learning - geekflare](https://notissimus.com/wp-content/uploads/2024/02/datacamp-learning-1.jpg)
Вы можете начать с бесплатной версии и оценить курс, ознакомившись с первой главой.
edX
Учитесь у MITx, Harvardx, IBM, RICEx, UCSanDiegox и GTx на платформе edX. Все они имеют обширную учебную программу, которая поможет вам приобрести навыки специалиста по работе с данными. Эти программы лучше всего подходят для тех, кто занимается статистикой или компьютерными науками.
![](https://notissimus.com/wp-content/uploads/2024/02/edx-data-science-1.jpg)
Если вам не нужна программа, вы можете выбрать аля-карт. На сайте edX вы найдете более 200 курсов, связанных с наукой о данных, которые охватывают Python, R, Excel, вероятность, статистику, машинное обучение, визуализацию данных и многое другое.
Codecademy
Codecademy – еще одна платформа, которая является одной из лучших систем, помогающих научиться кодить. Они верят в принцип “Учись на практике” и предлагают множество практических проектов и тестов на своей платформе. Курс по науке о данных, предлагаемый Codecademy, включает в себя SQL, Python 3, NumPy, Pandas, Matplotlib, Scikit-learn и многие другие библиотеки.
![codecademy advantage](https://notissimus.com/wp-content/uploads/2024/02/codecademy-1.jpg)
Вся карьерная программа включает в себя 26 курсов, которых более чем достаточно, чтобы стать успешным специалистом по изучению данных. Этот курс данных:
- Дает глубокие знания в области науки о данных
- Обеспечивает легкое следование дорожной карте
- Поможет вам подготовиться к работе и приобрести достаточный практический опыт
Udemy
Udemy не нуждается в представлении. Python for Data Science and Machine Learning Bootcamp на Udemy – один из самых популярных курсов с рейтингом более 85 тысяч человек (4,6), который изучают 370 тысяч студентов по всему миру.
![udemy data science](https://notissimus.com/wp-content/uploads/2024/02/udemy-data-science-e1598554962445-1.jpg)
Ниже перечислены темы, рассматриваемые в этом курсе:
![udemy data science course](https://notissimus.com/wp-content/uploads/2024/02/udemy-data-science-course-1.png)
Ниже перечислены особенности/возможности этого курса:
- 25 часов видео по запросу
- Полный пожизненный доступ
- 13 статей и пять ресурсов для скачивания
- Доступ с мобильных и телевизионных устройств
- Сертификат о прохождении
- 30-дневная гарантия возврата денег
Поэтому, если вы предпочитаете бюджетные курсы, этот подойдет вам для начала.
Google AI
Интересно ли вам будет изучать машинное обучение у экспертов по ML в Google? Тогда вам необходимо ознакомиться с курсами по Google AI. На этой платформе есть курсы и материалы по машинному обучению и науке о данных для студентов, инженеров-программистов, ученых, изучающих данные, и даже исследователей. Эти курсы бесплатны. Начнем с того, что вам следует пройти курс Machine Learning Crash Course в Google AI. Это быстро развивающийся курс с практическим введением с использованием API TensorFlow. Ниже приведены подробности этого курса:
![machine learning google ai](https://notissimus.com/wp-content/uploads/2024/02/machine-learning-google-ai-1.jpg)
На этой платформе также есть специальные курсы по таким важным темам машинного обучения, как кластеризация, рекомендательные системы, тестирование и отладка в машинном обучении, разделение данных и разработка функций в машинном обучении. Если вы уже знаете основы машинного обучения, эти курсы будут вам полезны.
Udacity
Udacity – это также очень популярная платформа электронного обучения, которая предлагает множество курсов по современным технологиям. Она имеет несколько ведущих отраслевых программ, разработанных и признанных ведущими компаниями по всему миру, такими как AT&T, AWS, Google, IBM. Одна из программ в Udacity – Data Science – School of Data Science. Эта программа поможет вам получить работу аналитика данных, ученого по данным, инженера по данным и бизнес-аналитика. Курс Data Scientist в этой программе является ключевым и охватывает концепции машинного обучения, глубокого обучения и программной инженерии. Чтобы выбрать этот курс, необходимо обладать базовыми знаниями в области машинного обучения.
![data science udacity](https://notissimus.com/wp-content/uploads/2024/02/data-science-udacity-1.jpg)
Если вы знаете программирование на python, но не знакомы с машинным обучением, на Udacity есть еще одна программа – School of AI. В этой программе есть курсы, начинающиеся с основ машинного обучения.
![machine learning udacity](https://notissimus.com/wp-content/uploads/2024/02/machine-learning-udacity-1.jpg)
Глубокое обучение
Этот курс – просто благословение и моя самая любимая рекомендация в этом списке, если вы кодер. Повторю еще раз: если вы кодер. Это потому, что данный курс не уделяет времени обучению основам программирования. В описании курса об этом сказано очень ясно (выделение оригинальное):
Мы предполагаем, что каждый слушатель этого курса имеет опыт кодирования не менее одного года. В качестве языка обучения в курсе используется python, поэтому если вы еще не знаете python, мы предполагаем, что вы потратите время на его изучение – для опытных кодеров python будет довольно простым языком для изучения.
![](https://notissimus.com/wp-content/uploads/2024/02/datainst-intro-1.jpg)
Так что если вы уже знаете Python или можете быстро освоить, то это идеальный курс для прагматиков, которые хотят создавать реальные, удобные системы, не слишком беспокоясь о теоретических основах алгоритмов. Я бы даже сказал, что это для нетерпеливых любителей пошалить (вроде меня!), которые ненавидят церемонии и однообразие. А я уже упоминал, что он на 100% бесплатный и имеет отличное сообщество?!
Заключение
Фух! Составить этот список было очень сложно. Не потому, что не было достаточно хороших источников, а потому, что их было слишком много! Машинное обучение – это область, которая буквально взорвалась и решает сложные проблемы очень элегантно, поэтому в сети существуют сотни курсов, бесплатных и платных, и большинство из них очень, очень хороши. Но это также может стать источником путаницы, поэтому я постарался свести их к одиннадцати для разных типов обучающихся в зависимости от их уровня опыта.