Как я изучаю Machine Learning · психологии и науки о мозге,...

Preview:

Citation preview

Зачем это изучать?

Диаграмма с www.linkedin.comиз статьи Srikanth Victory

Специалист по анализу данных (data scientist)

Разработчик ПО(software developer)

Эксперт предметной области(domain expert)

Определяет постановку задачи.

Работает с аналитиками и программистами, чтобы получить пользу для бизнеса.

Эксперт в математике и статистике. Создаёт математические модели для содержательной поставновки задач.

Обычно использует инструменты для моделироавния и прототипиования R, Matlab, Python

Программист, технический лидер.Знаком с алгоритмами анализа данных. Владеет инструментами для разработки: библиотеками для реализации алгоритмов, базами данных, технологиями обработки больших данных, техниками оптимизации.

Системный администратор

Создаёт и поддерживает инфраструктуру: сети, железо, ОС (чаще всего UNIX), безопасность, хранение данных, базы данных (SQL, NoSQL)Пример: администратор систем обработки данных Spark/Hadoop

Административные должности

Рroject/program manager, product owner, people manager, marketing, sales representatives

+ Английский язык

+ Навыки поиска в интернете

Картинка с analyticsvidhya.com

+ Свободное время

1.

2.

3.

4.

5.

6.5 / 12

Картинка с analyticsvidhya.com

1.

2.

3.

4.

5.

6.

• Конспекты от курса Яндекса-

МФТИ

• Учебники:

матанализ – Кудрявцев, Рудин

алгебра – Кострикин,

оптимизация – Boyd (англ.),

теорвер и статистика – Кибзун.

• онлайн-курсы МФТИ и ВШЭ на

Coursera;

• По совету слушателей: http://mathprofi.ru/ - доступное изложение высшей математики.

Картинка с analyticsvidhya.com

1.

2.

3.

4.

5.

6.

1) Интерактивные tutorial:- Datacamp - Python, алгоритмы и

структурам данных на русском

2) курс питерского Computer Science Center

3) Курсы от Rice University на Coursera

4) СпециализацияPython for Everybody на Coursera

Хороший курс для начала, если есть база в английском и программировании

+ Подробные, чёткие объяснения+ Средний уровень детализации+ Много примеров и диаграмм+ Большой круг задач и алгоритмов+ Преподаватель - всемирно известный учёный, основатель платформы Coursera+ Есть русские субтитры+ №2 по популярности и №4 по рейтингу среди всех курсов Coursera

Возможные трудности:- Много программирования- Аудио, слайды, задания и материалы на английском- Есть неточности, поправки нужно искать на форумах

«Excellent machine learning course for beginners like me. Professor Andrew Ng has explained details of machine learning in very systematic, simple and clear terms.»

Позволит разобраться в базовых алгоритмах и концепциях

+ Примеры на Python и R+ Много задач из реального бизнеса+ Большой обзор методованализа данных+ Различные представления данных и программы для их обработки+ Хороший курс для новичка

- Немного теории (математики,алгоритмов)

- Немного и практических заданий- Цена = 10-15$

Well in terms of flow of topics and covering the fundamentals. It does add great value to beginners.

This course is the clear winner in terms of breadth and depth of coverage of the data science process of the 20+ courses I qualified.

Помогает сориентироваться в методах и областях анализа данных для бизнеса

Udacity Nanodegree: Machine Learning

+ Большая подоробная программа+ Рейтинг 4.7 из 5+ Сильная практическая часть

Возможные трудности:- Курс рассчитан на 6 месяцев- $999 USD

«It was an awesome experience and I can't deny being drained, but it was worth it. :)»

«This is a very comprehensive program that covers all the bases of machine learning. The work is independent so it takes commitment, but all the materials are very well prepared and documented»

.

Специализация «Машинное обучение и анализ данных» на Coursera+ Русский язык+ Богатая учебная программа+ Создатели курса - признанные специалистыв обработке данных+ Активное сообщество в Slack+ Много практики на Python

- Много математического анализа и теории вероятностей- Не все темы одинаково подробно изложены- Часть заданий закрыта при бесплатном просмотре, полная стоимость ~4600 р. в месяц- Специализация из 6 курсов – это долго

«Много практики. Нагрузка довольно высокая, особенно для работающего человека. Некоторые моменты в лекциях освещаются очень поверхностно, а порой на слушателя просто вываливаются большие формулы, а пояснение дано к ним в двух словах. В этом плане классический ml class с Andrew Ng мне понравился больше, т.к. теория там дана была более подробно, но зато было меньше практики (а тут плюс текущему курсу).»

, но круто, если пройдёте

Поможет найти первую работу, связанную с данными

Deep Learning Specialization+ Преподаватель - всемирно известный учёный, основатель платформы Coursera+ Чёткие и ясные объяснения+ Высокий рейтинг всех курсов

Возможные трудности:- Нужны начальные знания Machine

Learning- Трудно разбираться с Keras- Все материалы на английском- Жалобы на слишком простые задания по

программированию нейросетей«Maybe the programming assignments would have made more challenging»

Поможет найти работу, связанную с глубоким обучением

Excellent starting point for those who wish to learn about deep learning. And good revision for those who know about already deep learning.

KaggleKaggle/learn

Титаник

• Пример: визуализация личных расходов от Лаборатории Данных

Картинка с https://habrahabr.ru/company/datalaboratory/blog/217179/

Мотивация возникает только в процессе деятельности

• Дополнение от слушателей: Learning How to Learn – курс на Coursera. Знания психологии и науки о мозге, трюки, техники работы с прокрастинацией для эффективной учёбы.

kate@antakova.ru

Recommended