机器学习工程师 V I P 班课程大 - s3.cn-north-1 ... · 在该项目中，你将使用强化学习中的 Q-Learning 算法，实现一个自动走迷宫机器人。在我们的迷宫中，有陷阱（红色炸

机器学习工程师 VIP 班课程大纲系统掌握监督学习、非监督学习、深度学习、强化学习等技能更新日期 / 2018-12-29

先修知识一定的 Python 编程能力，熟悉概率论与统计、线性代数与微积分。如果不具备这些能力，可以去学习“人工智能编

程基础”。学习目标这个项目将培养你成为一名机器学习工程师，学会如何建立模型，并将这些模型应用在各个领域的数据集中，如金

融、卫生保健和教育等。项目时长这个课程长达 34 周，平均需要每周花 10 小时左右。学习服务详情请咨询学习规划师。

第 1 部分：机器学习基础

课程内容

课程标题学习目标

训练与测试模型使用 Pandas 读取数据集，并使用 scikit-learn 训练与测试模型。

评估指标了解用于评估模型性能的指标，如准确率、精度、召回率和 ROC 得分。

模型选择学习如何进行交叉验证，通过学习曲线判断过/欠拟合，并学习如何使用网格搜索来训练模型。

自我评估：NumPy 与 pandas 测试你的 NumPy 和 pandas 技能

自我评估：模型评估与验证测试你对模型评估与验证的理解

实战项目：预测房价波士顿地区的房地产市场竞争激烈，而你目标成为该地区最好的房地产经纪人。为了使自己更具有竞争力，你决定

使用一些机器学习概念来帮助自己和客户制定适合该地区房屋的最佳销售价格。幸运的是，你找到了波士顿房价数

据集，该数据集包含有关大波士顿社区房屋各类属性的汇总数据，包括每个区域的房屋价值中位数。你的任务是基

于可用工具进行统计分析，并构建最佳模型。这个模型将被用来预测你的客户想要购买的房屋的最合适的销售价

格。

第 2 部分：监督学习

课程内容


线性回归了解分类与回归的区别，学习如何使用线性回归来做预测

感知器算法学习神经网络中的感知器，以及如何使用它进行分类

决策树学习决策树，并使用决策树探索泰坦尼克号乘客存活模型

朴素贝叶斯学习朴素贝叶斯原理，并构建垃圾邮件分类器

支持向量机学习如何训练支持向量机以线性分离数据；使用核方法在非线性可分的数据上来训练 SVMs

集成方法通过 boosting 提升传统方法；Adaboost

自我评估：监督学习监督学习相关的测试题

实战项目：寻找慈善机构的捐助者 CharityML 是一家位于硅谷中心的虚构慈善组织，旨在为渴望学习机器学习的人们提供财务支持。在向社区中的人

发送近 32,000 封信之后，CharityML 决定只向年收入超过5万美元的人收取捐款。为了扩大他们的潜在捐助者群体

，CharityML 决定向加利福尼亚州居民致函，但只向那些最有可能捐赠给慈善机构的人发信。大约有近 1500 万名

加利福尼亚州工作人员，CharityML 需要你帮助他们建立一种模型，来识别潜在的最可能捐助的人并降低发送邮件

的费用。你的目标是评估和优化几个不同的监督学习模型，以确定哪种算法能够获得最高的捐赠收益率，同时减少

发送信件中的字数。

第 3 部分：非监督学习

课程内容


聚类学习如何聚类算法，并尝试使用 k-means 对数据进行聚类

聚类迷你项目使用 k-means 对电影评分进行聚类

层次聚类法与密度聚类学习单连接聚类法和层次聚类法，DBSCAN

高斯混合模型与聚类验证学习高斯混合模型及相关示例

特征缩放通过案例学习特征缩放

PCA（主成分分析）了解降维的作用，并学习 PCA 的原理和使用场景

PCA 迷你项目使用特征脸方法和 SVM 进行脸部识别

随机投影与 ICA 学习随机投影与独立成分分析，并通过 Lab 学习如何应用这些方法

非监督学习自我评估非监督学习相关的测试题

实战项目：创建客户细分在此项目中，您将针对葡萄牙里斯本批发商的客户收集的产品支出数据应用非监督学习技术，以确定隐藏在数据中

的客户群。您将首先通过选择一个小样本子集来探索数据，并确定是否有任何产品类别彼此高度相关。之后，您将

通过缩放每个产品类别来预处理数据，然后识别（并移除）不需要的异常值。借助良好，干净的客户支出数据，您

将对数据应用PCA转换，并使用聚类算法以对转换后的客户数据进行细分。最后，您将比较发现的细分和附加标签

，并考虑这些信息是否可以帮助批发商进行未来服务变更。

第 4 部分：深度学习

课程内容


神经网络学习深度学习基础，包括 softmax、one-hot encoding 和 cross entropy

学习感知器与梯度下降

深度神经网络学习神经网络结构，了解如何通过 backpropogation 来训练网络学习如何通过一些方法来优化神经网络，如 regularization 与 dropout 使用 Keras 分析 IMDB 电影数据

卷积神经网络卷积神经网络的原理及其在图像识别中的应用 keras，迁移学习

癌症检测深度学习实现深度学习在癌症（如皮肤癌）检测中的应用

深度学习自我评估深度学习相关的检测题

实战项目：狗狗品种分类在这个项目中，您将学习如何构建可用于 Web 端或移动应用程序的流水线算法，以处理用户提供的真实世界的图像。给

定狗的图像，您的算法将能够识别出狗的品种。如果提供了人的图像，代码将识别与图像中的人最相似的狗品种。除了探

索用于分类的最先进的 CNN 模型之外，您还将针对您的应用的用户体验做出重要的设计决策。我们的目标是，通过完成

本实验，您将了解将数据处理流水线中执行各种任务的一系列模型拼凑在一起所面临的挑战。每个模型都有其优缺点，而

设计一个真实世界的应用程序通常涉及解决许多问题而没有完美的答案。您不完美的解决方案将创造一个有趣的用户体

验！

第 5 部分：强化学习

课程内容


欢迎学习强化学习！强化学习与 OpenAI Gym 的基础

强化学习框架学习如何使用马尔科夫决策过程来解决实际问题；学习策略，推导 Bellman 方程

动态规划编写自己的迭代策略评估、策略改进、策略迭代和值迭代

蒙特卡洛方法实现经典的蒙特卡洛预测和控制方案；了解 greedy 算法与 epsilon-greedy 算法；

时间差分方法学习 Sarsa、Q-Learning 和预期 Sarsa

迷你项目：解决 OpenAI Gym 的 Taxi-v2 任务

迷你项目：解决 OpenAI Gym 的 Taxi-v2 任务

连续空间中的强化学习

了解如何使传统算法适用于连续空间。

Deep Q-learning 使用深度神经网络将强化学习方法扩展到复杂问题。

策略梯度基于策略的方法试图直接优化最优策略。了解它们是如何工作的，以及它们为什么重要，尤其是对于具有连续动作

空间的域。

行动者-评论者方法学习如何结合基于价值和基于策略的方法，解决具有挑战性的强化学习问

题。

强化学习自我评估强化学习相关的测试题

实战项目：Q-Learning 训练机器人走迷宫在该项目中，你将使用强化学习中的 Q-Learning 算法，实现一个自动走迷宫机器人。在我们的迷宫中，有陷阱（红色炸

弹）及终点（蓝色的目标点）两种情景。通过使用 Q-Learning 算法，机器人将能够成功学习到一个策略，使之能够尽量

避开陷阱、尽快到达终点。

第 6 部分：GitHub 个人档案建立

课程内容


GitHub 个人资料的建立和完善

了解 GitHub 的重要性；了解使用 GitHub 的原因；了解如何创建及优化你的 GitHub 个人资料；

（可选）使用 Git 和 GitHub 进行版本控制

了解什么是版本控制；了解如何创建 Git 仓库；了解如何查看，修改，添加 Git 仓库；了解如何使用远程仓库；

实战项目：GitHub 个人资料审阅在该项目中，我们将指导你如何从招聘经理或用人经理的角度审视你的的 GitHub 主页，重点关注你的个人资料、项目和

代码，以及它们如何能证明你是潜在候选人或项目需要的人才。

第 7 部分：优化你的个人品牌

课程内容


找工作的策略了解如何有效地搜索心仪职位；了解针对具体职位优化你的申请；

个人建立的创建和优化了解简历的组成部分；了解如何描述过往工作经验；注意简历中的细节；

实战项目：简历审阅在该项目中，你将寻找一个自己的意向岗位，并依照岗位具体需求，准备并完善你的个人简历，建立专属的个人品牌。

第 8 部分：拓展你的职业人脉

课程内容


找工作的策略了解如何有效地搜索心仪职位；了解针对具体职位优化你的申请；

个人建立的创建和优化了解简历的组成部分；了解如何描述过往工作经验；

注意简历中的细节；

实战项目：领英个人资料审阅在该项目中，你将站在招聘经理或者用人部门的角度来审视自己的领英个人资料，将着重点放在自己的工作经验、项目经

历、教育背景和专业技能上，向他人展示你是一个有潜力，有专业能力，有合作力的应聘者。

实战项目：毕业项目开题报告

实战项目：毕业项目（三选一）在毕业项目中，你将运用你在此纳米学位中学到的机器学习算法和方法选择一个你感兴趣的问题来解决。首先你需

要定义(define)一个你想要解决的问题，调研可能的解决方案，并解释其衡量指标。其次，你需要通过数据可视化和

数据挖掘分析 (analyze) 这个问题，以便对适于解决该问题的算法和特征有一个更好的了解。接着，你需要实现 (implement)你的算法和衡量指标。你需要记录下预处理、改善、后处理的整个过程。接下来，你需要收集这些模型

的表现结果(results) ，把重要的部分可视化，来验证或证明这些结果。最后，你要在你的结果基础上得出结论 (conclusions)，讨论一下你的实现是否真的解决了这个问题。自然语言处理方向项目1 - 句子相似度匹配 Quora Querstion Pairs数据集是Quora于2017年公开的句子匹配数据集，其通过给定两个句子的一致性标签标注，

从而来判断句子是否一致。数据挖掘方向项目2 - 预测 Rossmann 未来的销售额 Rossmann是欧洲的一家连锁药店。在这个源自Kaggle比赛Rossmann Store Sales中，我们需要根据Rossmann药妆店的信息（比如促销，竞争对手，节假日）以及在过去的销售情况，来预测Rossmann未来的销售额。计算机视觉方向项目3 - 猫狗大战使用深度学习方法识别一张图片是猫还是狗。

https://data.quora.com/First-Quora-Dataset-Release-Question-Pairs

https://www.kaggle.com/c/rossmann-store-sales

第 9 部分：模拟面试

课程内容


行为导向模拟面试了解什么是行为面试；了解如何有效准备面试；学习如何应对面试失败；

机器学习模拟面试了解什么是机器学习面试；了解机器学习面试中的常见题型；

实战项目：行为导向模拟面试实战项目在该项目中，你将与专业导师进行 1 对 1 实战演练，行为导向的面试问题没有对错标准，你只需简洁并真实的进行相关

回答和描述，通过实践熟悉此类考核，并以此感受面试现场的环境和心态。

实战项目：机器学习模拟面试实战项目在该项目中，你将与专业导师进行 1 对 1 实战演练，帮助你对掌握的技能查缺补漏，更希望你能以此感受面试现场的环

境和心态，锻炼临场应对和解题思路。

立即加入课程咨询群想知道课程难度是否合适？想获得 1 对 1 学习路径规划？想了解更多课程详情？想获得不定期福利干货分享？

扫描下方二维码，立即入群咨询您的专属学习规划师

Documents

机器学习工程师 V I P 班课程大 - s3.cn-north-1 ... · 在该项目中，你将使用强化学习中的 Q-Learning 算法，实现一个自动走迷宫机器人。在我们的迷宫中，有陷阱（红色炸