全国高校大数据与人工智能研修班-4大专题邀请函
四大专题:网络爬虫与数据处理、数据挖掘与机器学习实战、金融数据分析实战、深度学习实战主办单位:泰迪杯数据挖掘挑战赛组委会承办单位:广东泰迪智能科技股份有限公司协办单位:人民邮电出版社有限公司北京泰迪云智信息技术研究院互联网、云计算、大数据等现代信息技术深刻改变着人类的思维、生产、生活、学习方式,深刻展示了世界发展的前景。目前各院校的大数据专业教师匮乏、相关落地动手实战应用能力欠缺、授课过程中相关行业实战案例项目缺失等,为加快建设大数据专业教师队伍,推动各院校建立大数据人才培训体系和评价体系,泰迪科技推出全国高校大数据与人工智能骨干师资研修班,每年在全国范围内滚动开展八期,截止目前已在全国巡回举办40余场,参训教师近5000人次。2021年第二期全国高校大数据与人工智能骨干师资研修班将开设四大专题方向:“网络爬虫与数据处理、数据挖掘与机器学习实战、金融数据分析实战、深度学习实战”,本次研修班采用线上以云课堂形式举办,现将有关详细安排通知如下:专题一:网络爬虫与数据处理一、课程介绍人工智能时代的来临,随着互联网数据越来越开放,越来越丰富。基于大数据来做的事也越来越多。数据分析服务、互联网金融、数据建模、医疗病例分析、自然语言处理、信息聚类,这些都是大数据的应用场景,而大数据的来源都是利用网络爬虫来实现。本次培训采用“云课堂线上精讲+专家技术在线答疑指导+学员群内实操答疑+助教指导”结合的方式,包含前置基础课程学习阶段和核心课程学习阶段,讲解数据采集常用手段、数据清洗、数据可视化和项目代码实践,梳理技术框架。二、课程特色1、通过学习本次课程,可以完整地学习数据获取、清洗、统计、分析、可视化等数据处理周期的主要技术,也可以培养计算思维、数据思维及采用程序设计方法解决计算问题的实战能力。2、本课程配套有基础知识内容,可使零基学员础快速入门,带领学员迅速掌握Python编程,了解网络爬虫的基本概念及相关实现,讲解常见的爬虫套路并利用相关实战帮助学员提高数据采集能力,避免没有数据可分析的尴尬。3、核心课程部分由讲师手把手一起进行实操演练,在具体应用场景中全面掌握相关技能,助力实训教学工作、实际动手的能力。内容以代码落地为主,以理论讲解为根,以公式推导为辅,通过讲解具体应用,全面解析专业必备技能,为相关课程开设和备课、应对科研和项目开发打下坚实基础。4、全面实践数据分析流程,包括数据采集、数据处理、数据探索、数据可视化等课程提供知识讲解,注重案例实战,提供在线答疑等服务,助力夯实理论基础,掌握核心技术,全面提升专业授课能力。

5、培训期间助教全程辅助教学,每天提供10小时的实时在线答疑辅导,并进行答疑文档汇总,更好地总结学习。6、无论是前置学习篇还是案例集训篇,相关代码、源数据、PPT、案例素材全部提供下载,即学即用,教学更轻松!视频内容支持六个月内免费回看,以便复习和参考。7、参加线上课程学习的学员,如后续本人参加线下课程继续深造,持线上缴费凭证可享受一次免费学习机会(仅限参加同一培训专题方向的线下课程)。

三、课程大纲基础篇 (报名成功后即可开始学习)时间课程内容学习平台正式培训前Python编程基础1准备工作2列表操作3程序流程控制语句4字符串操作4.1字符串及其索引&切片4.2字符串的常见方法4.3字典的创建及索引4.4字典常用操作4.5字典推导式5Python文件读取操作5.1Python读取文件5.2练习3:统计小说中的单词频次6函数6.1Python函数自定义6.2练习4:自定义求序列偶数个数的函数7面向对象与模块7.1Python方法与函数对比介绍7.2Python面向对象示例7.3Python模块使用7.4第三方库的安装与调用8注意事项8.1Python工作路径说明8.2模块命名及存放路径的注意事项8.3结语泰迪云课堂核心课程篇时间课程内容学习平台第一课 Python数据处理与可视化4月9日18:30-22:001 Python数据分析概述1.1 认识数据分析1.2 熟悉Python数据分析的工具1.3 安装Anaconda与启动Jupyter Notebook1.4 掌握Jupyter Notebook常用功能2 NumPy数值计算基础2.1 掌握NumPy数组对象2.1.1NumPy简介2.1.2 数组创建及基础属性2.1.3 初识数组的特点2.1.4 创建常用数组2.1.5 数组数据类型2.1.6 生成随机数2.1.7 一维数组的索引2.1.8 逻辑型索引2.1.9 多维数组的索引2.1.10 求解距离矩阵2.1.11 变化数组shape2.2 掌握NumPy矩阵与通用函数2.2.1 NumPy矩阵介绍2.2.2 NumPy通用函数介绍2.2.3 通用函数的广播机制2.3 利用NumPy进行统计分析2.3.1 NumPy读写二进制文件2.3.2 NumPy读写txt文件2.3.3 利用NumPy对数据进行简单统计分析泰迪云课堂操作演练/作业个人PC在线答疑微信群4月10日18:30-22:003 Matplotlib数据可视化基础3.1 掌握绘图基础语法与常用参数3.1.1 Matplotlib介绍3.1.2 基础图形绘制3.1.3 常用参数设置3.2 分析特征间关系3.2.1 绘制散点图3.2.2 散点图参数设置3.2.3 绘制折线图3.3 分析特征内部数据分布与分散情况3.3.1 绘制直方图3.3.2 绘制饼图3.3.3 绘制箱线图泰迪云课堂操作演练/作业个人PC在线答疑微信群4月11日18:30-22:004 Pandas统计分析基础4.1 Pandas简介4.2 读写不同数据源的数据4.2.1 Pandas读取文本数据4.2.2 存储数据框4.2.3 Pandas读取excel文件4.2.4 将数据框存储为excel文件4.3 数据框与数据框元素4.3.1 构建数据框4.3.2 查看数据框的常用属性4.3.3 按行列顺序访问数据框中的元素4.3.4 按行列名称访问数据框中的元素4.3.5 修改数据框中的元素4.3.6 删除数据框中的元素4.3.7 描述分析数据框中的元素4.4 转换与处理时间序列数据4.4.1 转换成时间类型数据4.4.2 时间类型数据的常用操作泰迪云课堂操作演练/作业个人PC在线答疑微信群第二课 Python网络爬虫:概述与静态网页采集4月12日18:30-22:001.1 Python网络爬虫实战介绍1.2 认识爬虫1.3 认识反爬虫2 网页前端基础2.1 概述2.2 HTTP请求方法与过程2.3 常见HTTP状态码2.4 HTTP头部信息2.5 认识cookies3 简单静态网页爬取(实训:采集泰迪科技官网标题栏信息)3.1 静态网页爬取概述3.2 使用urllib3实现HTTP请求3.3 使用requests库实现HTTP请求3.4 谷歌开发者工具介绍3.5 正则表达式介绍3.6 使用正则表达式获取网页标题信息3.7 使用XPath进行网页解析3.8 使用BeautifulSoup进行网页解析3.9 数据存储3.10 小结泰迪云课堂操作演练/作业个人PC在线答疑微信群第三课 Python网络爬虫:动态网页采集与模拟登陆4月13日18:30-22:004 常规动态网页爬取(实训:采集人邮官网新书资讯)4.1 常规动态网页爬取概述4.2 逆向分析爬取动态网页4.3 使用Selenium打开浏览对象4.4 Selenium页面等待4.5 使用Selenium获取图书信息4.6 小结5 模拟登录5.1 模拟登录概述5.2 查找表单数据入口及提交数据5.3 验证码人工处理与代理IP5.4 使用POST请求方法登录5.5 使用浏览器cookies登录5.6 基于表单登录的cookies登录5.7 小结泰迪云课堂操作演练/作业个人PC在线答疑微信群第四课 Python网络爬虫:终端协议分析与Scrapy爬虫4月14日18:30-22:006 终端协议分析6.1 终端协议分析概述6.2 了解HTTP Analyzer工具6.3 实战:爬取千千音乐PC客户端数据7 Scrapy爬虫7.1 了解scrapy爬虫框架7.2 熟悉scrapy的常用命令7.3 实战:爬取网页动态信息7.3.1 创建scrapy爬虫项目7.3.2 修改ItemsPipelines脚本7.3.3 编写spiders脚本7.3.4 修改setting脚本7.3.5 定制中间件泰迪云课堂操作演练/作业个人PC在线答疑微信群第五课 数据采集与处理实战:《红海行动》B站弹幕采集与分析4月15日18:30-22:001.1 案例背景与挖掘目标2.1 弹幕数据爬取介绍2.2 获取视频的cid2.3 使用request.get方法访问弹幕URL2.4 使用lxml解析器解析页面2.5 时间戳转换格式2.6 数据整理与保存3.1 弹幕正文数据预处理3.2 词频统计3.3 绘制整体弹幕数据的词云图4.1 弹幕数量与日期的关系4.2 弹幕数量与时刻的关系4.3 弹幕字数统计分析5.1 总结泰迪云课堂操作演练/作业个人PC在线答疑微信群第六课 数据采集与处理实战:某品牌手机的京东评论数据采集与分析4月16日18:30-22:001.1 案例背景与挖掘目标2.1 数据采集流程介绍2.2 逆向分析获取评论数据URL2.3 使用request.get方法访问评论URL2.4 提取数据并保存到本地3.1 生成好评的词云,并且获取关键字3.2 生成中评的词云,并且获取关键字3.3 生成差评的词云,并且获取关键字3.4 分析购买该商品不同颜色的比例3.5 分析购买该商品不同配置的比例3.6 分析该商品的销售数量和评论数量和时间的关系3.7 分析该商品不同省份购买的比例3.8 分析该商品不同渠道的销售比例泰迪云课堂操作演练/作业个人PC在线答疑微信群第七课 数据采集与处理实战:大数据岗位人才招聘信息的分析与挖掘4月17日9:00-12:0014;00-17;0018:30-22:001.1背景与目标2.1信息爬取介绍2.2获取岗位名称数据2.3获取目录页的所有字段信息2.4获取二级网址的网页链接2.5获取二级网址的所有字段信息2.6对单一目录页中的所有二级网页信息进行抓取2.7将第一个目录页的数据进行保存2.8批量爬取及数据保存3.1已爬取数据介绍3.2根据岗位名筛选招聘信息3.3统一岗位名称3.4根据工资列筛选数据3.5完成工资数据处理3.6工作地点字段处理3.7公司类型字段处理3.8行业字段数据处理3.9工作描述字段处理3.10公司规模字段处理3.11数据预处理小结4.1热门招聘岗位可视化4.2热门行业及公司招聘分析4.3热门岗位的工资水平4.4可视化综合分析4.5岗位技能分析5总结泰迪云课堂操作演练/作业个人PC在线答疑微信群自行安排拓展自学Python爬虫助力疫情数据追踪1明确项目需求与目标2环境准备3获取疫情数据(全球、中国各省及各地区数据)4疫情数据分析5疫情数据可视化6完成分析报告泰迪云课堂第八课 认证考试4月18日19:00-21:30工信部教育与考试中心高级Python技术应用工程师职业技术认证在线考试泰迪云课堂部分实操结果展示:

四、证书认证学员经在线培训并考试合格后,可以获得由工业和信息化部教育与考试中心颁发“高级Python技术应用工程师职业技术证书”,证书可登录国家工业和信息化部教育与考试中心官网查询。

专题二:数据挖掘与机器学习实战一、课程介绍随着大数据时代的到来,对于数据的要求不仅仅是存储和管理,更重要的是需要对大量数据进行分析、加工最后再决策。数据分析与挖掘可以从海量数据中获得别人看不见的信息,创业者可以通过数据分析来优化产品,营销人员可以通过数据分析改进营销策略,产品经理可以通过数据分析洞察用户习惯,金融从业者可以通过数据分析规避投资风险,程序员可以通过数据分析进一步挖掘出数据价值。本次培训采用“云课堂线上精讲+专家技术在线答疑指导+学员群内实操答疑+助教指导”结合的方式,主要讲解了使用Python进行数据分析与挖掘的相应理论与代码实践,梳理技术框架,从根本上解决如何使用模型、优化模型的问题,通过讲解企业级案例,真正的让各位老师可以了解到所学内容如何和实际结合,做到更好的进行教育教学工作。二、课程特色1、本课程全程强调动手实操;内容以代码落地为主,以理论讲解为根,以公式推导为辅,通过讲解企业级案例,真正的让学员把所学内容和工作实际有效结合,做到更好的进行教育教学工作。视频制作精良,讲师真人出镜,系统梳理课程知识框架,全面解析专业必备技能,为相关课程开设和备课、应对科研和项目开发打下坚实基础。2、核心课程部分由讲师手把手一起进行实操演练,在具体应用场景中全面掌握相关技能,助力实训教学工作、实际动手的能力。通过讲解具体应用,全面解析专业必备技能,为相关课程开设和备课、应对科研和项目开发打下坚实基础。3、全面实践商务数据分析流程,包括数据处理、数据探索、数据建模等课程提供知识讲解,注重案例实战,提供在线答疑等服务,助力夯实理论基础,掌握核心技术,全面提升专业授课能力。

4、培训期间助教全程辅助教学,每天提供10小时的实时在线答疑辅导,并进行答疑文档汇总,更好地总结学习。5、无论是前置学习篇还是案例集训篇,相关代码、源数据、PPT、案例素材全部提供下载,即学即用,教学更轻松!视频内容支持六个月内免费回看,以便复习和参考。6、参加线上课程学习的学员,如后续本人参加线下课程继续深造,持线上缴费凭证可享受一次免费学习机会(仅限参加同一培训专题方向的线下课程)。

三、课程大纲基础篇 (报名成功后即可开始学习)时间课程内容学习平台正式培训前Python编程基础1准备工作2列表操作3程序流程控制语句4字符串操作4.1字符串及其索引&切片4.2字符串的常见方法4.3字典的创建及索引4.4字典常用操作4.5字典推导式5Python文件读取操作5.1Python读取文件5.2练习3:统计小说中的单词频次6函数6.1Python函数自定义6.2练习4:自定义求序列偶数个数的函数7面向对象与模块7.1Python方法与函数对比介绍7.2Python面向对象示例7.3Python模块使用7.4第三方库的安装与调用8注意事项8.1Python工作路径说明8.2模块命名及存放路径的注意事项8.3结语泰迪云课堂核心课程篇时间课程内容学习平台第一课 Python数据分析与应用4月10日18:30-22:001 Python数据分析概述1.1 认识数据分析1.2 熟悉Python数据分析的工具1.3 安装anaconda与掌握Jupyter Notebook常用功能2 NumPy数值计算基础2.1 掌握NumPy数组对象2.1.1NumPy简介2.1.2 数组创建及基础属性2.1.3 初识数组的特点2.1.4 创建常用数组2.1.5 数组数据类型2.1.6 生成随机数2.1.7 一维数组的索引2.1.8 逻辑型索引2.1.9 多维数组的索引2.1.10 求解距离矩阵2.1.11 变化数组shape2.2 掌握NumPy矩阵与通用函数2.2.1 NumPy矩阵介绍2.2.2 NumPy通用函数介绍2.2.3 通用函数的广播机制2.3 利用NumPy进行统计分析2.3.1 NumPy读写二进制文件2.3.2 NumPy读写txt文件2.3.3 利用NumPy对数据进行简单统计分析3 Pandas统计分析基础3.1 Pandas简介3.2 读写不同数据源的数据3.2.1 Pandas读取文本数据3.2.2 存储数据框3.2.3 Pandas读取excel文件3.2.4 将数据框存储为excel文件3.3 数据框与数据框元素3.3.1 构建数据框3.3.2 查看数据框的常用属性3.3.3 按行列顺序访问数据框中的元素3.3.4 按行列名称访问数据框中的元素3.3.5 修改数据框中的元素3.3.6 删除数据框中的元素3.3.7 描述分析数据框中的元素泰迪云课堂操作演练/作业个人PC在线答疑微信群4月11日18:30-22:003.4 转换与处理时间序列数据3.4.1 转换成时间类型数据3.4.2 时间类型数据的常用操作4.5 使用分组聚合进行组内计算4.5.1 groupby分组操作4.5.2 agg聚合操作4.6 创建透视表与交叉表4.6.1 生成透视表4.6.2 生成交叉表5 使用Pandas进行数据预处理5.1 合并数据5.1.1 表堆叠5.1.2 主键合并5.1.3 重叠合并5.2 清洗数据5.2.1 检测与处理重复值5.2.2 检测与处理缺失值5.2.3 检测与处理异常值5.3 标准化数据5.4 转换数据5.4.1 哑变量处理5.4.2 离散化连续型数据泰迪云课堂操作演练/作业个人PC在线答疑微信群第二课 Python数据分析实训4月12日18:30-22:001探索Iris鸢尾花数据1.1 将数据集存成变量iris创建数据框的列名称['sepal_length', 'sepal_width', 'petal_length', 'petal_width', 'class']1.2数据框中有缺失值吗?1.3将列petal_length的第10到19行设置为缺失值。1.4将petal_lengt缺失值全部替换为1.0。1.5删除列class。1.6将数据框前三行设置为缺失值。1.7删除有缺失值的行。1.8重新设置索引。2探索Chipotle快餐数据2.1将数据集存入一个名为chipo的数据框内2.2查看前10行内容2.3数据集中有多少个列(columns)?2.4打印出全部的列名称2.5数据集的索引是怎样的?2.6被下单数最多商品(item)是什么?2.7在item_name这一列中,一共有多少种商品被下单?2.8一共有多少个商品被下单?泰迪云课堂4月12日18:30-22:002.9将item_price转换为浮点数2.10在该数据集对应的时期内,收入(revenue)是多少?2.11在该数据集对应的时期内,一共有多少订单?2.12每一单(order)对应的平均总价是多少?3探索Apple公司股价数据3.1读取“appl_1980_2014.csv”数据并存为一个名叫apple的数据框。3.2查看每一列的数据类型。3.3将Date这个列转换为datetime类型。3.4将Date设置为索引。3.5有重复的日期吗?3.6将index设置为升序。3.7找到每个月的最后一个交易日(businessday)。3.8数据集中最早的日期和最晚的日期相差多少天?3.9在数据中一共有多少个月?3.10按照时间顺序可视化Adj Close值。泰迪云课堂操作演练/作业个人PC在线答疑微信群第三课 Python数据可视化4月13日18:30-22:001 Matplotlib数据可视化基础1.1 掌握绘图基础语法与常用参数1.1.1 Matplotlib介绍1.1.2 基础图形绘制1.1.3 常用参数设置1.2 分析特征间关系1.2.1 绘制散点图1.2.2 散点图参数设置1.2.3 绘制折线图1.3 分析特征内部数据分布与分散情况1.3.1 绘制直方图1.3.2 绘制饼图1.3.3 绘制箱线图2 Pyecharts实现交互式绘图2.1 Pyecharts简介与绘图逻辑说明2.2 Pyecharts绘制散点图2.3 Pyecharts绘制线图2.4 Pyecharts绘制饼图2.5 Pyecharts绘制柱状图2.6 Pyecharts图形组合3 地理图表绘制3.1 Pyecharts地理图表介绍3.2 Pyecharts绘制地理散点图3.3 Pyecharts绘制地理迁徙图3.4 Pyecharts绘制广东区域图4 小结泰迪云课堂操作演练/作业个人PC在线答疑微信群第四课 数据可视化实战案例:全国汽车销量可视化4月14日18:30-22:001 读取数据2 数据探索3 汽车销量数据分析3.1 市场需求3.2 消费能力3.3 企业竞争3.4 热销车型3.5 销售量随时间的变换情况3.6 地理图表展示不同城市、不同省份的销量情况4 车企年度销量目标5 汇总泰迪云课堂操作演练/作业个人PC在线答疑微信群第五课 机器学习实践4月15日18:30-22:001.1引言1.2基本术语1.3假设空间&归纳偏好2.1经验误差与过拟合2.2评估方法2.3性能度量2.4性能度量Python实现3.1线性回归基本形式3.2线性回归模型的Python实现3.3波士顿房价预测的Python实现3.4逻辑回归介绍3.5研究生入学录取预测的Python实现4.1从女生相亲到决策树4.2明天适合打球吗4.3决策树拆分属性选择4.4决策树算法家族4.5泰坦尼克号生还者预测—数据预处理4.6泰坦尼克号生还者预测—模型构建与预测4.7决策树可视化泰迪云课堂操作演练/作业个人PC在线答疑微信群4月16日18:30-22:005.1聚类分析概述5.2相似性度量5.3K-Means聚类分析算法介绍5.4利用K-Means算法对鸢尾花进行聚类5.5聚类结果的性能度量5.6调用Sklearn实现聚类分析6.1间隔与支持向量6.2对偶问题6.3核函数6.4软间隔与正则化6.5支持向量机算法的Python实现泰迪云课堂操作演练/作业个人PC在线答疑微信群第六课 机器学习实战案例:运营商流失用户的分析和预测4月17日9:00-12:0014;00-17;0018:30-22:001.1背景与目标1.1.1背景1.1.2数据说明1.1.3目标1.2数据预处理1.2.1查找并删除重复个案1.2.2降维及数字化处理1.2.3数据的提取与整合1.2.4缺失值与异常值处理1.3流失用户的特征分析1.3.1基本信息分析1.3.2K-Means聚类分析1.3.3特征值的提取1.4模型的建立与求解1.4.1建模思路及数据准备1.4.2CART决策树模型1.4.3神经网络模型1.4.4朴素贝叶斯模型1.4.5支持向量机模型1.5最优模型的选择及预测1.5.1预测数据集处理1.5.2各类预测的基本情况泰迪云课堂操作演练/作业个人PC在线答疑微信群第七课 综合实战:电商智能推荐--优惠券使用预测4月18日9:00-12:0014;00-17;0018:30-22:001 背景与目标2 数据说明2.1线下训练集数据介绍2.2线上训练集数据介绍2.3测试数据介绍2.4项目流程介绍3 数据预处理3.1构建正样本3.2构建负样本3.3构建样本标签4 特征构建4.1特征构建介绍4.2处理Discount_rate列4.3特征1-折扣率4.4特征2-商户与用户之间的距离5 模型训练5.1建模前数据准备5.2初级模型构建5.3ROC曲线与AUC值5.4模型性能评估5.5训练函数封装5.6模型预测5.7预测函数封装6 特征完善6.1特征3-优惠券流行度6.2特征4-用户在商家中的消费次数6.3如何进行特征拼接6.4拼接训练集的特征3&46.5拼接测试及的特征3&4泰迪云课堂操作演练/作业个人PC在线答疑微信群第八课 认证考试4月19日19:00-21:30工信部教育与考试中心高级大数据技术应用职业技术认证在线考试泰迪云课堂部分实操结果展示:

四、证书认证学员经在线培训并考试合格后,可以获得由工业和信息化部教育与考试中心颁发“高级大数据技术应用职业技术证书”,证书可登录国家工业和信息化部教育与考试中心官网查询。

专题三:金融数据分析实战一、课程介绍传统投资和量化投资两种投资方式的核心都是由人来决策,量化投资可以计算机技术,通过建模分析、优化参数等手段,从历史金融数据中挖掘出影响投资的指标,使用程序进行自动交易来获得“超额”的收益。虽然量化方法在投资中得到了越来越广泛的运用,量化交易蓝海迅速升温,但高精尖人才扎堆,入门门槛受限于“金融”、“编程”、“建模”这三座大山。对应的,我们要从量化投资的底层基础入手,关键是跟实际应用和市场结合,学了要会用才好。本次培训采用“云课堂线上精讲+专家技术在线答疑指导+学员群内实操答疑+助教指导”结合的方式,帮助老师全面了解量化投资行业,真正的让各位老师可以了解到所学内容如何和实际结合,做到更好的进行教育教学工作。二、课程特色1、本课程全程强调动手实操;内容以代码落地为主,以理论讲解为根,以公式推导为辅,通过讲解企业级案例,真正的让学员把所学内容和工作实际有效结合,做到更好的进行教育教学工作。视频制作精良,讲师真人出镜,系统梳理课程知识框架,全面解析专业必备技能。2、核心课程部分由讲师手把手一起进行实操演练,在具体应用场景中全面掌握相关技能,助力实训教学工作、实际动手的能力。通过讲解具体应用,全面解析专业必备技能,为相关课程开设和备课、应对科研和项目开发打下坚实基础。3、课程最注重实用性,将从量化投资的实际应用出发,贴近市场的实践。不仅仅讲解工具使用,更是培养策略化思维。课程中每一个知识点都会结合项目案例进行讲解,项目提供源码同步运行,理论实战并行,从实战中积累经验,助力夯实理论基础,掌握核心技术,全面提升专业授课能力。4、通过学习,可以取得如下收获:1)熟悉中国主要金融市场既交易产品的交易机制;2)熟知国内外期货交易、股市交易的异同点和内在运行机制3)掌握经典量化策略细节及其背后交易哲学4)掌握金融、编程和建模只是基础,拥有量化交易实盘操作能力5)具备独立自主地研发新量化交易策略的能力6)掌握量化交易模型设计的基本框架,以及资产组合理论的实际运用7)掌握从策略思想>策略编写>策略实现完整量化投资决策过程。5、培训期间助教全程辅助教学,每天提供10小时的实时在线答疑辅导,并进行答疑文档汇总,更好地总结学习。6、无论是前置学习篇还是案例集训篇,相关代码、源数据、PPT、案例素材全部提供下载,即学即用,教学更轻松!视频内容支持六个月内免费回看,以便复习和参考。

三、课程大纲基础篇 (报名成功后即可开始学习)时间课程内容学习平台正式培训前Python编程基础1. Python简介和安装1.1 Python 基础概念介绍1.2 学会Python环境配置安装1.3 学会编写Python第一个脚本2. 数据类型2.1 结构化数据与非结构化数据2.2 六种数据类型在生活中的运用2.3 字符串、列表、字典的常用使用方法3. 数据运算符3.1 常用的七种运算符运用3.2 运算符优先级4. 循环和条件语句4.1 循环语句与案例使用4.2 条件语句案例使用4.3 break语句4.4 continue语句4.5 pass语句4.6 案例:实现九九乘法表5. 函数创建与案例实现5.1 函数定义和调用5.2 函数参数传递6. NumPy工具包与案例实现6.1 创建简单NumPy数组6.2 NumPy数组属性与形状转换6.3 NumPy数值计算6.4 NumPy排序分析6.5 NumPy矩阵操作与线性方程组6.6 案例:NumPy对股票因子数据统计分析7. Pandas工具包与案例实现7.1 Pandas基础数据结构Series7.2 Pandas基础数据结构DataFrame7.3 Pandas数据提取和排序7.4 Pandas表统计与整合7.5 案例:Pandas对期货行情数据统计分析与整合泰迪云课堂核心课程篇时间课程内容学习平台第一课 金融量化基础与数据提取4月18日18:30-22:001 股票量化基础1.1 股票交易基础知识1.2 股票行情数据集介绍1.3 Python提取单个股票、多个股票、单天、多天的行情数据1.4 股票指数数据合成方法和Python提取数据1.5 股票财务报表数据集概览1.6 Python提取财务报表各表的数据,并分析应用1.7 股票因子数据分类和介绍1.8 Python提取单个因子、多个因子的数据,并简单分析2 期货量化基础2.1 期货交易基础知识2.2 期货品种分类和介绍2.3 Python提取各交易所的期货数据3 案例:分析期货品种流动性和波动性3.1 Python获取所有期货品种一年的行情数据3.2 求取所有期货品种的日均振幅,并排序处理3.3 求取所有期货品种的日均成交额、成交量,并排序处理3.4 分析所有品种的流动性和波动性,并按照交易所分析4 基金量化基础4.1 基金基础知识4.2 基金交易规则4.3 利用指标评价基金绩效泰迪云课堂操作演练/作业个人PC在线答疑微信群第二课 金融数据处理与可视化分析4月19日18:30-22:001 金融数据读取和存储1.1 金融数据获取1.2 Python读取和存储CSV数据集1.3 Python读取和存储TXT数据集1.4 Python读取和存储JSON数据集2 金融数据处理2.1 金融数据缺失值查看泰迪云课堂4月19日18:30-22:002.2 Python对金融数据缺失值进行删除处理2.3 Python对金融数据缺失值进行填充处理2.4 金融数据计算:每日收益率2.5 金融数据计算:累计收益率2.6 Python分析金融数据相关性2.7 金融数据热图绘制与分析3 金融时间数据转化和处理3.1 Datetime数据介绍3.2 Datetime数据时间差3.3 日期转换为字符串格式strftime3.4 字符串转换为日期格式strptime3.5 Pandas下的时间格式timestamp3.6 Pandas下的时间格式DatetimeIndex3.7 Pandas中的时间函数date_range()4 金融数据可视化4.1 Pandas内置可视化4.2 senborn绘图4.3 K线Python绘图5 案例:沪深300指数数据时间分析5.1 Python获取沪深300指数日数据集5.2 将日数据集转换为月数据集5.3 对数据集进行可视化分析泰迪云课堂操作演练/作业个人PC在线答疑微信群第三课 量化投资基础4月20日18:30-22:00量化理论基础1.1 量化投资概述1.2 量化投资与传统投资区别1.3 量化投资的优势和劣势2. 量化策略基础2.1 国内量化的发展2.2 私募和公募基金的策略类型2.3 CTA趋势策略2.4 统计套利策略2.5 市场中性策略2.6 多因子选股策略2.7 量化指数增强策略2.8 机器学习交易策略2.9 大数据与舆情分析策略2.10 行业轮动策略2.11 事件驱动策略2.12 高频策略3. 策略评价指标构建3.1 Python实现年化收益率3.2 绝对收益率与相对收益率3.3 夏普比率的应用和Python实现泰迪云课堂4月20日18:30-22:003.4 信息比率的应用和Python实现3.5 最大回撤的应用和Python实现4. 技术形态指标分析和实践4.1 技术指标分类4.2 talib库安装和Python调用4.3 Python计算MACD指标,并绘图4.4 BOLL指标的应用和Python实现绘图4.5 ATR指标原理应用,以及指标Python计算和绘图4.6 K线形态分类4.7 十字晨星形态Python实现和图形绘制4.8 三只乌鸦Python计算和绘图4.9上升/下跌三部曲Python实现和绘图4.10 头肩顶形态量化构建分析泰迪云课堂操作演练/作业个人PC在线答疑微信群第四课 金融统计模型4月21日18:30-22:001 线性回归模型1.1 线性回归原理1.2 单变量线性回归Python操作实现1.3 多变量线性回归Python操作实现1.4 案例:利用线性回归分析股票与指数之间的关系2 时间序列模型2.1 MA模型和AR模型2.2 ARMA模型的求解过程2.3 ARMA模型Python构建和实现2.4 案例:应用ARMA模型预测工商银行股价3 协整模型3.1 协整定义和检验步骤3.2 平稳性检验3.3 E-G检验法Python实践3.4 案例:判断工商银行和建设银行之间股票是否协整4 Python实现期权定价4.1 蒙特卡洛算法介绍4.2 期权定价模型4.3 案例:使用Python实现蒙特卡洛模拟期权定价5 Python实现最优投资组合管理5.1 均值‐方差前沿组合5.2 案例:利用Python进行MVF最优化投资组合管理6 Python分析实现在险价值VAR6.1 VAR的定义和应用6.2 案例:利用Python测试在险价值VaR泰迪云课堂操作演练/作业个人PC在线答疑微信群第五课 经典量化策略实现4月22日18:30-22:001 均线交易策略实现1.1 均线策略交易原理泰迪云课堂4月22日18:30-22:001.2 案例:均线策略实现和改进1.3 均线策略表现评估2 动量交易策略实现2.1 动量概念2.2 动量策略原理和盈利原因2.3 案例:动量策略Python代码实现3 均值反转策略实现3.1 均值反转概念3.2 均值反转策略原理分析3.3 案例:均值回归策略Python实现4 配对交易策略实现4.1 配对交易策略原理和流程4.2 协整检验4.3 案例:配对交易策略Python编写实现泰迪云课堂操作演练/作业个人PC在线答疑微信群第六课 量化交易策略实现和回测4月23日18:30-22:001 策略回测框架介绍1.1 Python执行策略流程1.2 整体策略框架介绍1.3 策略初始化1.4 策略数据获取1.5 策略逻辑运算1.6 策略回测机制说明1.7 平台API实践说明1.8 案例:使用策略框架使用双均线策略1.9 拓展:三均线策略的设计和实现2 策略构建思路2.1 标的选择2.2 策略逻辑2.3 仓位设计2.4 进场设计2.5 离场设计2.6 止盈止损设计3 案例:使用框架实现BiasAverage策略构建3.1 BiasAverage策略思路分析3.2 策略逻辑分析与代码实现3.3 策略进出场设计与实现3.4 策略止盈止损设计与实现3.5 策略回测与绩效分析泰迪云课堂操作演练/作业个人PC在线答疑微信群第七课 股票因子分析4月24日18:30-22:001. 因子数据处理1.1 因子值获取1.2 因子去极值处理1.3 因子标准化处理1.4 因子中性化处理2. 单因子有效性检验2.1 因子回归法检验2.2 因子IC值分析检验2.3 因子分层回测法检验2.4 案例:挑选优质的股票因子3. 多因子分析3.1 历史收益率加权法合成因子3.2 历史信息比率加权法合成因子3.3 主成分分析法合成因子3.4 因子正交化处理共线性3.5 因子异方差分析4. 案例:构建简单多因子选股策略4.1 挑选5个有效因子4.2 对因子数据进行处理4.3 因子相关性处理4.4 因子合成处理4.5 构建多因子选股策略并进行绩效分析泰迪云课堂操作演练/作业个人PC在线答疑微信群第八课 综合实战:CTA策略构建4月25日09:00-12:0014;00-17;0018:30-22:001 Dual Turust策略构建1.1 Dual Turust策略原理1.2 交易逻辑构建1.3 离市设计1.4 策略增加择时改进1.5 策略表现评估和分析2 海龟交易策略构建2.1 策略原理分析2.2 选择标的2.3 确定仓位2.4 确定交易逻辑2.5 进出场设计2.6 止盈止损设计2.7 策略回撤绩效分析与改进思路3 统计套利策略构建3.1 套利策略的原理和流程3.2 挑选套利组合3.3 套利组合协整检验3.4 进场自适应均线计算3.5 套利策略离场设计3.6 止盈止损设计3.7 完整策略搭建和回测分析泰迪云课堂操作演练/作业个人PC在线答疑微信群第九课 综合实战:多因子选股策略构建4月26日18:30-22:001 案例:资产资本定价模型构建选股策略1.1 资产资本定价模型分析1.2 资产定价模型策略选股逻辑设计1.3 资产定价模型策略进出场设计1.4 资产定价模型策略实现与分析2 案例:Fama三因子模型选股策略构建2.1 Fama三因子模型分析2.2 Fama三因子的构建方法2.3 Fama三因子选股策略思路分析2.4 Fama三因子选股策略实践编写2.5 Fama三因子选股策略绩效分析2.6 拓展:Fama五因子模型策略实现3 案例:实现基于支持向量机模型的多因子选股策略3.1 机器学习模型选股原理3.2 支持向量机模型Python实践3.3 选股策略的特征集和测试集构建3.4 支持向量机选股逻辑设计3.5 支持向量机选股策略实践编写3.6 支持向量机选股策略分析和改进思路泰迪云课堂操作演练/作业个人PC在线答疑微信群第十课 认证考试4月27日19:00-21:30工信部教育与考试中心高级大数据技术应用职业技术认证在线考试泰迪云课堂四、证书认证学员经在线培训并考试合格后,可以获得由工业和信息化部教育与考试中心颁发“高级大数据技术应用职业技术证书”,证书可登录国家工业和信息化部教育与考试中心官网查询。

专题四:深度学习实战一、课程介绍本次培训采用“云课堂线上精讲+专家技术在线答疑指导+学员群内实操答疑+助教指导”结合的方式,包含前置基础课程学习阶段和核心课程学习阶段。全程强调动手实操;内容以代码落地为主,以理论讲解为根,以公式推导为辅。讲解数据分析与挖掘、机器学习与深度学习、人工智能项目实训的模型理论和项目代码实践,梳理技术框架,从根本上解决如何使用模型、优化模型的问题,通过讲解企业级案例,真正的让各位老师可以了解到所学内容如何和实际结合,做到更好的进行教育教学工作。二、课程特色1、零基础快速入门,带领学员迅速掌握Python编程,了解机器学习基本概念及相关实现,使得学员能使用Python编写程序并实现深度学习常见任务。视频制作精良,讲师真人出镜,系统梳理深度学习的学习路线,全程强调动手实操,内容以代码落地为主,助力Python深度学习快速入门。2、核心课程内容讲师手把手一起进行实操演练,在具体应用场景中全面掌握相关技能,助力实训教学工作、实际动手的能力。内容以代码落地为主,以理论讲解为根,以公式推导为辅,通过讲解具体应用,全面解析专业必备技能,为相关课程开设和备课、应对科研和项目开发打下坚实基础。3、全面实践深度学习项目实现流程,包括数据处理、数据探索、深度学习模型构建等课程提供知识讲解,注重案例实战,提供在线解答疑难等优质服务,助力夯实理论基础,掌握核心技术,全面提升专业授课能力。

4、培训期间助教全程辅助教学,每天提供10小时的实时在线答疑辅导,并进行答疑文档汇总,更好地总结学习。5、无论是前置学习篇还是案例集训篇,相关代码、源数据、PPT、案例素材全部提供下载,即学即用,教学更轻松!视频内容支持六个月内免费回看,以便复习和参考。6、参加线上课程学习的学员,如后续本人参加线下课程继续深造,持线上缴费凭证可享受一次免费学习机会(仅限参加同一培训专题方向的线下课程)。

三、课程大纲基础篇 (报名成功后即可开始学习)时间课程内容学习平台正式培训前Python编程基础1准备工作2列表操作3程序流程控制语句4字符串操作4.1字符串及其索引&切片4.2字符串的常见方法4.3字典的创建及索引4.4字典常用操作4.5字典推导式5Python文件读取操作5.1Python读取文件5.2练习3:统计小说中的单词频次6函数6.1Python函数自定义6.2匿名函数6.3练习4:自定义求序列偶数个数的函数7面向对象与模块7.1Python方法与函数对比介绍7.2Python面向对象示例7.3Python模块使用7.4第三方库的安装与调用8注意事项8.1Python工作路径说明8.2模块命名及存放路径的注意事项8.3结语泰迪云课堂正式培训前Python数据分析与应用1 Python数据分析概述1.1认识数据分析1.2熟悉Python数据分析的工具1.3安装Python3的Anaconda发行版1.4掌握Jupyter Notebook常用功能2 NumPy数值计算基础2.1认识NumPy数组对象ndarray2.2认识NumPy矩阵与通用函数2.3利用NumPy进行统计分析3 Matplotlib数据可视化基础3.1了解绘图基础语法与常用参数3.2分析特征间的关系3.3分析特征内部数据分布与分散状况4 Pandas统计分析基础4.1读写不同数据源的数据4.2掌握DataFrame的常用操作4.3转换与处理时间序列数据泰迪云课堂Python机器学习实战1机器学习绪论1.1引言1.2基本术语1.3假设空间&归纳偏好2模型评估与选择2.1经验误差与过拟合2.2评估方法2.3性能度量2.4性能度量Python实现3回归分析(RegressionAnalysis)3.1线性回归基本形式3.2线性回归模型的Python实现3.3波士顿房价预测的Python实现3.4逻辑回归介绍3.5研究生入学录取预测的Python实现泰迪云课堂核心课程篇时间课程内容学习平台第一课 深度学习基础-人工神经网络4月19日18:30-22:001单个神经元介绍2经典网络结构介绍3神经网络工作流程演示4如何修正网络参数.梯度下降5网络工作原理推导6网络搭建准备7样本从输入层到隐层传输的Python实现8网络输出的Python实现9单样本网络训练的Python实现10全样本网络训练的Python实现11网络性能评价12调用Sklearn实现神经网络算法泰迪云课堂操作演练/作业个人PC在线答疑微信群第二课 深度学习框架-TensorFlow2实战4月20日18:30-22:001任务1:构建一个线性模型1.1tensorflow介绍1.2tensorflow2常用数据类型和操作1.3初始化模型1.4构建损失函数1.5模型训练及可视化1.6使用高阶API-Keras2任务2:MNIST手写数字识别2.1数据读取及探索2.2交叉熵2.3模型构建及训练2.4调用保存好的模型对新样本进行预测3 作业-鸢尾花分类泰迪云课堂操作演练/作业个人PC在线答疑微信群第三课 人工智能核心课-深度神经网络4月21日18:30-22:001深度神经网络介绍1.1深度神经网络-引言2卷积神经网络CNN2.1浅层神经网络的局限2.2卷积操作2.3卷积操作的优势2.4池化及全连接2.5高维输入及多filter卷积2.6实现卷积操作2.7实现池化操作3循环神经网络RNN3.1循环神经网络简介3.2循环神经网络的常见结构4长短时记忆网络LSTM4.1LSTM的三个门4.2LSTM三个门的计算示例4.3利用RNN&LSTM实现MNIST手写数字识别泰迪云课堂操作演练/作业个人PC在线答疑微信群4月22日18:30-22:005.1自然语言处理简介5.2开源中文NLP系统介绍5.3中文分词介绍5.4机械分词法5.5机器学习算法分词5.6NLP概率图介绍5.7jieba分词演示6.1文本的one-hot表达6.2文本的TF-IDF表达6.3TF-IDF权值策略实现6.4模型训练与预测泰迪云课堂操作演练/作业个人PC在线答疑微信群第四课 自然语言处理实战-路透社新闻分类4月23日18:30-22:001.项目背景与目标2.数据探索分析2.1读取新闻数据2.2了解数据的基本情况3.词嵌入(Word Embedding)3.1word embedding的基本概念3.2word2vec介绍3.3CBOW词向量训练过程4.构建模型4.1数据padding4.2网络结构中的Embedding层4.3构建RNN网络模型4.4模型训练及评估5.1词向量预训练5.2模型优化泰迪云课堂操作演练/作业个人PC在线答疑微信群第五课 自然语言处理实战-智能应答模型应用4月24日09:00-12:0014;00-17;0018:30-22:001.1 案例背景2.1 语料库介绍2.2 语料库预处理2.3 整理代码3.1 模型前准备工作说明3.2 数据准备3.3 模型结构说明3.4 基于注意力的Seq2Seq模型搭建3.5 前向传播实现3.6 反向传播:计算梯度并更新参数3.7模型批训练3.8 模型调用测试4.1 使用Flask进行模型测试与展示5.1 拓展思考泰迪云课堂操作演练/作业个人PC在线答疑微信群第六课 综合实战:搭建一个智能车牌识别系统4月25日09:00-12:0014;00-17;0018:30-22:001.1 案例背景1.2 项目流程介绍2.1 数据介绍2.2 图片数据批量加载3.1 物体检测概述3.2 车牌检测模型3.3 调用模型进行车牌检测并保存文件4.1 搭建车牌识别网络4.2 模型批训练并打印训练结果5.1 调用训练好的模型进行测试5.2 实时测试照片车牌6 小结与拓展思考泰迪云课堂操作演练/作业个人PC在线答疑微信群第七课 工信部认证考试4月26日19:00-21:00工信部教育与考试中心高级人工智能应用工程师职业技术认证在线考试泰迪云课堂部分实操结果展示:

四、证书认证学员经在线培训并考试合格后,可以获得由工业和信息化部教育与考试中心颁发“高级人工智能应用工程师职业技术证书”,证书可登录国家工业和信息化部教育与考试中心官网查询。

课程主讲师资介绍张敏,广东泰迪科技高级数据分析师、培训总监,从事用户数据分析和数据挖掘工作六年,具有丰富的大数据挖掘理论及实践培训经验,对数据具有较高的敏感度,根据数据对其进行全面的统计分析。精通Python、R语言、Matlab等多种数据挖掘工具。擅长市场发展情况监控、精确营销方面的数据挖掘工作。有为南方电网、珠江数码等大型企业长期提供实施服务的经验,主导了电子商务网站用户行为分析及网页智能推荐服务、中医证型关联规则挖掘、电信业务话单量预测、航空公司客户价值分析等多个项目。2017年“泰迪杯数据挖掘挑战赛教练员培训”主讲讲师,2018年广东省Python与深度学习技术师资培训班主讲讲师,2018年第一/三/五期全国高校大数据核心技术与应用师资研修班主讲讲师、2019年第一/二/三期全国高校大数据与人工智能师资研修班主讲讲师,2019年国家电网大数据竞赛河北、湖南省、甘肃省电力系统培训班主讲讲师,先后负责过西安理工大学、广东工业大学、广西师范学院、广西科技大学、闽江学院、广东石油化工学院、上海健康医学院等高校实训课程及德生科技等企业内训和数据挖掘就业班的课程。组织、参与编写图书《Python编程基础》、《Python数据分析与应用》、《R语言编程基础》等。蔡景波,点宽量化研究部主管。曾任私募的资管部主管,专注于期货策略,曾构建多套期货套利策略,带领团队将套利策略应用于外盘期货,实盘业绩稳健盈利。目前主要负责股票多因子以及数据挖掘方面等项目,目前已为十多家高校师生提供量化实践教育培训服务。第一届粤港澳金融数学建模竞赛专家组成员,点宽量化学院导师,主导量化新兵训练营、量化提升特训营、Python数据分析特训营等线上培训项目。张新福,点宽高级量化研究员。暨南大学金融专业硕士,擅长利用Python进行数据分析及机器学习;熟悉股票市场规律,擅长利用数据分析研究市场并构建较为优质的量化投资策略,同时具备较为扎实的财务基础,擅长构建深度学习模型对上市公司进行研究。曾就职于著名券商及期货公司,从事上市公司研究及相关数据挖掘。冯嘉尧,点宽高级量化研究员。英国国王学院金融数学硕士、英国雷丁大学数学统计本科一等学位。擅长运用统计学模型进行数据分析,如聚类分析,因子分析,结构性数据建模和广义线性分析等。具备C++金融数据建模,机器学习模型和金融统计学等知识,能很好地结合金融和数学知识进行金融市场分析。杨惠,广东泰迪科技高级数据分析师,具备丰富的培训经验,曾为多家企业、院校服务过专业培训工作。如PPV商业培训、泰迪大数据师资培训、珠海城职院数据分析培训; 2018年第一、三、五期全国高校大数据核心技术与应用师资研修班主讲讲师、2019年第一、三、五期全国高校大数据与人工智能师资研修班主讲讲师,2019年国家电网大数据竞赛河北省电力系统培训班主讲讲师。从事数据挖掘工作五年,擅长文本挖掘及深度神经网络RNN,熟悉常用机器学习算法原理及应用,如神经网络、SVM、决策树、贝叶斯等算法;精通R、Python、MATLAB等常用数据挖掘处理工具。具有丰富的实践项目经验。如“京东电商产品评论情感分析”项目;“珠江数码大数据营销推荐应用”项目;“电子商务网站智能推荐服务”项目。报名须知与联系方式报名需知专题时长开课日期费用(元)课程安排一网络爬虫与数据处理10天共80课时2021年4月9日-18日1980元二数据挖掘与机器学习实战10天共80课时2021年4月10日-19日1980元三金融数据分析实战10天共80课时2021年4月18日-27日2480元四深度学习实战8天共70课时2021年4月19日-26日2480元1. 费用:包含报名费、学习费、资料费、证书费等。2. 报名材料:报名申请表、身份证复印件、两寸近期正面免冠彩色半身证件照电子版(要求:背景:白色,格式:JPG,大小:14-20K)。3. 本次由广东泰迪智能科技股份有限公司收取费用并开具发票。4. 本期研修班两专题及以上联报者可享受九折优惠。联系方式联系电话:010-81359800联 系 人:高教帮邮 箱:gaojiaob@126.com
