第四期课程对比前三期课程我们做了如下的优化:
1. 增加一节新课:关于numpy在数据分析和机器学习中的应用
2. 讲解map与lambda函数
3. 优化机器学习课程内容,手把手教你推导数学公式
4. 修改第十节课程,增加实践操作环节
购买后请各位同学一定要在「阅读原文」里进行登记上课!!!
参加第四期课程的同学可以免费参加第五期!
还可以免费获取第三期教学视频~
在校大学生或者毕业工作未满一年的同学可以分期付款,分期付款方式:联系淘宝或者微店客服,上传身份证件与学生证件即可
PYTHON数据分析课程
简介
数据分析目前是整个行业当中最紧缺也最炙手可热的的职位。各行各业,包括互联网,咨询,医疗,金融,通信甚至是房地产建筑,设计等这些传统公司都对数据分析师有着大量的需求。
市面上讲解python的课程很多,但大部分都是讲解基础语法或者程序设计与开发,很少有系统讲解python数据分析课程的。我们的课程设计围绕着实用主义这个概念出发,讲解真实工作中经常会用到的数据分析技巧与方法。
?
如果你在工作或学习中还只能依靠EXCEL这样原始的工具来处理数据,那么你就需要仔细的考虑是是否需要自我提升,学习真正的数据分析技能了。我们的课程就是为了让你掌握工作或者学习中最常用的数据分析技能,让你告别EXCEL的繁琐操作。
讲师小明毕业于英国南安普顿大学理学硕士学位,目前就职业国内某互联网公司担任高级数据分析师。此前根据自己的经历撰写过《我的数据分析之路》《零基础学习数据分析》等文章,引起很多同学的共鸣。
通过本课程的学习,同学们可以熟练掌握PYTHON在工作中的数据分析技能,灵活运用常用的数据分析数学知识去解决工作中遇到的问题。同时,最后三节课的建模课程会让大家学会如何用高级模型去完成一个项目,告别『表哥表姐』的身份,成为一名合格的数据分析师。
介绍
本课程将由小明同学(卡牌大师)进行线上现场授课。
-
上课形式:QQ群视频,现场写代码。我们也会录制视频,课后会将课件,代码,视频发给大家再次学习。
-
上课时间:
?
-
课程时长:总共11节课程两次作业,两周讲完
-
参加第四期的同学还可以免费参加第五期,加强学习,直到学会为止
听课学员要求
-
了解基础的PYTHON语法
-
请务必下载anaconda并且能够正确使用
?
价格
原价750元,如果你是SOTON会员,那么可以享受8折优惠
?
前言
前言部分我们会主要讲解以下知识点:
-
什么是数据分析,为什么要学习数据分析
-
如何高效学习数据分析
-
目前发展的情况
Chapter1:?常用数据结构与数据操作
第一节课主要介绍最基础的PYTHON数据结构以及简单的数据IO技术。
-
掌握字典,元祖,列表等常用结构
-
掌握dataframe和series两种重要的数据结构
-
学会如何从外部正确导入数据
-
掌握常用的数据探索技术,比如特征类型,数据大小查询等
-
变量重新命名,分类值频率,重复数据筛选等
Chapter2:最核心的技能:索引选取
第二节课主要讲解pandas最核心的索引选取数据。需要深入理解并且掌握以下几个函数:
-
Loc
-
Iloc
-
Ix
-
Query
-
?Isin?
-
Map 与 lambda
同时,需要灵活运用以上6个函数进行数据的过滤筛选等
Chapter3:索性进阶:多重索引
本章节重点学习pandas的核心与难点:多重索引。这一节课建立在第二节课的基础之上,是对之前的课程进行的深入
Chapter4:分组计算---数据分析最常用技能
本章节重点学习groupby的分组操作,通过学习能够掌握类似于excel透视表和切片一样的知识。
-
数据的分裂:splitting
-
数据的aggregation
-
分组数据遍历
-
transformation
-
filteration
-
其它有用的技能
Chapter5:多表组合---SQL操作
本节课学习多表操作,类似于我们重用的SQL语句。通过本章节学习,能够掌握以下内容
-
SQL常用语法的理解
-
Left join,inner join,rightjoin 等常用技术
-
理解Merge和join这两个最主要的函数
-
解决最常遇到的一些问题
Chapter6:数据透视表与可视化
这一课我们主要讲解数据透视表以及数据可视化,会涉及到以下几个知识
-
数据透视表
-
Pandas绘图
-
Matplotlib绘图
-
更优美的绘图工具:seaborn
HomeWork1
第六节课结束后会有一次作业,同学们需要根据作业要求完成对应的数据操作,包括条件筛选和可视化等。数据会在发到大家的邮箱,请大家务必按时完成。
作业完成后修改文件名为你在QQ群中的姓名,然后上传到群文件中!
Chapter7:机器学习概论
这一节主要讲解的知识是机器学习的常用概念,包括
-
监督与非监督学习
-
模型的优化目标
-
模型评估与模型选择
-
正则化与交叉验证
-
模型泛华能力
Chapter8:机器学习常用算法学习(一)
本节主要讲解数据处理与特征工程:
-
NA的处理
-
分类变量的处理
-
数据标准化
-
数据转换
-
L1技术选择变量
Chapter 9:机器学习常用算法学习(二)
-
1.????代价函数
-
2.????机器学习核心算法:梯度下降
-
3.????极大似然估计算法
-
4.????Logisticregression 算法
-
5.????SVM算法
-
6.????Sklearn中实现
Chapter10:模型评估与选择
本课讲解建模后的工作,包括以下几个内容
-
如何评价模型(分类和连续)
-
如何选择参数
-
sklearn中实现上述理论知识
-
课程总结
Chapter 11 : numpy与机器学习的结合(第四期新增)
本章节为第四期新增内容,着重讲解numpy在机器学习中的数组表示方法,能够掌握并且运用numpy进行数值与统计分析
HomeWork2
第二次作业会是一个小小的project。同学们需要根据要求自己独立的完成数据的抽取,转换,处理以及建模等工作。最后按照准确率进行排名,前3名同学将会获得赠书!
报名购买地址:
淘宝:https://item.taobao.com/item.htm?id=530555437751
微店: ??http://weidian.com/item.html?itemID=1835478507
或者长按下图二维码识别进行微信支付
最后,购买完请一定要记得点击左下角「阅读原文」进行表格登记哦~