Python是数据科学家的顺手兵器,Spark又被称为大数据分析的瑞士军刀,两者的结合让玩数据的人得心应手。本课程以业界最典型的两个商业分析案例为主线,为读者展现大数据与小数据的完美结合,为成为全栈数据工程师作准备。
Windows7、与Python3.5配套的Anaconda,Spark2.3
环境配置参考-https://mp.weixin.qq.com/s/Bt6qrE3sGUSCm_BaA33C6A
学前准备与参考书:
先修课程:“Python数据科学-技术详解与商业实践(八大案例,配套书籍) ” https://guojiang.club/course/280
参考书:《Python数据科学:技术详解与商业实践》、《Spark机器学习进阶实战》、《PySpark实战指南:利用Python和Spark构建数据密集型应用》
讲师简介:
常国珍,北京大学会计学博士,中国大数据产业生态联盟专家委员会委员。具有多年金融、电信及零售行业数据科学项目实施和咨询服务经验。专注于零售金融与泛零售领域的数据治理、市场与用户分析、信息安全和智能解决方案。著有《Python数据科学:技术详解与商业实践》等三本数据科学图书。
课程目录:
第一课:PySpark基础与信用评分卡案例(1月30日晚上8:00直播)
1.1Spark基本框架
1.2搭建windows单机版Python+spark环境
1.3违约模型的数据理解
1.4违约建模的业务理解
1.5构建数据的宽表和模型构建与评估
1、PC端如果发现浏览器无法观看课程,建议使用谷歌浏览器观看;
2、在这里学习的过程中,如果您有什么好的想法和建议,可以发送邮件到我们的邮箱:ke@guojiang.club
3、购买课程后,点(课时)列表即可观看视频
4、本课程虚拟商品,已经购买,不能退款。有试听章节的建议先试听章节的
5、购买课程后,推荐加入我们的微信群共同交流、学习