机器学习和数据挖掘课程
标收益
课程中的理论和经验来自于对初级数据挖掘工程经常遇问题的归纳、分析与总结,有针对性的给出解决方法,课程将重现这些问题的经典案例,通过实例讲解,并对应到学员的实际工作问题,使学员能够把传授的经验和自己的问题结合起来,有效的启发思路、激发兴趣、提供解决问题需要的新思路新方法。
学员的收获总结起来有3点:
1:了解实际的事例结合说基本算法的各种变体,开阔思路
2:将一次培训深化为深入了解一个细分领域的一个渠道,之后可以接收到培训内容中知识点对应的业界新更新。
3:加入“数据挖掘”职业圈,学员可以有一个加入职业社交圈的机会,和业内人士相互交流,相互切磋。
培训对象
1:有一定的程序和数学基础,希望对于数据挖掘有个知识体系的梳理,同时深入了解在实际生产过程中数据挖掘的各种算法的应用的,希望从初级走向中级的,数据增值产业的从业者。尤其是想做数据挖掘但是效果不显著,希望在公司内部得到更多重视的团队,派出两三人参加这个课程,效果尤佳。
2:对于数据挖掘,商业智能感兴趣,希望从事类似的工作,但是又感到所谓“大数据”知识体系繁杂,无论是广度还是深度都很难开始的“迷茫”人士。
学员基础
学员学习本课程应具备下列基础知识:
1) 知道统计学的一些基本概念:平均分布,正态分布,方差,置信区间;
2) 知道数据结构的一些基本概念:时间,空间复杂度;
3) 知道计算机体系结构的一些基本概念:GPU,芯片,寄存器,内存寻址,总线传输,内网通信
课程大纲
主题 内容
广义线性分类的原理和应用
内容:logistic Regression和计算广告学 n1.二分类问题的例子n2.逻辑回归的数学原理n3.传统广告,计算广告,广告实时交易平台n4.数据预处理和维度提取n5.LR在计算广告中的应用n6.LR的效果测评,模型调优n7.LR模型中理论与工程的折中n8.LR和他的小伙伴们:广义线性模型n9.新情况,基于移动端的广告实时交易平台,LR的各种变体
决策树,聚类和异常点检测
内容:决策树和异常点检测n1.决策树的原理n2.各种决策树的生成算法n3.决策树在异常点检测中的应用n4.决策树的剪枝n5.其它异常点检测的应用小技巧n6.聚类算法的原理n7.聚类算法的常见问题:初始点选择,n8.聚类算法和决策树在异常点检测中的应用n9.结合计算广告,谈两个异常点检测小例子
巨型图挖掘
1.复杂网络介绍n2.当前巨型图应用场景n3.随机图,自然图,n4.常用的图计算框架(google的bagel,graphlab的graphx)n5.巨型图上的算法实现原理n6.常用的基于图的算法实现n7.随机游走,pageRank基于图的实现n8.svd介绍以及svd在图框架的实现n9.图挖掘与推荐系统(qzone的广告系统广点通,twitter的内容推荐)
·