模块 | 内容 | |
第一单元 | 概率论与 数理统计基础 |
数据分析方法概述:数据分析过程、数据分析的商业驱动 概率论基础:集合、概率、随机变量、概率密度、公理化 变换和期望:随机变量函数分布、矩、矩列唯一性 常见分布族:离散分布、连续分布、指数分布、中心极限定理、概率不等式 多维随机变量:联合分布与边缘分布、多层模型与混合分布、二维变化、协方差与相关系数 随机样本的性质:抽样、样本分布 数据简化原理:似然函数、辅助函数 参数估计:点估计、区间估计、矩估计、贝叶斯估计、EM 算法 假设检验:似然比检验、贝叶斯检验、最大功效检验、置信区间、P 值、损失函数 渐进评价:相合性、有效性、标准误差、稳健性、LTR 的渐进分布、近似极大似然区间 方差分析和回归分析:ANOVA 假设、简单线性回归与最小二乘 回归模型:变量有误差时的线性回归、Logistic 回归、稳健回归 |
第二单元 | PYTHON 基础 |
基础知识:安装配置、基础语法等 数据可视化:数据可视化包介绍及图像绘制 数据整理和数据清洗:Numpy 数组基础;Pandas 对象基础 |
第三单元 | 机器学习算法 | scikit-learn 入门:Scikit-Learn 库简介 KNN-最近邻分类算法:原理、实现、示例讲解 决策树算法:原理、实现、示例讲解 随机森林算法:原理、实现、示例讲解 K-Means 聚类算法:原理、实现、示例讲解 关联规则算法:原理、实现、示例讲解 线性回归:原理、实现、示例讲解 逻辑回归:原理、实现、示例讲解 SVM 支持向量机:原理、实现、示例讲解 朴素贝叶斯算法:原理、实现、示例讲解 |
第四单元 | 客户生命周期案例 | 结合客户生命周期案例,讲解精准营销、银行反欺诈、信用评分等内容。 |