
任何一门学科都有不同的分支与方向,依照不同的分支与方向往下、往深钻研下去都是一辈子的事情,数据分析也不例外,它本身是一门非常系统化且综合的学科,按照不同的方向深挖下去都是一项长久的事业。学习没有尽头,这是毫无疑问的,但学习有边界,不能一直学习而不去实践,也就是不去工作。我们学习数据分析的目的就是为了工作,那么数据分析学到什么程度能够找到工作呢?
以下内容按照统计学、分析工具、算法模型、业务四大部分展开叙述。
统计学知识
统计学是数据分析、机器学习的基础知识,是必须要学习的。掌握统计学的知识,明白学习统计学的意义,具备统计学的思维,对于学习数据分析大有帮助。
描述性统计
(1)均值(数学期望)
(2)中位数
(3)众数
(4)方差(标准差)
(5)极大值、极小值
(6)数据分布
A、正态/伯努利/二项/均匀/指数/泊松
B、偏度与峰度
(7)缺失值
(8)异常值
假设检验
(1)原假设/备择假设
(2)T检验
(3)卡方检验(非参数检验)
(4)P值
(5)置信度
(6)置信区间
(7)AB实验
概率论
(1)条件概率(贝叶斯原理)
(2)抽样
(3)大数定律
(4)中心极限定理
(5)区间估计/参数估计
(6)R2
(7)方差分析
分析工具
“工欲善其事,必先利其器”,好的数据分析工具,可以使得数据分析事倍功半,处理数据更加容易。同时,熟练掌握数据分析工具也是入门数据分析的首选。
SQL
(1)表的增删改查
(2)表连接
(3)子查询
(4)窗口函数
(5)SQL语句执行顺序
Python
(1)基本数据结构:列表/字典/字符串/元组/数组/集合
(2)基本语句:if条件语句/for循环/while循环
(3基本package:numpy/pandas/sklearn/statsmodel/matplotilb/seaborn
Tableau
(1)图标类型(使用场景)
(2)交互式面板
(3)基础的计算函数
Excel
(1)基本计算函数
(2)数据透视表
(3)VLOOKUP

算法模型
简单来说,数据模型就是一类问题的解决算法。而数学原理及公式除算法岗位外,只需了解,学习也行,但不需要花费大量时间纠结。
有监督学习
回归
A、线性回归
B、逻辑回归
C、Lasso/Ridge回归
(2)分类
A、决策树
B、随机森林
C、SVM
无监督学习
A、聚类
3、时间序列模型
业务
分析方法
漏斗分析、拆解分析、对比分析、留存分析、用户分群分析、归因分析、渠道路径分析
每一个分析方法的详细解读可看这篇文章:
https://zhuanlan.zhihu.com/p/532858247
指标体系
指标体系的详细解读可看这篇文章:
https://zhuanlan.zhihu.com/p/538824687
精练
推荐打印出来,张贴在自己每天抬头就能看见的地方,每天问问自己:
今天,这些内容我掌握了吗?
到你能用肯定的语气对这个回答说yes的时候,你就能找到心仪的工作了。