随着大数据时代的到来,“数据分析“越来越火,大到企业决策,小到业务环节,都需要数据分析不断发挥着作用。很多人觉得,数据分析好像离自己遥不可及,操作难度很大,但其实数据分析渗透于生活的方方面面,近在咫尺。

在接触数据分析之前,我可以说是零基础,完全的超级菜鸟一枚,新手小白如何入门数据分析?希望这篇从我自身经历出发的文章可以给出初学者一定的启发。
数学基础
统计学部分概率论与数理统计大学教材《深入浅出数据分析》

在学习数学基础部分,这本书真的可以算是起到thought initiation的作用,适合任何没有基础的小白。它基础到甚至有人说,这本书简直太简单了。但恰恰数据分析就用到了这些最基础的知识。总结下来,归纳为以下几个方面:
数据分析基本步骤
具体方法
数据处理
编程语言
Excel和Python
Excel的学习
比如在求多组数据的平均数、标准差、计数等多个指标时,Excel中的数据透视表便是很好的分组工具,对于简单数据处理,比大多数编程工具要更为便捷。只需要将要求的数据拖到对应的行和列,就可以得到结果。
Python的学习
使用Anaconda进行安装
小甲鱼的零基础入门Python学习

课程学习
贪心AI的《商业数据分析》
长达十周九个主要经典实战项目小项目数据
贪心AI的商业数据分析课程,从数据分析的初步感知直到对数据分析师的面试指导,不只是简简单单地把握知识、领会要点,更重要的是有针对性地就业实践,真正做到从实际案例出发。下面我简要谈谈我在其中的收获。
1、数据分析基础概念
要想学好数据分析,首先要建立数据分析的基础体系。课程刚开始,没有过多过难的知识点,更多的是对数据分析知识初探与理解。
数据(data),即未经过处理的原始记录,以我的理解来看,就像是一个载体,将身边的事情数字化记录下来。
数据抓取——数据清洗——数据分析——业务决策
这样,不仅仅是停留在枯燥的知识点,也通过一些实际的案例来渗透介绍,提起了学习的兴趣,也让知识点更为具象化,便于理解。

2、不同类型的数据方法及原理
要真正准确掌握处理数据的方法,必须认真学习其背后的原理,才能在应用的时候不盲目。就像要运输一个沙发,如果用小轿车就装不下,超出负荷,而如果用货运车,就正合适。了解运输工具的容量才能节约经济成本,了解数据方法背后的原理才能提高工作效率。
描述性分析
在讲述知识点的时候,如果只是枯燥的概念,就很难掌握理解,但老师在每个概念中,会渗透着实例应用讲解,并搭配着主要图像,比如正态分布与长尾分布会列表格对比,边总结边记忆,这样,更有利于对知识点的掌握。

诊断性分析(关联分析)
比如,有成年人的身高和卡路里的摄入两组数据,那么就可以研究,卡路里是否对身高有所影响?如何影响的?简单来说就是找理由,类似于逆向工程,分析现实效果与潜在因素的联系。比起算法,更依靠于数据分析人员的素质,所以在学习过程中,要更为关注这方面的知识。

预测性分析
这里也可以称之为数据分析的重中之重,在讲解过程中,老师运用的课时更长,主要分为线性回归和逻辑回归两个方面,除了要求基本的概念理解掌握,还对代码及Excel的应用重点引领。也不需要重新构建网络环境,贪心AI有专门的平台可以依托,上课跟着老师一步步走,下来再练习几遍,基本就没有什么问题了。

3、课后思考答疑
一对一的课后答疑助教团队和课后思考题的实时解答
助教老师不仅十分耐心,而且还很有幽默感。在解答时,助教老师会先了解学生对问题有怎样的认识,对问题又做了怎样的思考,又在解决途中遇到了怎样的障碍,再顺着学生的思路,共同去探究解决。
缺少课后监控及错题统计部分

参考书籍
《超简单用Python让Excel飞起来》
这本书讲述的主要为Python编程环境的搭建和如何将Python和Excel联系起来,实现办公的高效化,更倾向于业务岗和业务技术融合岗。
这本书最大的特点就是图文并茂,有操作的具体演示图,所以学起来还算比较轻松。

实战项目锻炼
在了解数据分析的理论与工具后,还不足以应对工作中实际出现的问题。除了上述贪心AI课程所包含的实战项目外,建议大家还是更多找些真实的实战案例勤加练习。
Kaggle
在Kaggle上,还可以参考别人的代码,学习别人的分析逻辑与建模方法,从而提升自己。

科赛网Kesic和鲸科技
实战项目的更新速度很快,且定期也有比赛举行,可以找到很多的开源数据集,以供专业人员或者爱好者练习。

总结
从用户需求角度出发,将数据变现,让数据驱动决策,从而实现效益最大化,规避风险
“数学——编程——课程——实战”