excel学习库

excel表格_excel函数公式大全_execl从入门到精通

《大数据分析入门》试题与答案四

一、单选题(每题2分,共60分)

1. 《数据分析报告》是决策者认识事物、了解问题、掌握信息和搜集相关信息的主要工具之一,该报告不包括( )选项。

A、分析结果 B、可行性建议 C、其他有价值信息 D、最终决策结果

2. 数据分析工具不包括以下( )选项。

A、SPSS Statistics

B、Matlab 2014b

C、OFFICE Powerpoint

D、Style Intelligence

3. 以下分析图表中,( )可以用于表示对比分析法的数据分析结果。

A、柱形图 B、折线图 C、散点图 D、条形图

4. 关于从移动平均改良,形成指数平滑法预测时间序列,以下说法中不正确的是( )。

A、预测值是以前观测值的加权和,且对不同的数据给予不同的权,新数据给较大的权,旧数据给较小的权。

B、离预测期较远的历史数据给予更大权重,权重由远到近按指数规律递减

C、根据时间序列情况,参照经验判断来大致确定额定的权重取值范围。

D、权重取值范围内,取几个权重参数进行试算,比较不同试算结果的预测标准误差,选取预测标准误差最小的预测结果。

5. 以下关于对大数据的相关分析说法中,不准确的是( )。

A、相关分析研究现象之间是否存在依存关系,并对具体含依存关系的现象研究其相关方向和密切程度。

B、相关分析法特点是,当X和Y显然有关系,却无法精确地由一个去决定另一个值的程度。

C、相关分析的主要结果是相关系数R(R2),相关性高低就看该系数是否接近1,越接近1则相关性越高,越接近0则相关关系越不明显。

D、通过相关分析,定然能够确定事物之间是否彼此关联。

6. 对大数据的随机抽样中,使用( )函数能够实现该功能。

A、And函数 B、Rand函数

C、HLOOKUP函数 D、VLOOKUP函数

7. PowerPivot,即数据描述性分析工具,简称PP,关于PP的描述中不正确的是( )。

A、在Excel中使用PP无需安装整个软件或学习数据库技术和SQL数据查询技术。

B、EXCEL用PP突破数据分析容量限制,使用 PP 加载项更快速地在桌面上分析大型数据集。

C、PP处理数百万行和几百行的性能相比大不相同,处理数据量和处理速度之间存在着明显的正比关系。

D、PP通过使用其内存中的引擎和高效压缩算法,能以极高的性能处理大型数据集。

8. 相关关系分析的相关程度不包括( )。

A、完全相关 B、不完全相关 C、函数相关 D、不相关

9. Excel自带的分析工具库能完成的数据统计分析中,不包括( )。

A、描述统计 B、相关系数 C、移动平均 D、自动预测

10. ( )能够展示单个数据变量的分布情况。

A、二维饼图 B、直方图型柱形图 C、雷达图 D、散点图

11. 24小时内血压动态监测仪获得的血压监测数据属于以下数据分析类的()数据。

A、纵向比较 B、横向比较 C、分类比较 D、动态分析

12. 一所大学过去70年的所有高等数学考试成绩分析中,描述统计参数中的偏度skewness为-0.78,则证明这组数据属于( )。

A、中等偏态分布 B、高度偏态分布 C、负偏态分布 D、正态分布

13. 数据分析中存在两个或两个以上的自变量,且数据分布曲线呈现线性关系,则称之为( )。

A、一元线性回归分析 B、多元线性回归分析

C、一元回归分析 D、多重回归分析

14. 中国过去十年的GDP数据系列的对比分析属于()分析法。

A、纵向比较 B、横向比较 C、分类比较 D、动态分析

15. 以下有关PowerPivot的说法中,不正确的是( )。

A、PowerPivot整合多数据源:能从Web服务、文本文件、关系型数据库等任何数据源导入数据;

B、PowerPivot处理海量数据:支持大数据性能卓越,几百万行数据集就如处理几百行一样出色

C、PowerPivot操作简洁, 熟悉Excel就能用PP

D、PP实现任意平台、任意系统的无边界信息共享,并不局限于PP for SharePoint共享和发布上网,还能兼容任何数据库平台的任何共享操作。

16. 公务员考试成绩分布的直方图分析中,正偏态分布意味着( )。

A、成绩过于集中 B、成绩过于分散 C、多数人成绩过低 D、多数人成绩过高

17. 以下选项中,不属于《数据分析报告》的是( )种类。

A、专题分析报告 B、综合分析报告 C、日常数据通报 D、空难调查报告

18. 数据可视化为数据分析者提供一条清晰有效地表达与沟通信息的渠道,以下选项中,( )不属于数据可视化的特征。

A、数据用图像、二维图形、三维图形和动画等方式呈现,并可对其模式和相互关系进行可视化分析,提高图表可视性。

B、海量大数据的多角度分析,得出大量分析结果,能够根据需求定时自动变换展示对象。

C、用户能方便地通过交互界面实现数据管理、计算和预测,提高交互性。

D、可从数据的多个属性或变量对数据进行切片、钻取、旋转等,以此剖析数据,从而能多角度、多方面分析数据,保障分析数据的多维性。

19. 以下关于时间序列预测的移动平均方法的说法中,不正确的是( )。

A、移动平均法是一种时间序列预测方法,根据时间序列逐期推移,依次计算包含一定间隔期数的平均值,形成平均值时间序列来反映事物发展趋势,从趋势的延续预测未来数据值。

B、移动平均法求的是最近几个月平均数,能更好地适应预测临近数据受偶然性因素干扰而产生的随机变动影响。因此它更适合短期预测,而非长期预测。

C、移动平均法的间隔期数数量没有限制,预测值不会产生明显的滞后偏差。

D、移动平均法的间隔期数过大时,预测值将带有明显的滞后偏差。

20. 随机抽样数据使用的随机抽样函数是( )。

A、RAND() B、AND()

C、ABSTRACT() D、WITHDRAW()

21. 大型生产型企业的生产大数据挖掘中,使用( )能找出哪些制造零件和设备的设置与故障事件有关。

A、关联分析 B、描述性分析 C、抽样调查 D、回归分析

22. 在数据分布的描述分析上,偏度和峰度决定了数据分布是否遵循正态分布分析中,数值测度的( )。

A、分布形状 B、相关系数 C、集中趋势 D、有效性

23. 大数据分析结果的表现形式中,直观描述3个变量的分布情况应该选择( )。

A、散点图 B、气泡图 C、柱形图 D、曲面图

24. 以下关于描述分析中方差的说法中,不正确的是( )。

A、概率论中,“方差”度量随机变量和其数学期望(即平均值)间的偏离程度,衡量源数据和平均值相差多少。

B、方差是反映该偏离的数字特征,方差越大则偏离程度越大。

C、方差是反映该偏离的数字特征,方差越小则偏离程度越大。

D、经过X,Y两次测量,X测量结果偏离程度稍大与Y,则Y的测量性能更好。

25. 在数据分布的描述分析上,方差和标准差度决定了数据分布是否遵循正态分布分析中,数值测度的( )。

A、分布形状 B、离散程度 C、集中趋势 D、有效性

26. 指数平滑法中选择加权的阻尼系数需要根据一定经验做范围选择,因此,面对时间数据序列曲线波动较平稳,应选择阻尼系数区间( )更合适。

A、[0.05~0.2] B、[0.3~0.5]

C、[0.6~0.8] D、[0.8~0.95]

27. 数据分析直方图客观地展示公务员选拔考试成绩数据分布情况,因此如果数据分布比起正态分布略微偏向右侧(成绩高的一侧),峰度略低,那么体现在直方图上的效果证明( )分析结论。

A、试题可能存在泄露

B、考题偏容易

C、试题没有能够拉开考生水平层次,无助于选拔人才

D、试题难易适中,学生成绩真实有效

28. 某新产品的推广费用和销售额的相关系数=0.8413,则该商品的广告和销售的关系属于( )。

A、不相关 B、强正相关 C、弱正相关 D、强负相关

29. 指数平滑法中选择加权的平滑系数需要根据一定经验,做出范围选择,因此,当面对的时间数据序列曲线波动较小时,应选择平滑系数区间为( )更合适。

A、[0.05~0.2] B、[0.3~0.5]

C、[0.6~0.8] D、[0.8~0.95]

30. 大数据分析结果的表现形式中,表现所选2个变量之间相关关系,应选择( )。

A、柱形图 B、饼图 C、散点图 D、气泡图

二、是非题(每题0.5分,共10分)

1. 数据收集是数据准备的第一个阶段,包括一手数据、二手数据的收集。

2. 动态分析是指围绕一条时间线上数据,围绕其发展速度、增长率、资金价值和变动幅度等现象进行的分析。

3. 大数据分析中,若两个数据变量彼此数量变化相互独立,完全无关,则可以认为其关系为不相关。

4. 疾病预测、房产预测、票房预测、就业预测、金融预测等以相关大数据为基础,通过大数据分析能够获得有价值、较为准确的预测结论。

5. 大数据时间序列预测中,移动平均法的期数少能反映变化趋势,但预测值滞后偏差明显。

6.

大数据的数据集来源可能包括:传感器、气候信息、公开信息(如杂志,报纸,文章)、购买交易记录、网络日志、病历、军事监控、视频和图像档案及大型电子商务,通常是万亿或EB的大小,庞大而复杂,需要专门设计的硬件和软件工具进行处理。

7. 三维曲面图在连续曲面上跨两维显示数值的趋势,图中的颜色并代表数值间的差别。

8. 回归分析研究的是随机变量,不分自变量、因变量;相关分析却正相反,建模前首先选择自变量、因变量。

9. 相关分析主要描述两变量之间线性关系的紧密程度;而回归分析不仅揭示变量X对因变量Y的影响大小,还由回归模型进行预测。

10. 对大数据做相关分析时,相关系数r大小可以反映相关程度,r=0表示变量间存在函数相关关系。

11. 现象之间存在的依存关系,对于某一变量的每一个数值,都有另一变量值与之对应,该关系能用一个数学表达式精确反映出来,这种关系称为相关关系。

12. Excel数据分析的结果,显示成条形图则方面横向对比同一种数据的值系列,该条形图不可以轻易、自由地转换图表类型为柱形图。

13. 曲面图是对所选变量之间相关关系的一种直观描述。

14. 回归分析就是要挖掘出函数关系的数学模型,可以根据回归模型的规律预测未来变化。

15. 多个因素影响数据分析结果变量,涉及自变量数量较多,则多自变量的回归分析称多元回归。

16. 大数据经过清洗是否可以进行数据分析,需要统计脏点出现的概率,如果超过10%的数据都是脏点就失去分析价值了,过高的错误率使得分析结果有可能出现不可原谅的错误。

17. 回归分析有自变量X和因变量Y之分,其中自变量X是随机变量,因变量Y是普通变量。

18. 数据预测性分析通过分析现有数据间的相关性,探寻数据间存在的联系,并进一步通过建立相关回归模型的方式对未来进行合理的预测,因此,预测性分析属于展望未来的数据分析方式。

19. 一组数据的描述统计结果中,众数代表排序后居于所有数据的数值最中间位置的数值,它不能充分利用已知信息,但衡量时不受异常值影响,适合作为平均值的辅助参数之一,开共同衡量数据分布的集中趋势。

20. 数据中重复、错误、空白和遗失等问题需要在初期统一处理,使用自动化的方法进行数据准备不仅效率高,而且自动检索的处理保证的进入分析阶段的数据质量比较高。

三、问答题(每题10分,共30分)

1. 《数据分析报告》结论和建议部分编写的注意事项是什么?

2. 纸质调查问卷数字化:多选题“2、目前的工作压力主要来源于?(多选,但不超过3项)( ) A、工作量太大 B、工作精细化程度很高 C、工作内容或职责变换太快 D、与其他同事或领导沟通不畅 E、工作效果难以控制 F、工作内容单一枯燥 G、工作环境和条件较差 H、其它”如何设计大量调查问卷的答案形成一个标准的结构化数据存储记录成数字化成电子记录?

3. 请说明 相关分析 和 回归分析 的相同点和不同点都有什么?

购买专栏解锁剩余0%

发表评论:

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。

«    2024年12月    »
1
2345678
9101112131415
16171819202122
23242526272829
3031
控制面板
您好,欢迎到访网站!
  查看权限
网站分类
搜索
最新留言
    文章归档
      友情链接