项目背景
为提升市政务信息化建设水平,依据《广东省“数字政府”建设总体规划(2018-2020)》(粤府〔2018〕105号)、《广东省政务数据治理专项规划(2019-2020年)》(粤办函〔2019〕295号)、《市“数字政府”建设总体规划(2020-2022年)》(湛府〔2020〕71号)等文件精神,市持续开展数据治理工作,实现了数据资源的初步汇聚,协助市直部门统一申请和对接使用省政务大数据中心数据资源服务接口。按照“全省一盘棋”的思路,市将依托省政务大数据分析应用平台的数据分析能力,结合本地政务数据库,开发适用于本地的算法模型,促进数据资源的深度开发利用,提升全市各领域大数据分析应用水平。

2021-2023年市大数据分析平台建设部署
项目目标
为贯彻落实广东省数字政府改革建设工作的部署要求,进一步加强大数据对市发展的支持力度,市将以业务和问题为导向,通过部署大数据中心分析平台,支撑市的数据融合分析应用,满足政府机构、企事业单位的大数据决策专题应用的需求,缩小市政务信息化建设和应用水平与珠三角的差距。
服务期限
本项目中标方需在合同签订之日起3个月内完成软件开发,平台正式上线部署后提供三年运维运营服务。
总体建设
建设原则要求
(1)规范性原则
系统设计开发遵循国家标准、工信部有关软件行业的通用规范、通用的国际规范及各系统间接口标准,保障基础信息数据库及应用系统之间能够根据业务需要实现有效的互连。
(2)开放性原则
系统设计的各种接口在遵循规范性原则的基础上,保证其可以集成不同设备厂商、系统或平台供应商、软件供应商的产品;保证系统的设备管理、系统扩容和业务维护不依赖于单一设备厂商、系统或软件供应商的产品。
(3)先进性与成熟性相结合原则
系统设计采用先进成熟的技术和手段,以保障系统具有高效、全面和稳定等良好品质。系统采用先进成熟的总体构架,数据采集、整合、应用服务等采用目前主流J2EE、中间件等技术。
(4)实用性原则
系统设计要切实保证实用性,能够解决项目的实际需求。
(5)可扩展性原则
系统设计应充分保证系统容量、处理能力和业务范围具有良好的扩展能力;具有适应业务变化的能力,对于系统用户数量及业务量的增长、规则或代码的变化、业务单据的变更、业务流程重组等,应保证业务变化对系统运行不造成影响。
(6)可靠性原则
保证系统具有较高的可靠性和完善的错误处理机制和自动失效转移,保证系统能够提供7x24小时不间断访问服务。
(7)易用性原则
系统设计需要保证系统软件容易使用,一方面是方便各类服务对象,另一方面是方便系统管理员和业务管理员。功能界面风格和操作流程一致,突出用户的中心地位,保证用户使用习惯。
(8)可维护性原则
采用面向服务的架构设计,以及结合动态流程建模,增强系统的可配置能力。
(9)可移植性原则
保障系统能跨不同平台进行移植。
(10)可管理性原则
保证系统应该具有完善的管理机制,保证所选产品应具有良好的可管理性和可维护性。
(11)可管理性原则
保证系统在运行过程中管理的各种信息的安全,保证系统与其它相关系统信息交换过程的安全;保证系统应用服务的安全。对系统的操作需严格按照操作权限进行,并对每项操作留下完整的日志记录备查。
技术路线要求
技术路线
(1)UML统一建模语言
UML(Unified Modeling Language)是非专利的第三代建模和规约语言。UML是一种开放的方法,用于说明、可视化、构建和编写一个正在开发的、面向对象的、软件密集系统的制品的开放方法。
UML最适于数据建模,业务建模,对象建模,组件建模。UML作为一种模型语言,它使开发人员专注于建立产品的模型和结构,而不是选用什么程序语言和算法实现。当模型建立之后,模型可以被UML工具转化成指定的程序语言代码。
本项目在需求分析与系统设计阶段,使用开发人员可识别的建模与规约语言,明晰地向开发人员描述系统模型。
(2)组件技术
组件是具有某种特定功能的软件模块,以其较高的可重用性产生了一种崭新的软件设计思路。通过开发不同的可重复使用的组件、接口和构件,实现分布式应用程序的快速开发,应用模块间相对独立,接口清晰,内部的业务流程升级和改造与其他模块无关。
组件技术是迄今为止最优秀也是发展最快的一种软件重用技术,它比较彻底地解决了软件开发中存在的重用性、适应性差和周期长等问题。
(3)XML技术
XML(eXtensible Markup Language— 扩展标识语言)是一种非常适于应用程序之间数据交换的格式,特别是松藕合的应用程序,如分布式Web系统。作为一种通信协议,HTTP具有跨平台性。对于应用程序数据来说,XML具有同等的功效。XML可以促进应用程序代码的重用,提高应用程序在面对需求和程序变化时的适应能力。
XML是一种界定文本数据的简便而标准的方法,与注重数据及其表达方式的HTMIL不同,XML只关心数据本身。XML的优势在于其数据可以被用户定义的、有语义的标记环绕,可在数据库中实现无损的存储、检索和修改等操作。只需简单地添加标记就可以描述它们所封装的信息,XML的这种数据描述机制使得它成为一种在Internet上共享信息的强大途径,因为它是开放的,XML能够在不同的用户和程序之间交换数据,而不论其平台如何。无需事先协调,就可以在程序之间共享数据。同时通过DOM API(文档对象模型API)可以轻松地编制读写XML的程序,在Web系统应用程序中可以灵活使用XML。
在数据交换领域中,如果没有标准的交换技术和方法,相同的数据分析处理模块在很多应用中都要重复开发,而完成的工作可能只是将某一数据源的数据转换到不同的目标数据库中。由于没有中间标准,各系统的开发人员几乎没有可能将代码重用,昂贵的数据交换代价使得数据源只能散乱孤立地存在,形成一个个数据“孤岛”。在XML出现之前,在绝大多数应用领域里都是如此。可以看出,数据交换的核心问题是信息的标准化,主要解决信息的可理解问题,重点是机器对信息的识别,并能对数据进行自动处理。
(4)Web Services技术
政务信息资源共享平台特性决定了应用接口众多,采用Web Service技术降低应用接口的复杂性。
XML Web services既可以在内部由单个应用程序使用,也可通过公开以供任意数量的应用程序使用。由于可以通过标准接口访问,因此XML Web services使异构系统能够作为单个计算网络协同运行。
XML Web services的核心特征之一是服务的实现与使用之间的高度抽象化。通过将基于 XML 的消息处理作为创建和访问服务的机制,XML Web services客户端和XML Web services提供程序之间除输入、输出和位置之外无需互相了解其他信息。采用Web服务技术实现政务信息资源共享平台与业务系统之间的数据交换和应用整合,使政务信息资源共享平台具有灵活性和可扩展性。
(5)SOA体系架构
面向服务的体系结构(Service-Oriented Architecture,SOA)是一个组件模型,它将应用程序的不同功能单元(称为服务)通过这些服务之间定义良好的接口联系起来。接口是独立于实现服务的硬件平台、操作系统和编程语言的。
这种具有中立的接口定义(没有强制绑定到特定的实现上)的特征称为服务之间的松耦合。对松耦合的系统的需要来源于业务应用程序需要根据业务的需要变得更加灵活,以适应不断变化的环境,比如经常改变的政策、业务级别、业务重点、合作伙伴关系、行业地位以及其他与业务有关的因素,这些因素甚至会影响业务的性质。
面向服务的体系结构是面向对象的模型的替代模型,面向对象的模型是紧耦合的。虽然基于SOA的系统并不排除使用面向对象的设计来构建单个服务,但是其整体设计却是面向服务的。由于它考虑到了系统内的对象,所以虽然SOA是基于对象的,但是作为一个整体,它却不是面向对象的。不同之处在于接口本身。
SOA系统原型的一个典型例子是通用对象请求代理体系结构(Common Object Request Broker Architecture,CORBA)。现在的SOA已经有所不同了,因为它依赖于一些更新的进展,这些进展是以可扩展标记语言(eXtensible Markup Language,XML)为基础的。通过使用基于XML的语言(称为 Web 服务描述语言(Web Services Definition Language,WSDL))来描述接口,服务已经转到更动态且更灵活的接口系统中。
(6)B/S多层架构
系统基于B/S架构设计,在开发平台上采用标准语言进行开发,实现软件的标准化。采用MVC模式,通过三层软件架构体系来实现高内聚,低耦合,提高系统的健壮性和可维护性。
在具体实现上,系统采用三层体系结构,即表现层、业务逻辑层、持久层。采用分层的设计模式,开发人员可以只关注整个结构中的其中某一层;可以很容易的用新的实现来替换原有层次的实现;可以降低层与层之间的依赖;有利于标准化;利于各层逻辑的复用。概括来说,分层式设计可以达到如下目的:分散关注、松散耦合、逻辑复用、标准定义。
(7)大型关系数据库技术
本共享平台核心部分采用大型关系数据库。
大型关系数据库是以高级结构化查询语言(SQL)为基础,采用安全管理机制,支持共享SQL和多线程服务器体系结构,提供了基于角色(ROLE)分工的安全保密管理,支持大量多媒体数据,提供接口工具,支持分布式管理方式,适用于多种应用的高效、可靠、安全的数据管理,包括大负荷的联机事务处理系统及以查询为主的数据仓库应用系统。
大型关系数据库具有高安全性、可扩展性、高性能、高可靠性、可移植性等特色功能。
高安全性主要体现在基于角色与权限的管理方法来实现基本安全功能,并根据安全管理机制,将审计和数据库管理分别处理,同时增加了强制访问控制的功能,另外,还实现了包括通讯加密、存储加密以及资源限制等辅助安全功能。
可扩展性主要体现在支持多操作系统、支持64位运算、支持多服务器集群等。大型关系数据库支持目前市场上各种流行的64位操作系统和处理器,能够充分支持64位内存寻址能力和TB级的海量数据管理,可以为企业提供高性能的数据管理解决方案。
高性能主要体现在采用封锁机制来解决并发问题,系统提供了多种锁:表锁、行锁和键范围锁,在缺省情况下为行级锁。封锁的实施有自动和手动两种,即隐式上锁和显式上锁。隐式封锁根据事务的隔离级有所不同,由数据库自动执行。同时,提供给用户多种手动上锁语句,用以适应用户定义的应用系统,进一步提高系统的并发性和性能。
高可靠性主要体现在备份与恢复的功能,大型关系数据库可以同时管理多个数据库,物理备份与还原都是以数据库为单位,即备份时需要指定数据库,还原时也只能根据备份的信息还原对应的数据库。支持完全备份/恢复、增量备份/恢复,同时提供了在线和离线进行备份和恢复的功能。
可移植性主要体现在支持各种接口的标准和跨平台的功能实现。各种接口的标准包括SQL92、ODBC、JDBC、OLEDB、PHP等国际标准,大型关系数据库支持VC、VB、PowerBuilder、C++Builder、JBuilder、Delphi、Eclipse等各种流行的数据库应用开发工具,能够方便地将基于标准接口的其他数据库应用移植到数据库上。同时,提供了专门的数据迁移工具,支持将达梦、Oracle、DB2、Sql Server、Sybase、Mysql、PostgreSQL、文本文件、Excel文件、XML文件等数据源中的数据的迁移。
大型关系数据库能实现不同操作系统(WINDOWS/LINUX/UNIX等)、硬件(X64/X86/SPARC/POWER/TITAM)平台的支持,各种平台上的数据存储结构完全一致。与此同时,各平台的消息通信结构也完全保持一致,使得数据库的各种组件均可以跨不同的软、硬件平台与数据库服务器进行交互。
大型关系数据库支持特色功能包括:全文检索、多字符集支持、物理数据页大小可选、代理服务与作业调度、多媒体和空间信息支持。
(8)HTTPS技术
HTTPS(全称:Hyper Text Transfer Protocol over Secure Socket Layer),是以安全为目标的HTTP通道,简单讲是HTTP的安全版。即HTTP下加入SSL层,HTTPS的安全基础是SSL,因此加密的详细内容就需要SSL。 HTTPS存在不同于HTTP的默认端口及一个加密/身份验证层(在HTTP与TCP之间)。这个系统提供了身份验证与加密通讯方法。现在它被广泛用于万维网上安全敏感的通讯,例如交易支付方面。传统的HTTP模式,存在着大量的灰色中间环节,相关信息很容易被窃取,但HTTPS却是通过认证用户与服务器,将数据准确地发送到客户机与服务器,并采用加密方式以防数据中途被盗取,大大降低了第三方窃取信息、篡改冒充身份的风险。
对基于互联网的公众服务网站,本项目要求使用HTTPS技术。
(9)Hadoop分布式存储系统
Hadoop分布式文件系统HDFS,是一个高度容错性的系统,适合部署在廉价的X86服务器上,提供高可靠、高扩展、高吞吐能力的海量文件数据存储,非常适合大规模数据集上的应用。
错误检测和快速、自动的恢复是HDFS最核心的架构目标。同时,HDFS的架构支持数据均衡策略。如果某个Datanode节点上的空闲空间低于特定的临界点,按照均衡策略系统就会自动地将数据从这个Datanode移动到其他空闲的Datanode。
(10)YARN技术
Apache Hadoop YARN(Yet Another Resource Negotiator,另一种资源协调者)是一种新的Hadoop资源管理器,它是一个通用资源管理系统和调度平台,可为上层应用提供统一的资源管理和调度,它的引入为集群在利用率、资源统一管理和数据共享等方面带来了巨大好处。
可以把yarn理解为相当于一个分布式的操作系统平台,而mapreduce等运算程序则相当于运行于操作系统之上的应用程序,Yarn为这些程序提供运算所需的资源(内存、cpu)。
(11)Spark大数据计算引擎技术
Spark允许将中间输出和结果存储在内存中,节省了大量的磁盘IO。同时Spark自身的DAG执行引擎也支持数据在内存中的计算。Spark现在支持Java、Scala、Python和R等语言编写应用程序,大大降低了使用者的门槛。自带了80多个高等级操作符,允许在Scala,Python,R的shell中进行交互式查询。
与MapReduce只能处理离线数据相比,Spark还支持实时的流计算。Spark依赖Spark Streaming对数据进行实时的处理,其流式处理能力还要强于Storm。
Spark自身实现了Standalone部署模式,此模式下的Master可以有多个,解决了单点故障问题。此模式完全可以使用其他集群管理器替换,比如YARN、Mesos、EC2等。
(12)Hive数据仓库技术
Hive是一种底层封装了Hadoop的数据仓库处理工具,本质是将SQL语句通过解释器转换为MapReduce作业提交到Hadoop集群上进行计算,将结构化的数据映射为一张数据库表,并提供HQL(Hive SQL)查询功能,不用编写具体的MapReduce方法。所有Hive的数据都存储在Hadoop兼容的文件系统(如HDFS)中。Hive在加载数据过程中不会对数据进行任何的修改,只是将数据移动到HDFS中Hive设定的目录下。
Hive不提供实时的查询和基于行级的数据更新操作,不适用于低延迟的应用,最佳使用场景是大数据的批量处理作业。
(13)基于ETL技术的多源异构空间数据的集成
ETL是数据抽取(Extract)、转换(Transform)、装载(Load)的过程。是构建数据仓库的重要一环,用户从数据源抽取出所需的数据,经过数据清洗,最终按照预先定义好的数据仓库模型,将数据加载到数据仓库中去。具体地说,ETL包括三个主要的环节,一是数据抽取,将数据从不同的操作平台或者数据库等那些最初的业务系统中读取出来,是所有工作的前提;二是数据转换,是对抽取得到的数据,在预先定义好的转换规则下,进行转换的过程,包括字段的合并与拆分、排序、赋缺省值以及数据的聚合等操作;三是数据装载,负责将转换完成的数据装载到数据仓库中。
(14)大数据展示技术
针对海量数据的可视化,构建数据预处理模型采用内存计算、图简化技术和数据分块压缩技术降低图像呈现时的数据量,并结合配色方案,根据数据情况设定颜色渲染规则,对预处理后的数据构建数据立方体存储,减少每次数据准备和处理的时间,并提高渲染效率。
针对海量数据的统计汇总展示,扩展统计图表种类。运用成熟的可视化控件和可视化技术,根据电力行业业务特点和分析展示需要,在传统可视化图表基础上扩展热力图、力导向图、弦图、统计地图、时间序列播放图、实时图等新图形。
针对海量的明细级麻点数据,构建基于地理位置的可视化方式引入GIS服务,以空间数据为背景,以明细级业务数据为热点进行渲染。
针对大数据的形式多样性特点,扩展可视化方式。
(15)国产化
进入21世纪以来,信息技术已逐渐成为推动国民经济发展和促进全社会生产效率提升的强大动力,信息产业作为关系到国民经济和社会发展全局的基础性、战略性、先导性产业受到了越来越多国家和地区的重视。中国政府自上世纪90年代中期以来就高度重视软件行业的发展,相继出台一系列鼓励、支持软件行业发展的政策法规,从制度层面提供了保障行业蓬勃发展的良好环境。
近年来窃听丑闻、数据泄露等事件频出不穷,让人们意识到数据信息安全的重要性。美国对我国高新技术产业发展的限制,更是让推动信息化产品国产化成为必然的结果。推进信息技术产品国产化进程,已然成为维持国家发展、提供民生保障的重大课题。
为了保障数据安全、核心可控,在满足性能需求的情况下,优先采用具有自主知识产权的国产信息技术产品。
(16)IPv6支持
积极配合省、市有关部门组织的IPv6改造计划,本项目平台将支持IPv6,同时健全和完善IPv6环境下网络安全相关管理和技术要求,开展针对IPv6的网络安全等级保护、风险评估和通报预警等工作。
总体架构要求
系统的总体架构如下图所示:

系统总体架构图
网络架构要求
市大数据分析平台依托政务云平台部署,相关安全设备及虚拟机资源均为云平台统一提供,无须在本项目购置。
市大数据分析平台网络部署拓扑示意图如下:

大数据分析平台网络架构图
应用架构要求
用户通过省统一身份认证平台认证后,登录市大数据分析平台,进入分析平台门户,用户可以在大数据分析平台查看自己订阅的大数据分析成果和模型,能够进入分析平台的专题场景应用,进行各行业领域的大数据分析应用。大数据分析平台的应用架构图如下所示:

大数据分析平台应用架构图
服务内容
软件开发服务
门户
提供基于用户类型和权限的大数据分析平台门户管理,当一个用户生成的时候,可被赋予不同的用户类型,并设置一套默认的平台访问门户。同一个用户可能同时会包含多个用户类型,一个用户的用户类型决定了他能访问和使用哪些平台功能和数据信息。门户需要包含个人中心、分析平台任务和成果展示三大部分内容。
个人中心
用户登录
提供用户登录渠道,用户登录后系统自动关联用户类型和权限信息,匹配该类型和权限下展示的门户信息,并可以访问该用户的个人中心信息。
个人发布
在个人发布功能中,用户可以查阅个人已发布的成果信息,包括成果发布详情、成果进度信息、发布状态信息等。
个人订阅
在个人订阅中,用户可以查阅个人订阅成果的详情。包括已订阅成果清单、历史订阅清单、相似模型/成果清单等,并可将已订阅的成果内容设置在门户首页展示,用户可以通过登录个人中心随时查看所关注的最新数据。
可通过个人订阅的资产生成自己的个性化首页展示。
个人任务单
用户可查看自己发起的和待审批的工单。
个人消息
在个人消息的栏目中,用户可以对收到的个人消息进行管理。
分析平台任务
任务是作为资产超市数据交易的补充,如果客户在资产超市找不到自己想要的专题、分析模型等,客户可以在资产超市发起新增申请,填写新增自定义的需求,会自动生成任务单流入后台管理,待运营方审核。
任务详情
根据用户类型和权限,提供单个分析任务详情查看。用户可以查看自己发布的分析任务详情,包括分析任务运行情况、关联数据情况、分析结果等,管理员可以查看所有用户开展的分析任务详情。
任务总览
根据用户类型和权限,用户可以查看分析任务总览,包括任务开始时间、任务完成情况、任务总量等。
任务池
任务池是为了对客户提出的新增任务进行统一管理而设计,客户在超市新增任务后,就会进入运营后台的审批环节,在任务管理中心审批通过的任务就会流入任务池,提供给运营方的数据分析师领取。
成果展示
展示方式
用户可以对个人成果展示方式进行设置,包括设置成果展示图形、数据类型、数据颗粒度等内容。用户可以编辑成果查阅权限,设置查阅者能够查看的内容范围。
查看成果
用户可以查阅个人发布的成果详细内容,包括数据、图表等信息和组合专题,订阅者可以查看该成果发布者设置的访问内容。成果查询渠道分成大屏、PC端、移动端。
展示风格选择
用户可改变展示风格,例如黑夜、简洁风格,以适用多展示场景。
展示端选择
用户可以一键切换成果展示模式,可支持PC端、大屏端或移动端展示,用户可针对不同展示端预设展示内容。
大数据中心分析工作台
模型仓库
模型发布
模型发布是指对模型上架下架进行统一管理,建立审核机制,保证高质量的模型发布使用。
模型统计
模型统计是指对模型运行和使用情况进行统计分析,便于管理人员了解模型情况。
模型应用
模型应用是指将训练后的模型应用到业务应用生产支撑场景中。应具备泛化应用的能力:支持将训练好的模型,用于到新的数据中。新数据经过模型处理能自动返回结果,其结果可解决和指导相应的实际问题。
模型分类
用户可以通过模型分类功能,对模型进行分类,以便进行检索使用。
模型搜索
用户可以通过模型搜索功能,对模型仓库内的模型进行搜索,以便快速查找到所需的模型。
成果管理
成果管理模块用于管理大数据分析平台的成果,可以对已发布的统计图、报表、模型等内容进行可视化管理。
成果发布
用户可利用成果发布功能,从成果清单中选择需要发布的成果内容,通过个性化编辑后,将成果发布。
成果检索
检索提供包括名称、编码、部门名称、类型、启用/禁用、上架/下架、业务类型多个条件的综合检索。便于用户快速定位资产。
成果资产配置
管理员可以通过成果资产配置功能,实现成果资产的分类管理。
成果订阅
用户可以通过成果订阅功能,实现成果的订阅和共享。
资产跟踪
用于跟踪资产由谁申请、谁可见,对资产的来源和去向统一进行跟踪。
资产分类
将资产进行应急、经济、环保、金融等业务类型的分类,便于资产管理。
成果撤回
用户可以通过成果撤回功能,实现已发布成果或已共享成果的撤回,形成成果发布闭环。
大数据中心分析后台
模型能力
模型能力应具备基础框架功能,可满足后期多厂家模型导入需求。市大数据分析平台的模型能力建设将遵循国际数据挖掘行业标准(CRISP-DM),提供对应功能和工作流程设计,保障模型能力实施落地。模型能力建设流程如下图:

模型能力建设流程图
指标建模
在对业务需求进行分析后,将对业务具有分析价值的指标进行数据模型构建,应具备构造数据、合并数据和统计处理数据的运算能力。
模型训练
模型训练是指从大量的、有噪声的、不完全的、模糊和随机的数据中,提取出隐含的、不可预知的、具有潜在利用价值的信息和知识的过程。模型训练包括准备数据、探索数据、训练模型、评估模型和训练任务管理等功能。
模型部署
在模型完成指标建模、模型训练等步骤后,需要对功能达到要求的模型进行部署调试,部署后的模型为可被调用的服务能力,可为其它业务系统、模型提供数据分析能力。
模型管理
模型管理是对自身构建模型和第三方构建模型进行全生命周期管理。
专业语料库
语料收集
语料库是指按照一定的语言学原则,运用随机抽样方法,收集自然出现的连续的语言运用文本或话语片断而建成的具有一定容量的大型电子文本库。
语料库构建
根据历史事项的服务内容按照一定规则建立基础库及专业库。根据系统专业背景、使用场景以及历史投诉数据,建立并不断丰富专业语料库。本平台要建设的语料库包括归属地语料库、事项类型语料库、部门语料库和回退事件语料库。
BI能力
BI能力将复杂的数据分析能力引入到日常业务决策流程中,通过图形化分析和算法,提供自助式数据探索与可视化分析服务,让业务用户、管理人员、领导者能够从数据中更便捷地提取有用的信息,解决业务问题。
报表设计
报表工具需提供图形化的报表设计功能。要求通过这个设计器,无论技术人员还是业务人员都可以经过简单的培训后高效地定义报表。
报表管理
需支持多样化的数据源接入方式,包括应用服务器JNDI连接方式以及JDBC C3P0连接方式,需支持的数据源包括:关系型数据库:Oracle 、DB2、SQLServer、Sybase、MySQL、Informix以及国产数据库等;文件数据源:Csv、Excel、XML;内建数据源:报表中用户自建的数据集;其他数据源:JavaBean、API数据源,自定义数据源、信创要求的其它数据源。
需支持多种方式的导入导出,需支持Excel、Word、PDF、HTML、CSV、TXT等格式的导出,如果还有其他格式需求,可以通过扩展指定的接口,二次开发来实现、支持配置为多线程方式并发执行。
自主分析
自主分析可基于用户需求进行个性化BI分析,通过提供的数据清单,可以通过勾选的方式选择数据并进行自主编排;可基于图形化分析模块,根据用户个性化需求定制数据报表。
多维分析
1、 可视化多维分析
提供全面的数据分析功能,基于WEB的报表引擎服务,提供了完整的报表分析、仪表舱分析。
2、 智能报表
智能报表的页面布局和操作都与微软Excel非常相似,作为一个通用的报表工具,智能报表提供了一个图形化,易学易用的报表设计器。通过这个设计器,无论是技术人员还是业务人员都可以高效地定义、生产智能报表。
3、 数据处理引擎
数据处理引擎用于规整和处理数据,比如不一致的数据转换、数据粒度的转换,以及一些商务规则的计算。
图形化分析
图形化分析包含多种数据展示方式,为自主分析和多维分析提供。
同时,图形化组件需支持折线图、柱状图、饼图、点位图、热力图、3D热力图、区块颜色图、期望线图等图形配置模块,并将生成的分析图存放于对应的图库中。
普通平面大屏展示
包含传统的饼、柱、线图,同时也提供可选的可视化展现方式以组成大屏。
2.5D及以上高级大屏展示
平台提供2.5D大屏展示和3D视频渲染高级动效大屏功能。
配置管理
数据共享配置:配置数据共享是系统间的互联互通的主要要求之一,使不同业务系统的配置信息能被其他系统所获取和理解。
个性化配置:针对不同的用户级别进行页面的个性配置展示。
AI能力
在经济运行、营商环境、政务服务等主题,以及水利、应急、环保、自然资源等行业构建智慧应用时,如需要基于AI能力构建本主题、行业特色的专题库,提高政务业务的智能化能力,开展城市智能管理、智能决策支持等,可按需引入AI服务能力。大数据分析平台的AI服务能力包含OCR文字识别和AI能力管理两部分内容。
OCR文字识别
大数据分析平台需部署OCR文字识别服务,通过OCR文字识别服务融合深度学习、多种图像处理技术,将OCR技术广泛应用于纸质文档单据电子化、身份认证自动化等场景。
1、 通用类OCR应用
(1)通用文字识别。
支持通过通用文字识别API服务,识别印刷体文档中的文字信息。应用层可以调用此API,并结合一些后处理方式来自动提取关键信息并录入系统,可减少人工录入成本,提高业务效率。
(2)通用表格识别。
支持通过通用表格识别API服务,提取各类表格类型图像中的表格空间信息与文字信息,提升企业内部各类办公表格数据的电子化录入。
(3)网络图片识别。
支持通过网络图片识别API服务自动识别网络图片内的文字及其对应位置信息,如快递单等,并能根据识别出来的结果进行联系人信息的提取,可供进一步的数据挖掘后处理操作。
2、 卡证类OCR
(1)身份证识别。
支持自动识别身份证上的全部信息,支持身份证正反面识别,一次扫描即可识别身份证号码、姓名、地址等全部信息,在暗光、倾斜、过曝光、阴影等异常条件下均可准确识别身份证信息。
(2)驾驶证识别。
支持自动识别驾驶证正页与副页上的全部信息,自动提取出姓名、性别、领证日期、准驾车型、有效期限、档案编号等结构化信息,在暗光、倾斜、过曝光、防伪标志干扰、阴影等异常条件下均可准确识别驾驶证信息。
(3)行驶证识别。
支持自动识别行驶证正页与副页上的全部信息,自动提取出号牌号码、车辆类型、所有人、使用性质、品牌型号、车辆识别代号、发动机号码、注册日期、档案编码、核定载人数、总质量、整备质量、核定载质量、外廓尺寸、准牵引总质量、备注、检验记录、条码号等结构化信息,在暗光、倾斜、过曝光、防伪标志干扰、阴影等异常条件下均可准确识别行驶证信息。
(4)营业执照识别。
支持识别营业执照中的公司名称、注册号、法人代表、地址、注册资本、营业期限、经营范围等字段。在暗光,倾斜、水印等异常条件下均可正常识别执照信息。
(5)护照识别。
针对中国护照,可识别护照上的全部信息;针对其他国家护照,可根据两行国际标准化的机读码识别出6-7个关键字段信息,包括姓名、性别、出生日期、护照号码、签发国国家码、护照有效期等。在暗光、倾斜、过曝光、阴影等异常条件下均可准确识别护照信息。
(6)银行卡识别。
支持自动识别银行卡正面的信息,识别信息包括卡片类型(借记卡或信用卡)、银行卡卡号、有效日期、发卡行、持卡人姓名(限信用卡)。
AI能力管理
AI能力托管系统旨在为业务应用提供灵活的、可伸缩的能力服务托管框架,为用户提供能力注册、部署、卸载、控制和监控一站式管理服务,解决AI能力管理困难的问题。需要具备管理、能力管理、配置管理、日志管理、事件管理、监控管理能力
对接管理
作业管理
作业管理对系统的训练作业、模型预测作业、指标模型作业调度等进行统一管理,支持增、删、改、查、运行、停止、查看结果、查看日志、下载日志等操作管理。
作业配置
作业配置对作业相关的参数进行配置。
作业运行
作业运行是指根据业务模型调度执行需求,提供模型运行的启动功能,应支持立即启动、定时启动和周期性启动三种运行方式。
作业日志
作业日志是指业务模型作业运行时的信息记录。
作业监控
作业监控是指查看作业运行状态和作业运行结果。
编排管理
编排管理,以BI为支撑,用于集中编排专题报表。可支持拖拉组件进行自由的编排,最终发布为成果。
数据配置
平台支持连接多种通用数据模型,如关系型数据库(MySql、Oracle、SQL Server等)、文本数据源(Excel、CSV等)、大数据分析引擎(Kylin、Impala、Hive)、基于OData协议的扩展接口等。提供直观的可视化界面,简单填写配置参数即可快速连接数据源。
支持扩展实时数据接入,包括数据库定时执行SQL的准实时数据提取、定时通过调用第三方接口获取准实时数据、通过接口实时接收第三方接口实时发送的数据。
模板配置
可视化展现系统内置了多种模板,用户可以基于模板直接创作,省去了颜色配置等细节操作,可以快速完成制作。
模型配置
提供强大的数据集建模能力:支持在数据源的基础上创建和编辑数据集,形成数据集模型。支持可视化快速创建数据集,用户可拖拽数据源中多个数据表搭建数据关联关系,数据表间通过连接线清晰展现数据关联关系。如果两个表之间存在相同的字段名称,会自动建立关联关系。
专题配置
专题配置用于配置生成各种专题,例如防疫买药、应急防火、互联网+专题。
既可以从模板中引用生成,形成统一规范的专题;还可以自定义拖拉拽相关控件生成。
支持图表联动:可以点击图表的数据区域后,其他图表会根据点击的数据区域变换。
算法配置
提供统计、分析相关算法,可复用地支持分析。如sum、average等。
数据采集
数据采集实现多类型数据采集,如目录、指标、原始表、模型、算法等,支持多种灵活的任务调度方式,实现自动采集,多任务采集,保证数据采集的时效性,从而提高后续数据应用的时效性。
数据交换
数据交换是指将数据分析所需的数据从数据中心资源目录、外部数据源或者本地数据文件接入到大数据中心分析平台中,对数据资源进行导入、查询、导出等操作管理。
数据自主查询
自主查询有数据查询和组合功能。基于从数据中心资源目录、外部数据源或者本地数据文件接入到大数据中心分析平台中的数据信息,对数据信息进行查询和展示。
数据导出
查询所得数据可以通过导出功能获得文本格式的结果数据。
API接口服务
大数据分析平台能够对接数据资源管理平台提供的API接口进行数据获取,以便进行后续数据分析。
数据集市
展示所有集聚的指标集。
库表接入
库表接入指直接对接数据库表,进行数据访问。
文件接入
支持文件接入管理,包括本地上传文件数据、文件接入数据的数据预览、接入文件的查看和删除。
统计分析
实现接入数据信息统计分析,包括本月新增数据资源数量,部门数据资源数量、基础库资源数量、主题库资源数量。
元数据管理
元数据采集
元数据管理系统提供了丰富的内置适配器,来保证自动化采集。能够适应异构环境,支持从传统关系型数据库和大数据平台中采集从数据产生系统到数据加工处理系统到数据应用报表系统的全量元数据,包括过程中的数据实体(系统、库、表、字段的描述)以及数据实体加工处理过程中的逻辑,也可通过自动化的方式完成元数据采集,比如用户维护好数据源连接信息后,可以根据数据源的更新频率,设定元数据同步周期,元数据管理会根据数据源的连接信息、同步周期以及开始时间,定时自动解析、获取、并更新元数据信息,保证平台元数据信息的及时有效。
血缘分析
血缘分析是对指定元数据的起源及其推移位置的分析。它反应数据的来源与加工过程,还描述了数据在不同过程中发生的情况。它可以帮助分析信息的使用方式并追踪用于特定用途的关键信息位。
影响分析
影响分析帮助用户迅速了解分析对象的下游数据信息,快速掌握元数据变更可能造成的影响,形成影响分析报告,以便更有效的评估变化该元数据带来的风险,从而帮助用户高效准确的对数据资产进行清理、维护与使用。
全链分析
全链分析是用来分析指定元数据前后与其有关系的所有元数据,不仅反应了元数据的来源与加工过程,也反应了元数据的使用情况,使用全链分析可清晰的了解该元数据的来龙去脉。
主数据管理
主数据管理对需要共享的数据建立统一视图和集中管理,为各业务系统数据调用提供黄金数据。
数据标准
数据标准概述
数据标准实现了政务部门对数据统一理解的定义规范。数据标准通过对业务属性、技术属性、管理属性的规范化,可统一政务部门在业务过程中的业务术语定义、报表口径规范、数据交互标准;同时标准还可作为数据质量控制的准则、数据模型设计以及信息系统设计的参考依据。
在实践过程中,数据标准可分为基础类数据标准以及指标类数据标准。基础数据标准是针对业务开展过程中直接产生的数据制定的标准化规范;指标数据标准是针对为满足内部分析管理需要以及外部监管需求对基础类数据加工产生的数据制定的标准化规范。
数据标准监控
多维度指标分析标准,了解标准总数、生效数、失效数等。
数据标准管理
平台内置标准的技术、业务、管理、质量属性,结合灵活的定义方式,从手工创建、导入、拾取、智能识别等,可帮助客户快速构建基础标准、指标标准、代码标准,同时内置的一批国标、行标,可大大提高项目交付效率。平台支持标准增、删、改、查、发布、审核等各种基础操作,其变更过程能被自动记录,通过变更版本控制,追踪标准历史。另外平台还提供了灵活细致的用户权限管理机制,满足不同用户管理各自的标准的场景。
数据质量管理
质量管理模块用于数据质量检查,可创建数据质量检查规则,并定义数据表与规则匹配关系调度任务,可在实例列表中查看任务执行情况,并可对规则中WHERE语句变量进行定义。其中数据质量管理包括数据质量定义、数据质量实例、数据质量规则、变量管理四部分功能。
数据质量定义
数据质量定义用于创建任务,通过将数据表中字段与质检规则关联,设置任务信息,实现任务定义。
数据质量实例
数据质量实例为数据质量定义中定义的任务,每次触发的任务,可查看任务进度,查看任务运行结果、日志等。
数据质量规则
支持数据质量规则制定,展示指标数据来源,创建的规则类型归属于不同的规则属性,根据列表统计后展示数值。
变量管理
用于管理任务定义时规则中筛选条件中用到的变量。
资产管理
数据资产服务对所有资产进行统一管理,实现资产盘点,可以帮助我们更好的支撑各种数据的应用,丰富服务接口拓展,支撑数据资产的多渠道应用,如数据共享、决策支持等,最终实现数据资产价值最大化。
管理中心
管理中心提供整个平台的用户、权限、认证、消息、日志支持。
租户管理
租户管理是指利用同一套大数据分析平台支撑不同委办局租户的使用。多租户功能将大数据分析平台的资源隔离成一个个资源集合,彼此隔离。租户通过“租用”需要的资源集合,来运行分析建模应用和作业,并存放数据。
租户开通
利用同一套大数据分析平台支撑不同委办局租户的使用。
租户授权
通过授权租户使用不同的资源。
用户管理
组织管理
组织管理包括对组织架构和组织下属成员管理。各组织的系统管理员可以对本组织的架构进行更新修改,可以对组织详情信息进行编辑。同时,系统将各个组织的成员管理权限委派给本组织的系统管理员,系统管理员可以对组织内的成员信息进行管理。
成员管理
用户(成员)是组织的最基本的组成元素。成员管理包括成员的人事信息管理和账号信息管理,在本系统中统称为成员管理。成员的人事信息有成员的真实姓名、编号、所属单位、行政级别等信息,成员的账号信息有成员的登ID、登录口令、上次登录时间等信息。
跟组织机构管理一样,系统将各个组织的成员管理权限委派给本组织的系统管理员,即由各单位管理员负责自己所在组织单元的人员变更情况。例如,系统管理员可以授权地系统管理员管理其组织单元下的人员添加、删除、修改操作,而不能操作其它组织单元。
角色管理
对系统的角色权限进行管理,如新增、修改、删除、权限配置等操作,并与权限管理模块打通。
角色管理提供了一个角色列表,可以根据不同用户或者组织赋予不同的角色,也可以为一个用户赋予多个角色,每一个角色都赋予相应级别的权限。角色管理采用授权机制,高级别的角色可以授权给其他人来执行某些权限。系统管理员可以根据业务需求通过角色管理模块添加、删除角色,以及更新角色的权限设置。
权限管理
平台的权限管理需具备对模板的控制、对成果展示的控制、对权限管理平台的控制的功能。
菜单权限管理
通过菜单权限管理功能,管理员可以对用户菜单访问权限进行管理。
功能点权限管理
通过功能点权限管理功能,支持功能点权限设置。
分行政区域数据权限
根据不同层级控制数据权限,实现不同行政区域的数据权限管理服务。
认证登录对接
大数据分析平台需要对接广东省统一身份认证平台,实现用户的认证、登录,并支持单点登录。
对接省统一身份认证平台
大数据分析平台通过但不限于网关和OAuth2.0接入的方式对接统一身份认证平台。统一身份认证平台对外提供两种接入模式,网关模式和OAuth2.0模式。网关模式主要由准入网关作为中间件实现与统一身份认证中心的对接;OAuth2.0模式由业务系统经API网关对接统一身份认证中心,通过OAuth2.0协议进行访问。
单点登录
平台通过省统一身份认证平台登录后,支持单点登录,即实现一点登录、多点漫游的目标,方便用户使用。
系统可以作为所有内部应用系统的统一入口,需要提供单点登录支持,避免用户在进入各应用系统的时候还需要另外输入账号密码,不仅麻烦而且很容易因为密码过多造成混乱。
消息管理
提供系统级别的消息管理模块,支持整个系统和关联渠道的消息通知。
消息触发条件配置
通过消息触发条件配置功能,可以实现消息通过平台、粤政易、短信等渠道发送给用户。
消息模板配置
通过消息模板配置功能,用户可以自定义消息发送模板。
日志管理
日志管理模块用于对系统产生的日志信息集中管理,具体包括日志查询和日志导出功能。
日志查询
用于统一查看系统日志,便于操作审计。
日志导出
提供对日志查询结果的日志导出功能。
日志记录
针对系统用户的登录、页面操作等行为以及系统接口状态变化进行记录。
全流程日志信息
平台自动记录用户请求、应用接入全流程日志信息,并以独立的内部文件存储和输出。
操作日志信息
记载用户日常操作系统功能日志信息,并以独立的内部文件存储和输出。
接口同步成功信息
独立分页记载接口调用成功的日志信息,并标识状态信息,以独立的内部文件存储和输出。
日志操作审计
系统管理员对各类日志文件进行取用时,系统对应记录调用日志文件的时间、日志文件名、取用人员账号、取用原因等信息,具有权限的人员可以查看日志调取记录。
运维运营服务
运维服务
自项目正式上线起,提供3年免费运维服务。运维服务包括日常维护、例行巡检、响应支持服务、重要时刻保障、应急保障、版本同步、运行维护报告、共享交换平台运维服务等。
运营服务
数据融合服务
服务目标
依托具备丰富的数据治理、数据建模经验的运营服务团队和大数据分析平台,实现多源数据资源的融合治理,推进数据信息的处理、建模、服务封装的工作部署,提升大数据分析平台数据质量,保证分析平台的正常、高效运作。
需要组建数据融合服务运营团队,负责分析平台的数据融合服务的运营工作。人员具体要求为:
1、具备数据治理工作运营运维经验或实施经验;
2、熟悉电子政务方面的业务及流程,良好的书面和口头表达能力,良好的沟通能力;敬业、责任心强、严谨踏实、工作仔细认真;
3、在平台运营服务期间,建设方有权要求承建方替换不称职、不配合、能力不达标的运营服务人员。
数据处理服务
数据处理服务包括数据的采集和处理、数据抽取、数据治理等服务内容。
数据处理服务运营小组将依托政务大数据中心的大数据中心分析平台及其他大数据中心系统的数据资源管理相关工具,完成从各类数据源到大数据中心分析平台专题库的开发实施工作,具体如下:
1、数据整合思路。
通过梳理各部门数据之间的关联关系,对数据进行深度关联整合、比对分析,从逻辑上打通各个业务数据表。对具有共性的可关联业务数据进行抽象,通过对明细数据的整理和比对,支撑业务应用。
2、数据整合要求。
(1)数据整合后产生的衍生数据和指标,需有明确的业务口径和技术口径定义;
(2)数据整合对后产生的衍生汇总数据和指标,需有明确数据权责;
(3)提供相对稳定的整合汇总数据,尽量避免业务变更而重新设计数据模型;
(4)数据整合时,同一层次结构的数据分类颗粒度要一致,划分逐渐深入。同一层次结构的数据分类,要充分考虑到可扩展性。
3、数据整合服务流程。
数据整合比对是根据业务的需求进行自下而上进行的数据开发过程,整个生命周期包括数据流程设计、模型设计、建表、抽取加载、开发、测试、初始化、配置与发布整个过程。数据整合比对是闭环的过程,是一个反复迭代、不断更新完善的过程。具体工作内容如下:
(1)确定数据整合加工的数据范围、整合粒度和更新频度等,形成需求分析报告;
(2)根据需求分析报告进行梳理,归纳提炼共性内容,搭建面向业务应用的数据整合层逻辑模型的基本框架,确定特定业务域的数据标准、数据实体、实体间关系及数据加工规则;
(3)依照数据模型设计,制定数据整合方案,设定数据映射规则、衍生指标计算规则等,建立字段的映射关系。
数据建模服务
数据建模服务运营小组将结合实际需求,利用政务大数据中心海量数据资源及接入的外部大数据资源,通过构建数据模型,实现信息深度挖掘加工和智能化处理,助力提升地市的业务应用能力,应包括模型建立、测试验证、模型输出及应用等。
数据封装服务
数据封装服务运营小组将建立的数据模型以数据服务接口的方式进行共享,应包括数据服务开发配置、数据服务挂接、数据服务接口内部测试、数据服务接口文档编写、测试样例提供、数据服务接口维护、质量持续监控与问题诊断等。
大数据专题服务
通过熟悉市政务服务业务流程,结合市政务服务需求及各行业信息化建设需求,依托建成的大数据分析平台和具备丰富数据建模经验的运营服务团队,探索构建具有市本地特色的大数据专题服务,切实通过大数据能力建设提升市政务服务能力和行业治理水平。
需要组建大数据专题服务运营团队,且派驻运营服务人员不少于4名,其中至少一人拥有高级资格,负责分析平台的大数据专题服务的运营工作。人员具体要求为:
1、具备大数据专题应用的开发或运营服务经验;
专题建设步骤
按照每年至少完成2个大数据专题应用场景构建,三年共完成不少于6个大数据专题应用场景的要求进行建设部署。其中专题应用从需求提出到建设部署,再到完成验收,需要遵循以下步骤:
1、由建设方提出专题应用需求,或由承建方提出专题应用建设思路;
2、需要完成专题应用需求调研工作,经专题相关业务部门确认后开展后续建设部署工作;
3、根据业务场景开展主题设计和指标设计工作后,均需经专题相关业务部门确认后方可正式开展专题业务场景应用开发部署工作;
4、专题应用建设完成后,专题应用需经过监理方、验收测评方验收确认后,由相关业务部门和建设方最终确认完成;
5、专题应用部署上线后,承建方需及时完成业务培训工作,培训对象包括相关业务部门及管理人员。
专题需求提出
专题建设设想提出包括建设方提出和承建方提出两种方式。
1、建设方提出:建设方通过收集全市各单位的大数据能力需求,提出大数据专题应用建设需求,交由承建方运营人员开展需求分析工作;
2、承建方提出:承建方根据市信息化建设现状和其它先进地市大数据能力建设情况,提出适应市发展现状的大数据专题场景建设思路,交由建设方评估采纳,经采纳的专题应用将进入专题需求调研环节。
专题需求调研
开展专题应用需求调研,通过业务调研及需求分析,明确分析主题的业务现状、业务场景、专题目标、专题范围、数据源等。调研结果应由专题相关业务部门逐项进行确认,以指导后续专题指标、模型的构建。具体要求包括:
1、根据提出的大数据专题应用场景,准备专题应用需求调研工作;
2、通过对市区内大数据专题应用场景相关业务科室的调研,了解业务开展现状和业务场景情况,提出专题应用建设目标和建设范围,梳理所需的数据资源清单和现有数据资源清单;
3、运营服务人员根据调研情况、其它地市建设情况和专业经验,对该专题场景建设进行可行性分析,若该建设场景可行性较高,则输出调研报告并交由专题相关业务部门和建设部门确认,若该场景可行性较低,则应及时向建设部门反映,由建设部门征求相关业务部门意见,决定是否继续开展建设工作;
4、当可行性较低或不明确时,但业务需求较为迫切的应用场景,建设部门可要求运营服务人员重新开展深度调研工作,并根据最终的调研情况决定是否继续开展此项工作。
专题主题和指标设计
需求确认后,运营人员根据业务场景开展主题设计和指标设计。具体要求如下:
1、主题设计:运营服务人员根据调研后确认的需求内容,结合专题相关行业职能及业务场景,设计专题应用中包含的分析模块和应用功能,形成初步的主题设计方案交由相关业务部门和建设部门确认;
若相关业务部门和建设部门同意该设计方案,则推动专题应用指标设计工作,否则将要求运营服务人员根据修改意见对主题进行重新设计;
2、指标设计:运营服务人员根据确认的主题设计内容,结合业务场景和具体功能需要,设计专题应用中大数据分析的分级分类指标,并说明指标口径及依据;
若相关业务部门和建设部门同意该设计指标,则推动专题应用的模型、功能的开发部署,否则将要求运营服务人员根据修改意见对指标进行重新设计。
专题开发部署
在完成专题应用场景需求调研、设计确认后,运营工作人员将按照既定专题应用设计需求,开展专题应用开发部署工作。具体要求包括:
1、运营服务人员完成专题应用的开发、部署和调试工作;
2、完成专题应用的开发部署后,组织监理机构、验收测评机构进行确认和验收工作,并交由相关业务部门和建设部门最终确认;
3、若应用成果没有得到确认通过,由建设方根据问题要求运营服务人员重新进行主题设计、指标设计或开发部署等工作。
专题可视化设计
1、原型设计
专题原型设计涉及需求调研、业务梳理、需求分析、架构设计、版面设计、原型输入等方面的工作,输出主题图和卡片。
2、页面设计与实施
可视化页面设计与实施服务内容主要包含页面框架搭建、可视化图表实施、数据接入、联调和发布,生成的可视化页面须提供开放接口支持与可视化管理中枢对接,支持其对页面的调用。
(1)页面框架搭建
基于其业务应用属性,设计美观、合理的页面展示框架,实现对数据的实时、直观的可视化双向交互呈现。
(2)可视化图表实施
根据所提供的内容资料,进行整理、归类、开发、填充,将静态展示无法容纳、无法表现的各类数据,如文本、数字等传统枯燥的操作界面和单一数据,以图形化方式进行呈现。根据业务需求,将视频、复杂动画、2D/3D图形及实时数据流进行统一整合,并使用定制接口,以图形化方式实时呈现并管理。
(3)数据接入
对接、集成可视化分析页面所需的数据接口。
(4)联调
进行数据测试、功能测试、性能测试,完成各个环节的联调。
(5)发布
测试完成后进行发布该大数据决策专题应用,实现专题的最终呈现。
专题应用使用培训
专题应用验收确认后,应用上线并交付给用户使用,为保证应用能够正常使用,承建方需针对专题应用,组织相关业务部门和建设部门进行专题应用模型使用培训。具体要求包括:
1、培训内容包括专题应用功能介绍、应用操作培训、调用流程培训等;
2、提供至少一场现场授课+上级辅导的免费培训;
3、提供针对该专题应用的使用教程、操作指南等文件。
服务工作量要求
大数据分析平台运营服务工作量将按数据采集和处理、数据抽取、数据治理、数据建模、数据展示、数据统计、数据分析报告等内容进行统计。