摘要
本文由以数据之名分享,正所谓“人靠衣装马靠鞍,狗配铃铛跑的欢”,我们循序渐进的构建数据模型、建设数据分析体系、通过离线和实时ETL搭建数据仓库和数据湖,通过AI挖掘数据的潜在价值指标等等一系列的数据操作,最后都需要通过包装“商业智能BI”的外壳来动态、高效、直观的体现数据的真正价值。
01
—
睿思BI (开源+商业,***)
“睿思BI”商业智能系统是由成都睿思商智科技有限公司自主研发的企业数据分析系统。开源版基于Vue + Springboot+MySQL+Maven快速架构,系统包含数据建模、数据报表、多维分析、仪表盘、移动BI等功能模块,方便企业快速建立一套易用,灵活、低成本的商业智能平台,实现数据的快速分析及可视化。
在线体验:https://www.ruisitech.com/rsbi-ent/Login.action
源码地址:https://github.com/ruisibi/rsbi-vue
官方文档:http://www.ruisibi.cn/book.htm
部署手册:http://book.ruisitech.com/xi-tong-an-zhuang-2.html
系统架构:

产品特点:
丰富的数据源支持,MySQL/Oracle/SQLServer/DB2/PostgreSQL/Hive/Kylin等。
轻量级BI, 支持快速建模,快速可视化数据。
多维分析/报表/仪表盘/数据大屏使用简单,功能强大,通过拖放等方式构建分析界面,支持下钻/上卷/排序/筛选/计算/联动等多种操作方式。
支持移动BI,通过APP随时随地访问报表数据。
开放源码,采用Apache2.0开源协议,用户可任意使用而不需该公司授权(标准版除外)。
可以尝试只取其精华,拿来主义是王道
02
—
Fine BI (商业,****)
“Fine BI”商业智能系统是由帆软软件有限公司推出的一款商业智能(Business Intelligence)产品。其自助分析以业务需求为方向,通过便携的数据处理和管控,提供自由的探索分析。
在线体验:http://demo.finebi.com/ demo/demo
源码地址:不开源
官方文档:https://help.fanruan.com/finebi/
部署手册:https://help.fanruan.com/finebi/doc-view-260.html?source=5&from=help.fanruan.com/finebi
学习视频:https://bbs.fanruan.com/course-70.html
功能架构:

产品架构:

产品特点:
多源数据整合,FineBI 内置支持和插件支持的数据库类型,分别为:阿里云AnalyticDB、Amazon Redshift、Apache Impala、Apache KYLIN、Apache Phoenix、DERBY、GBase 8A、GBase 8S、GBase 8T、H2、华为云DWS、Fusioninsight elk、Fusioninsight HD、GaussDB 200、Hadoop Hive、HBase、HP Vertica、HSQL、IBM DB2、INFORMIX、KINGBASE、 SQLServer、MySQL、Oracle、Pivotal Greenplum Database、PostgreSQL、Presto、SAP HANA、SAP Sybase、SPARK、Sqlite、TeraData、TRANSWARP INCEPTOR,支持多数据源关联,消除孤岛
业务包数据管理,基于业务需求分类数据包,开放权限给指定用户,清晰明了
自动数据关联,一键读取表间字段关联,一次配置可多次重复使用,解放IT人力
智能权限,设置基础权限后,业务数据包自动继承权限,节省操作成本
可视化ETL,内置可视化的ETL工具,支持对原始数据进行二次加工处理
Spider大数据引擎,高性能分布式计算引擎,以轻量级架构实现大体量数据的计算
企业级管控平台,提供以IT为中心的企业级管控平台,为业务用户自助分析系统保驾护航
可视化探索式分析,自由布局分析报告,进行各类可视化的OLAP分析操作,洞察数据
分发与共享,一键分享报告,支持挂载到数据决策系统节点分发给各相关单位查阅
移动应用,无须二次开发,即可将PC端分析报告呈现在移动端,拇指之间决策千里
嵌入式分析,支持方便地与用户的原有系统集成嵌入支持HTML5,支持单点登录
精细的权限管理,支持基于用户角色分配报告查看权限,精细到数据行与列,千人千面
愿意支付一定的基础软件费和服务费,可以作为选型参考
03
—
永洪BI(商业,****)
“永洪 BI”商业智能系统是由永洪科技推出的一款一站式大数据分析平台产品。Yonghong Z-Suite + Yonghong Desktop,腾讯云已集成其BI产品, 企业可以更敏捷、更快速、更强大利用该平台,来完成全流程的自助分析服务,轻松发掘大数据价值,获取深度洞察力。
在线体验:http://demo.yonghongtech.com/bi/v85
源码地址:不开源
官方文档:https://www.yonghongtech.com/zc/wdxz/
部署手册:http://club.yonghongtech.com/thread-7855-1-1.html
学习视频:http://club.yonghongtech.com/forum-61-1.html
功能架构:
广泛的数据源接口
支持Oracle、MySQL、DB2、SQLServer、PostgreSQL、Derby、Gbase8a、Hana、GaussDB100、GaussDB200、AnalyticDB、Hive、Elastic Search、达梦DM等。创建数据集
全面的数据治理手段,提高数据质量;完善的数据权限控制功能;友好衔接调度任务。
可视化数据报告
丰富的可视化组件样式,包括数十种图及中国式复杂报表。自助式探索分析
过滤数据、多维钻取分析、数据高亮分析、趋势分析、目标值分析、聚焦分析。
AI深度分析
通过AI深度分析算法进行数据预测和数据关联性洞察的数据挖掘。企业级管理
具有日志管理、认证授权、资源部署等完整的企业级管理能力。
产品架构:

产品特点:
自服务
一站式分析平台,集数据准备、报告制作、数据分析为一体,业务人员也能轻松、快速地制作并分析数据报告,带来业务驱动的数据分析工作模式。高性能
秒级计算,最久的时间来自于您的眨眼;可单机部署,亦可基于PC服务器进行分布式扩展,利用列存储和内存计算,实现从千万到百亿级数据分析的秒级响应;如此卓越的性能,为您支撑更多的分析维度和更大的数据范围。
极致易用
上线周期以周为单位,百兆安装程序可在几分钟内安装完成;基于J2EE架构,支持Windows,Linux/Unix/Mac等主流OS平台;平台支持全部云端OS,支持公有云、私有云和混合云架构。移动跨屏
无缝支持PC、手机或Pad,并在这些终端设备上保持一致、易用的用户体验。您可以随时随地通过移动设备进行数据分析,从而做出正确决策。基于H5的前端框架可与微信集成。
愿意支付一定的基础软件费和服务费,可以作为选型参考
04
—
JRelax-BI(开源,***)
“JRelax BI”商业智能系统是由风怒的码农开源的BI自助分析平台,致力于打造一个集自定义表单、自定义流程、自定义页面、自定义报表等多功能于一体的应用开发平台。
在线体验:http://server2.nethsoft.com:8080/ superadmin/1
源码地址:https://gitee.com/zengchao/JRelax-BI,https://gitee.com/zengchao/jrelax
官方文档:https://gitee.com/zengchao/JRelax-BI
部署手册:https://gitee.com/zengchao/jrelax#%E9%83%A8%E7%BD%B2%E6%AD%A5%E9%AA%A4
功能架构:
自定义表单
数据库管理工具
自定义数据源(对RDBMS支持比较友好,MySQL、Oarcle等)
自定义工作流(基于activiti,包含web版本的流程设计器)
自定义图表(基于chart.js)
自定义表格
技术栈:
SpringMVC
Spring
Hibernate
Memcached / Redis
Velocity 模板
基于JVM的事件注册机制
灵活可扩展的插件机制
JDK1.8 +
MySQL 5.6 +
Maven 3
产品特点:
开源,可以自由二次开发
基本功能模块全,数据源可以自由开发扩展
可以尝试只取其精华,拿来主义是王道
05
—
Pentaho BI (商业,**)
“Pentaho BI”商业智能系统是由日立打造的商业一体化BI自助分析平台,Pentaho BI 平台不同于传统的BI 产品,它是一个以流程为中心的,面向解决方案(Solution)的框架。其目的在于将一系列企业级BI产品、开源软件、API等等组件集成起来,方便商务智能应用的开发。它的出现,使得一系列的面向商务智能的独立产品如Jfree、Quartz等等,能够集成在一起,构成一项项复杂的、完整的商务智能解决方案。
在线体验:需要自己部署
源码地址:无源码
官方文档:https://forums.pentaho.com/index.php
部署手册:https://sourceforge.net/projects/pentaho/files/Business%20Intelligence%20Server/
功能架构:
一站式端到端数据平台构建解决方案,集成分布式任务开发与调度平台,自助建模、自助数据服务和自助BI
丰富的数据源支持(对RDBMS、NoSQL、NewSQL等支持都比较友好)
产品架构:

产品特点:
可与日立各产品线如Kettle等无缝集成,可谓之集大成者,一统江山的趋势
耦合度太高,成本较大,不推荐
06
—
Spago BI (开源,****)
“Spago BI”商业智能系统是由Engineering Group的SpagoBI实验室打造的唯一100%的开源商业智能套件。SpagoBI是一个商业智能平台,为商业智能项目提供了一个完整开源的解决方案。它涵盖了一个BI系统所有方面的功能包括:数据挖掘、查询、分析、报告、Dashboard仪表板。
在线体验:需要自己部署
源码地址:https://gitee.com/mirrors/spagobi?_from=gitee_search,https://github.com/SpagoBILabs/SpagoBI
官方文档:http://wiki.spagobi.org/xwiki/bin/view/Main/
部署手册:http://wiki.spagobi.org/xwiki/bin/view/Main/QuickStart
功能架构:
OLAP Server:Mondrian
OLAP展示:JPivot
数据挖掘组件:Weka
Map引擎:Geo
ETL:BIE
搜索引擎:Lucene
Dashboard:OpenLaszlo
Portal Server:JBoss/ Tomcat/ JOnAS
产品架构:

SpagoBI SERVER服务器,SpagoBI商业智能套件的的核心模块,包括分析工具和相关的功能特性;如用户、角色、权限管理、目录、菜单设置、及分析报表的查看、及自助分析等;
SpagoBI STUDIO 设计器,是SpagoBI集成开发环境,用于设计并开发诸如图表、报表、OLAP分析等分析文档的工具;在Studio中设计好报表后,可以直接发布到SpagoBI Server上。
SpagoBI META ,SpagoBI的元数据管理环境;
SpagoBI SDK,允许外部工具和应用程序与 SpagoBI 服务器进行交互的集成层;
SpagoBI APPLICATIONS 应用,对正在使用SpagoBI开发垂直的分析模型的集合;
产品特点:
Self-Service 自助分析
Big Data 大数据
What-If 假设分析
Social Network Analysis社交网络分析
In Memory 内存计算
Real Time即时分析
location intelligence 地理位置分析
Mobile 移动
开源免费,强大而又笨重,可以作为选型参考,不推荐
07
—
Easy Report(开源,**)
“Easy Report”由TomDeng打造的开源智能报表套件。EasyReport是一个简单易用的Web报表工具,它的主要功能是把SQL语句查询出的行列结构转换成HTML表格(Table),并支持表格的跨行(RowSpan)与跨列(ColSpan)。同时它还支持报表Excel导出、图表显示及固定表头与左边列的功能。
在线体验:需要自己部署
源码地址:https://gitee.com/xianrendzw/EasyReport/
官方文档:https://gitee.com/xianrendzw/EasyReport/blob/master/docs/manual/version2_0.md
部署手册:https://gitee.com/xianrendzw/EasyReport/blob/master/docs/manual/version2_0.md#user-content-2%E5%AE%89%E8%A3%85%E4%B8%8E%E9%83%A8%E7%BD%B2installation--deployment
功能架构:
改进图表报表图表生成并增加图表生成配置
定时任务功能完成
支持传统的RDBMS(Oracle、MySQL等)、大数据产品查询(Hive,Presto,HBase,Drill,Impala等)
提供REST API服务接口
增加报表权限控制
产品架构:

产品特点:
用户只需要一条sql语句走天下
用户只要花20%的时间就能完成80%的报表输出
架构有些老,图表不友好,学习学习就好,不推荐
08
—
OpenFEA(开源,***)
“OpenFEA”由FEA组织开发并开放使用的一款实时数据和流数据处理融合大数据分析与数据可视化展示的软件。飞象大数据分析可视化平台(简称OpenFEA),致力于构建从数据收集到模型发布,再到可视化展示全方位一体化的一站式大数据敏捷分析系统,产品宗旨是利用OpenFEA平台让大数据分析变得更加简单。
在线体验:http://60.191.16.186:9001/test.fh5
源码地址:http://www.openfea.cn/xiazaibanben.html
官方文档:http://www.openfea.cn/help.html
部署手册:http://www.openfea.cn/help.html
功能架构:
一站式大数据敏捷分析系统
内存计算、集群运算、机器学习、 交互分析、可视化分析等技术
涵盖数据收集、数据探索、 构建模型、模型发布等功能
使用简便,无需复杂编程 快速实现大数据分析
丰富的数据源支持,并支持数据源与接口/格式的双向自定义机制

产品架构:

产品特点:
采用多引擎内存计算架构,对于海量级的数据可以做到快速实时分析
囊括双向全流程大数据分析系统,可以通过数据挖掘潜在价值,并通过既定的可视化结果可以进行推导。
敏捷分析:对于数据处理是秒级响应、对于可视化分析所见即所得、对于模型构建只需一行即可搞定、对于机器学习开箱即用。
高开放性:在不满足用户需求的情况下支持用户自定义函数、自定义数据源以及自定义第三方插件等,无限扩大OpenFEA的功能!
弹性部署:在部署方式上灵活而且容易扩展不仅支持双节点部署、集群部署以及云上部署,而且大中小数据全覆盖,融合多种数据源。
需要掌握官方原语,学习成本相对较高。http://www.openfea.cn/help.html
免费而又强大,是否可以商业化使用待考究,可以作为学习参考,进而反哺完善内部平台
09
—
Superset(开源,*****)
“Superset”由Airbnb的数据科学部门开源,并交由Apache孵化的一个现代的数据探索和可视化平台。Superset的中文翻译是快船,而Superset其实是一个自助式数据分析神器,它的主要目标是简化我们的数据探索分析操作,它的强大之处在于整个过程一气呵成,几乎不用片刻的等待。号称“拳打国外TableAU,脚踢国内商业BI”,战无不胜,所向披靡,正真的颠覆与现象级BI产品。
在线体验:底层基于python语言开发,需要自己搭建
源码地址:https://github.com/apache/superset
官方文档:https://superset.apache.org/docs/intro
部署手册:http://superset.apache.org/installation.html
功能架构:
直观的界面,用于可视化数据集和制作交互式仪表板
多种精美的可视化展示您的数据
无代码可视化构建器,用于提取和呈现数据集
世界一流的SQL IDE,用于准备数据以进行可视化,其中包括丰富的元数据浏览器
轻量级的语义层,使数据分析人员能够快速定义自定义维度和指标
对大多数说SQL的数据库提供开箱即用的支持
无缝的内存中异步缓存和查询
一种可扩展的安全模型,允许配置关于谁可以访问哪些产品功能和数据集的非常复杂的规则。
与主要的身份验证后端(数据库,OpenID,LDAP,OAuth,REMOTE_USER等)集成
添加自定义可视化插件的功能
用于程序化定制的API
云原生架构,专为规模而设计

技术栈:

产品特点:
Apache顶级项目,强大的社区活跃度与支持度。
丰富的、友好的图表样式和Dashboard样式。
强大的权限控制和全面开放的API,无论是直接使用,还是系统集成,都信手拈来。
再次强烈推荐,降本增效利器,您值得拥有。
Ubuntu部署:
以Ubuntu系统为例:1、sudo apt-get install build-essential libssl-dev libffi-dev python-dev python-pip libsasl2-dev libldap2-dev2、pip install virtualenv3、virtualenv supersetvenv . ./supersetvenv/bin/activate 4、pip install --upgrade setuptools pip5、# Install supersetpip install superset6、# Create an admin user (you will be prompted to set username, first and last name before setting a password)fabmanager create-admin --app superset7、# Initialize the databasesuperset db upgrade8、# Load some data to play withsuperset load_examples9、# Create default roles and permissionssuperset init10、# Start the web server on port 8088, use -p to bind to another portsuperset runserver11、# To start a development web server, use the -d switch# superset runserver -d
本地虚拟器Ubuntu启动supersetsudo su - rootcd /opt/software/. ./supersetvenv/bin/activatesuperset runserver
10
—
metabase(开源,*****)
“metabase”由metabase公司开发并开源的一款非常优秀的商业数据智能分析软件。前端采用的是基于react的开发框架,并结合react-router、redux-actions、react-router-redux、reselect等主要组件完成整体前端体系构建;后端基于Clojure Lisp语言开发,运行在JVM上。
在线体验:需要自己搭建
源码地址:https://github.com/metabase/metabase,https://gitee.com/mirrors/metabase
官方文档:https://www.metabase.com
部署手册:https://www.metabase.com
功能架构:
设置仅需5分钟
让团队中的成员在不知道SQL的情况下提出问题
丰富美丽的仪表板与自动刷新和全屏模式
分析师和数据专家专属SQL模式
为你的团队创建规范细分和指标以供使用
发送数据到Slack或电子邮件与Pulses的日程安排
使用Metabot随时查看Slack中的数据
通过重命名、注释和隐藏字段为你的团队人性化数据
丰富的数据源支持,PostgreSQL、MySQL、Druid、SQL Server、Redshift、MongoDB、Google BigQuery、SQLite、H2、Crate、Oracle、Vertica、Hive、Presto、Snowflake、SparkSQL
产品架构:

产品特点:
开源免费,二次开发,怎能不香
工具轻量、安装依赖的环境简单、配置简单清楚
容易上手,操作门槛低,不会sql语句也能使用
支持对外共享,权限控制
Question可以便捷地创建图表,Dashboards界面整洁美观
丰富的、友好的图表样式和Dashboard样式。
强大的权限控制和全面开放的API,无论是直接使用,还是系统集成,都信手拈来。
强烈推荐,降本增效利器,您值得拥有。
11
—
Redash(开源+商业,****)
“Redash”是全球最受欢迎的开源实时数据可视化和商业智能(BI)软件,基于新一代云计算和数据分析技术,架构最先进、支持云部署、大并发、定时主动获取等特征。Redash是一款完全支持互联网部署的B/S架构的报表可视化平台,数据库接口层丰富,功能模块多样化。可以提供更加优质保密的信息,保证了用户数据的安全性。前端是基于React+Antd构建,后端Python+Flask + SQLAlchemy。
在线体验:需要自己搭建
源码地址:https://github.com/getredash/redash,https://github.com/dazdata/redash
官方文档:https://redash.io/help/
部署手册:https://redash.io/help/open-source/admin-guide
功能架构:
以其自然语法编写查询并探索模式
实时自动完成和键盘快捷键
为您经常使用的元素创建代码片段
缓存结果以减少运行时间
为您依赖的结果安排自动更新时间
使用查询结果作为数据源来加入不同的数据库
丰富的数据源支持,Amazon Athena、Amazon Aurora、Amazon DynamoDB、Amazon Redshift、Axibase TSDB、Cassandra、ClickHouse、Databricks、Druid、Elasticsearch、Greenplum、Hive、Impala、MemSQL、Rockset、ScyllaDB、TreasureData、PostgreSQL、MySQL、Druid、SQL Server、MongoDB、Google BigQuery、Oracle、Vertica、Presto、Snowflake、SparkSQL
产品架构:

产品特点:
开源免费,二次开发,怎能不香
工具轻量、安装依赖的环境简单、配置简单清楚
容易上手,操作门槛低,不会sql语句也能使用
支持对外共享,权限控制
Question可以便捷地创建图表,Dashboard界面整洁美观
丰富的、友好的图表样式和Dashboard样式。
强大的访问权限控制和全面开放的API,无论是直接使用,还是系统集成,都信手拈来。
强烈推荐,降本增效利器,您值得拥有。
12
—
CBoard(开源+商业,***)
“CBoard”由上海楚果信息技术有限公司主导开源, 它不仅仅是一款自助BI数据分析产品,还是开放的BI产品开发平台。
用户只需简单妥妥拽拽就能自助完成数据多维分析与报表设计
开发者能够简单扩展连接所有你的Java程序能够触及的数据
在线体验:需要自己搭建
源码地址:https://gitee.com/tuiqiao/CBoard,https://github.com/TuiQiao/CBoard
官方文档:https://peter_zhang921.gitee.io/cboard_docsify/#/zh-cn/
部署手册:https://peter_zhang921.gitee.io/cboard_docsify/#/zh-cn/manual/install
功能架构:
简洁美观的界面, 简单友好的交互模式
交互式自服务拖拽多维分析用户体验, 数据切块, 切片, 排序无所不能
一个数据集根据您的拖拽衍生无数不同粒度数据聚合 + 20余种不同展现形式的图表
图表数据准实时刷新
图表级别权限控制
支持多图表数据看板与看板定时邮件发送
多种数据源接入
JDBC(几乎所有实现了JDBC协议的数据库或数据产品都能轻松接入)
多版本原生Elasticsearch: 1.x, 2.x, 5.x
多版本原生Kylin接入: 1.6, 2.0, 2.1
离线文本文件, JSON文本
轻量级的技术架构, 简洁的业务代码, 不依赖任何第三方多维分析引擎。
产品架构:

产品特点:
开源免费,二次开发,怎能不香
部署环境简单、配置简单清楚
容易上手,操作门槛低,会写sql语句就能使用
丰富的、友好的图表样式和Dashboard样式,可拖拽式自定义视图布局
拥有基本访问权限控制
社区支持度不好是遗憾,但推荐JavaEr上车,吸取CBoard之精华,孵化内部降本增效利器。https://peter_zhang921.gitee.io/cboard_docsify/#/zh-cn/extra/customer
13
—
Tableau(商业,**)
“Tableau”由Tableau公司开发的一款强大到不可逾越的商业化自助BI数据分析产品,
能够帮助企业快速查看并理解数据的商业智能软件。一般我们采用Tableau Server+Tableau Desktop组合使用,助您实现,随想随答。
在线体验:官方网站申请,部署测试
源码地址:无
官方文档:https://www.tableau.com/zh-cn/learn
部署手册:https://www.tableau.com/zh-cn/support/knowledgebase
功能架构:

产品架构:

产品特点:
快速分析:在数分钟内完成数据连接和可视化。Tableau 比现有的其他解决方案快10到100 倍。
简单易用:任何人都可以使用直观明了的拖放产品分析数据。无需编程即可深入分析。
大数据,任何数据:无论是文件、数据库还是Hadoop和云服务,任何数据都可以轻松探索。
智能仪表板:集合多个数据视图,进行更丰富的深入分析。数据可视化最佳做法等待您去体验。
自动更新:通过实时连接获取最新数据,或者根据制定的日程表获取自动更新。
瞬时共享:只需数次点击,即可发布仪表板,在网络和移动设备上实现实时共享。
访问安全:强大的访问权限控制和全面开放的API,无论直接用,还是系统集成,都信手拈来。
有点遗憾:什么都好,最大缺点是按license收费,真贵啊。土司必备选择,顺便交个朋友。
14
—
Grafana(开源,**)
“Grafana”,可称之为开源监控尚方宝剑,多结合时序数据库,用于监控指标可视化分析,不能定义为报表平台或者自助BI平台,此处省略一万字……
在线体验:https://play.grafana.org/d/000000012/grafana-play-home?orgId=1
源码地址:https://github.com/grafana/grafana
官方文档:https://grafana.com/docs/
部署手册:https://grafana.com/docs/grafana/latest/installation/?pg=docs
15
—
总结
总而言之,开源版本:小编强烈推荐Apache Superset,商业版本:Tableau、FineBI等都是不错的选择,具体根据实际选型调研结果来综合考量。当然还有诸如Power BI、Smart BI等商业BI工具,也可以作为商业BI选型的参考。选型之路,难也不难,且行且珍惜!

虽小编一己之力微弱,但读者众星之光璀璨。小编敞开心扉之门,还望倾囊赐教原创之文,期待之心满于胸怀,感激之情溢于言表。一句话,欢迎联系小编投稿您的原创文章