excel学习库-商业模型与数据思维

本文作为《精益数据分析》的拓展读书笔记，对照的是原书第一部分的第3、4章。在这两章里，原书作者分别介绍了精益画布和运用数据分析时应避免的风险。尤其第4章，甚至有点哲学的意味。这个世界上没有什么东西是只有好处，没有坏处的。数据分析也一样。无视它或者过分迷恋它，可能都不是什么好事。作为一名商业分析的“手艺人”，我对作者这样深刻的观点感到一丝震撼。没有卖弄，没有吹捧，反而有的是谆谆告诫。我觉得这正是真正专业的人应有的态度。

这两章内容表面看似乎与“数据分析”不太沾边，没有多少数据分析的硬核内容，尤其精益画布这一章。但作为商业分析实践者中的一员，我提醒你不要这么想。它们的关系十分紧密，而且一脉相承。商业分析既然有“商业”两个字，就意味着它与管理、营销等企业经营知识息息相关。不应把商业分析看成是单纯摆弄数字的事儿。而运用数据分析的风险，特别是具体的10种要避免的数据思维圈套，绝对值得每个人细细品味。我将在本文给你解释这一切。

精益画布的使用

商业模型

商业项目的市场机会是什么？或者说该商业项目为什么可以存在？
商业项目的目标市场在哪里？或者说目标客户都是什么人？
商业项目的产品是什么？就是说向目标客户群兜售什么？或者说解决问题的方案是什么？
商业项目的优势是什么？这可能是产品的卖点，也可能是业务流程中某个比较突出的，很可能会受客户喜欢的优点。
商业项目的劣势是什么？与优势相对，既要考虑商业项目的优势方面，也要考虑其劣势一面。在我国的《孙子兵法》中，对此早有论述，正所谓“多算胜，少算不胜，尔况无算乎？”。
构建商业项目优势的资源有哪些？企业掌握它们的程度如何？
通过什么渠道企业将产品卖给目标客户？
企业怎样从客户那里获得收入？

读者朋友们如果仔细阅读该书，会发现书中讲的精益画布，和我上面讲的内容有一定出入。不要担心，的确是表面看起来不太一样。但如果你仔细研读，相信会发现它们其实本质上是一致的。

理想客户

此外在商业模型中，可能还需要回答成本这样的问题。作者在书中的例子就列出了这一条。在我写的上文中并没有列出，是因为我认为成本这一项也许并不一定是必须的。比如早期初创商业项目很可能还没有营收，成本可能也不太清楚。此时对企业最重要的问题，是“市场在哪里”这种最核心的“灵魂拷问”级问题。成本这种相对不那么紧迫的问题，自然也就不必列出了。总之，面对什么样的商业项目，我们就画出什么样的商业模型画布。我所列出的8条建议，是我个人认为的一般角度来看最重要的问题。每个读者朋友当然也可以有自己的观点，构建自己的商业模型。下面我展示一个画布形式的商业模型示例，供大家参考。

图1 一个商业模型的示例

理想客户

上文中，我还提到了“理想客户”这个词，说它很重要。估计不少读者朋友在《精益数据分析》中读到这一块时，会很自然地把“理想客户”当作一个形容词+名词的普通修辞手法忽略过去。它在书中确实只是不起眼的一句话。但请注意，根据我对营销知识的了解，这里很可能不是这么简单。在营销领域，“理想客户”已经可以看作是一个专用名词。它描述的是企业业务最希望面对的客户群体类型。理想客户可以是虚构的，也可以是从真实客户群中归纳总结出来的。

那具体到底什么是理想客户？从形式上看，它就是一系列对企业最希望面对的客户的描述标签。这有点像用户画像。只是核心的区别在于理想客户允许虚构，所归纳的客户属性也可以是主观设定的。因为它主要是作为企业在设计自己的业务或产品时，参照的对象来使用。我就以自己为例吧，向大家介绍下理想客户这个工具的使用。比如我的业务是向传统企业提供商业分析咨询和服务。多年前，当我开始开展这一业务时，国内对商业分析、数据分析有所了解的企业非常少。那时候就是典型的初创阶段。现实中没有足够的现实客户供我调查，那怎么办？我用的就是理想客户这一工具。什么样的企业可能会对商业分析、数据分析感兴趣呢？经过分类，我画了如下的一个理想客户的描述。稍后我还会展示一个我制作的画布形式的虚拟理想客户示例。

图2 早期业务的理想客户简单示例

图2中我列举了7种企业特征，它们可能是早期商业分析/数据分析服务市场中的理想客户。由于画布形式制作起来有点繁琐，所以这里我为了简便，采用了思维导图。这基本没有问题。只是需要读者留意，所有图2中描述的企业特征，不要简单地直接用“或”的思路归纳它们，而是使用它们的组合。

比如只满足图2中任意一条特征的企业，是不是理想客户呢？好像可能性低一点儿。那如果同时满足2条的企业，成为理想客户的概率有多大？这回似乎把握就大一些了。照此推论，那是否可以认为同时满足7条岂不是最理想？理论上是这样，但这样的企业可能也少之又少，甚至在现实中有可能根本不存在。所以在图2的例子中，理想客户实际上就是这7条特征中的若干组合。比如同时满足第1、5、7条的企业，可能是一种理想客户。同时满足第3、4、6条的企业，也可能是一种理想客户。我在早期业务阶段接触市场、联系客户时，事实上就是这样的。满足上面7条特征中若干条的企业，成为了我的第一批客户。

我用自己真实的例子帮助读者朋友们直观了解“理想客户”究竟是什么。当然图2确实有点太简单了。实际上我们对理想客户的描述可以扩展到任何能够想到或收集到的维度。比如图2的例子中，企业的规模、所在的行业、其业务特点（比如是线下为主还是线上为主），企业主的性格特征、企业管理的风格等等都可能成为理想客户中描述的属性。下面我展示一个虚拟的例子，帮助大家直观理解这一点。

图3 一个理想客户的直观示例

图3中这个虚构的理想客户示例中，包括了理想客户的人口统计特征，兴趣/行为偏好特征，生活背景资料特征，还描述了一些需求痛点。所谓人口统计特征，就是性别、年龄、所在地、工作行业这些属性。

理想客户用于营销和销售工作，帮助营销/销售人员更好地识别、归纳客户特征。表面看，理想客户仿佛就是拉家常式地收集了一些琐碎的信息。实际上描述理想客户的信息与企业产品定位、渠道、目标人群特征、需求痛点等息息相关。建立了这些属性特征后，开始着手在业务过程中对理想客户进行验证。这是不是就和《精益数据分析》作者所提倡的“收集数据——分析数据——测试——验证”的数据分析生命周期对应上了？假设有一天，营销/销售人员发现自己正在接触的客户，与理想客户十分吻合时，就可以很快判断出对方是自己的理想客户。对理想客户应该采取哪些行动以更好地互动，也就很快一目了然了。

理想客户的描述，还可以使用Excel、Word、OneNote等各种工具，以自己擅长或喜欢的形式制作，并不局限于图2或图3中展示的形式。理想客户既可以通过实际业务数据，统计相关的属性归纳总结而得，也可以完全通过人为的主观定性描述获得。这根据企业自己的具体条件情况自由选择。

避免数据思维的圈套

商业分析/数据分析的确很有用，但也绝非说一切都唯数据论。我本人虽从事商业分析/数据分析业务，但对这一观点是赞同的。除了作者，实际上还有很多专家也在不同的著作里提出同一观点。以人为本仍然是我们做事的原则。在《精益数据分析》这本书里，作者围绕创造力谈论了这一话题。他的观点概括下来基本就是：数据可以帮助我们验证假设，但是创造力的发挥还得靠我们人脑本身。不要一股脑地把决定权完全交给数据，而应该是去洞察数据背后的信息。在我看来，这也恰恰体现出商业分析/数据分析中“分析”二字的精髓。荀子曰：君子性非异也，善假于物也。我们应当充分利用商业分析/数据分析这一工具，而不是反过来被它牵着鼻子走。

接下来作者也不忘回到数据分析，列举了10种具体的数据思维的圈套。我把它抄录于思维导图，方便读者朋友们浏览。不过我个人觉得作者列举的10种现象略有重复，分类列举的例子也不够清晰（可以想象作者主要是为了举例，而不是尽力归纳），所以稍后我将分别解释这10种陷阱到底针对哪几类数据分析常用的思维模式。

图4 精益数据分析中提示避免的10种数据

关于噪声

第1条和第10条都谈到了噪声。噪声是数据分析中要面对的最基本的问题之一。因为噪声无处不在，也不可能消除。我们只能尽量减少它的影响。另一本知名著作《噪声》（丹尼尔·卡尼曼等著），比较充分地讲述噪声对人类判断的影响。无论是数据分析还是用于决策判断，这又是一本值得一读的经典好书。我读后感觉受益匪浅。不过现在我们还是回到《精益数据分析》中来。对于熟练掌握数据分析/商业分析，或者熟练运用统计技术的读者朋友，对噪声的处理都有自己的见解和相应的方法。那么对于尚不熟悉的朋友们来说，这里先建立一个意识就好。即噪声会影响我们的判断，所以当我们做评估或者决策，尤其是重要的决策时，应意识到可能会受到噪声的负面影响。

什么是噪声呢？怎样理解噪声呢？噪声其实就是不可预测的变异性。学过统计的朋友都知道统计中有一个基本概念：方差。它描述了变量的变异性。噪声就隐藏其中。为帮助读者朋友们直观理解噪声，我用量化交易来举个例子。所谓量化交易，就是通过程序来进行股票交易。传统的股票交易是靠人来完成操作的。人通过观察交易量、交易价格，然后根据自己设定的交易策略执行交易。如果我们认为股票价格只受交易量、交易价格这些市场因素的影响，那就可能误解了它真实的模样。因为人是有情绪的。情绪、欲望、冲动也会或多或少影响交易市场的表现。这就给股票交易市场注入了无穷的噪声。而量化交易是由程序完成的，程序没有任何情绪，只会“忠诚”地执行既定的交易策略。于是反而少了某种“不必要”的波动。这被认为是量化交易的“优势”之一，也被解释为有些量化交易程序表现好于人类的原因之一。

如果量化交易的例子可能对有些读者朋友依然不够直观，让我们再次以抖音短视频为例来理解噪声。抖音上那么多的短视频账号，有的比较火，有的则访问量寥寥。差异何在？我们可能会认为账号博主的内容创作水平、运营水平造成了这种差异。但实际上，那些没有火起来的账号，有不少是专业团队在运营的。甚至我们可以想到，那些尚未火起来的账号里，有些背后的专业团队，其选题、内容创作、运营水平可能比已经火起来的账号更高。而有些已经火起来的账号反而可能博主自己都还没弄明白究竟是怎么火起来的。可谓是什么情况都有。为什么造成这种现象？笼统地解释，原因就是噪声。影响一个短视频账号火爆的因素实在太多了。不同时期、不同社会热点背景、不同人文文化流行趋势、一个起初完全不起眼的创作元素细节，甚至捉摸不定的运气，都可能是影响短视频账号是否火爆的因素。噪声，是人生无常这句话的理性版注脚。

在《》这篇文章里，我也恰好演示了降噪数据处理。为了计算销售的基准数据，我使用移动平滑方法平抑噪声，并由此计算得到一个销售基准数据。促销后的销售数据也是同样手法处理。最后利用平抑噪声的数据评估促销的效果，目的就是为了尽可能降低噪声的干扰。可以说怎样看待噪声，反映了数据分析人员处理数据、分析数据的意识和观念。当然，也影响着分析结果的质量。

关于噪声，我们就暂且讨论至此。总之，读者朋友们只要意识到噪声是影响我们评估和决策的隐形杀手就足够了。如何处理噪声，就交给数据分析人员吧（请记住，噪声只可能尽量减少，不可能消除）。即使是领域内专家，也无法不受噪声的影响。所以有时候专家的预测、判断与后来的事实大相径庭。这样的例子已经多到不证自明的地步。所以不要忽略噪声。

关于归一化

归一，是使数据标准化的处理手法之一。在数据分析中属于基本方法。为什么要归一呢？目的就是为了能让不同量级的对象也可以直接进行比较。所以作者在这里的本意，是强调为了比较不同量级的对象，应该首先对数据进行标准化。举一个通俗的例子吧。比如企业想要对所有新老客户进行比较，以评估哪些是优质客户。我们假设企业就只是用“采购额”这个单一的指标来进行比较。很显然，即使是最优质的新客户，也可能难以比过采购量平庸的老客户。这种直接比较的方法明显不公平，也无助于发现那些真正的潜力优质客户。这个时候归一就是一种解决办法。我这里列举两种方法。

方法一，是首先将客户分成老客户和新客户两组，然后分别计算归一后的采购额。此时采购额被标准化为0-1之间的数据。既然新老客户的采购额指标都在0-1之间，现在可以把它们混合在一起直接比较了。这种方法比较的，实际上是新老客户在各自分组里的排序。

我们还可能并不想考虑排序。因为排序再好，也许客户的采购水平依然不够令企业满意。企业还是想按照客户的真实采购能力进行比较。那么方法二也许可以这样设计：直接计算每家客户的平均单日采购额。在单日采购额这个指标上，无论新老客户都是量级一致的，于是现在可以直接比较了。

关于异常点

异常点，就是数据集中引起我们怀疑的数据样本点。异常值不一定是错误值，也许数据是真实存在的。我个人相对更喜欢用离群值（outlier）来单独描述这种真实存在，但确实与其它样本点很不一样的数据点。而使用异常值来笼统地整体描述既有可能是错误的，也有可能是离群值的样本点。

在分析过程中是否包含异常值，要看具体分析的目的。如果我们想要探索数据全貌，发现未曾了解到的信息，那么就不要排除异常值。先检查其是否是错误样本，如果是错误的，再剔除它。如果不是错误的数据，就保留它。数据探索遇到离群值不是坏事，反而应该兴奋。如果数据分析的目的就是为了评估主要数据的分布规律，那么就排除离群值吧。

关于季节性

季节性和周期性，是具有周期性重复规律的数据集带有的特点。季节性和周期性难道还不一样吗？在数据分析领域，的确是区分这两种情况的。熟悉数据分析，尤其是时间序列的朋友大概十分清楚这二者的细微区别：对于相对中短期内出现的周期性规律，我们用“季节性”来描述它，比如一年或几年内的重复变化规律。通常零售业以及特定的商品贸易，就有很强的季节性。比如可能临冬季消费逐渐旺盛，而暑夏相对淡季。对于相对长期内出现的周期性规律，我们用“周期性”来描述它。比如房地产行业的行业周期大约是18-25年。网上传播的大名鼎鼎的康波周期，大约是50-60年（刚好是一个中国甲子年）。

比如在分析零售业时，我个人很可能会刻意观察每周和每月的数据变化。因为零售业中“周”和“月”变化是比较常见的周期性变化规律。

关于基数

基数，在之前的文章里我称之为“基准”。内涵应该是差不多一致的，意思就是用于对比的参照物。在计算增长率时，不要忽略基准本身的量级水平。就像作者举例的那样，当计算增长率时，如果分母为1，那么非常不起眼的增量也可以得出非常惊艳的增长率。

所以对比两个比率型指标时，既要确认统计口径，也要弄清基准是多少。否则有可能被看起来漂亮的数据糊弄。

关于数据呕吐

作者的意思是想说，分析数据前要弄清楚我们分析的目的是什么。与目标无关的就不必多此一举再去分析了。这恰好与我在《技巧分享——销售数据分析怎么做》里提到的“数据分析是有边界的”对应起来。

在此我想多说一句的是：除了分析是有边界的，收集数据实际上也应该是有边界的。一方面收集数据不是无成本或低成本的事情，有时候它甚至很昂贵。所以不必浪费成本收集一些自己用不着的数据。这和过去有人提倡的“大数据时代，不管有用没用，数据先收集起来再说”的观点不同。究竟哪种更适合现实情况，这点仍没有定论，读者朋友请自行判断采纳。另一方面随着数据隐私的观念越来越深入人心，也不再是过去那种肆意采集个人隐私数据的时代了。《中华人民共和国个人信息保护法》也于2021年11月1日起正式施行。所以数据的收集，够用就好。除了个人信息被立法保护，企业也应该逐渐加强数据资产的安全意识。数据脱敏就与这类问题有关。适当的时机我们再讨论它。

关于“谎报军情的指标”

这是关于指标阈值的话题。在实践中我观察到重视指标阈值的人并不普遍。但这个问题其实挺重要。指标阈值如果设置得过宽，那么就失去了预警的作用；而阈值过窄，又会大量增加无效的假预警。怎样才能让这件事情刚刚好？这个问题如果深究起来，内容还比较多。我观察到目前比较基本的处理方法是利用简单统计方法，比如计算3倍标准差作为阈值。这的确算是一种方案，但可能在某些场景下依然不能解决问题。比如到底用多少倍的标准差作为阈值合适？难有定论。由于我曾在制造业做过工艺工程师，对制造业质量管理的SPC工具比较熟悉。所以借鉴于SPC的思想方法，我在商业分析的实践中对指标阈值的设定做了一些学习和探索。在后续的文章中，我将会分享有关的内容。

关于“不是在这儿收集的”综合症

作者的这句话到底在说什么？对于数据分析不熟悉的朋友，看这句话可能很容易糊涂，作者在表达什么观点？其实作者说的是我们行业内俗称的“数据打通”问题。所谓数据打通，是指数据在收集的过程中，可能是分散于不同数据集的。

比如客户的基本资料，如人口统计特征，记录在客户关系管理系统CRM里。而客户的订单记录则记录在销售系统或业务处理系统里。如果这两套系统不能打通，那么我们就无法通过CRM里丰富的客户属性维度，来分析订单记录中的数据。这当然限制了数据分析的发挥。比如假设CRM里存储了客户的所在地这一属性，那么只要CRM数据和订单数据连接起来，自然就可以分析出“在哪些地方的客户通常会购买什么商品”这一信息来。电商企业开始建立线下实体店，选址就可以参考这一重要信息。相比之下，传统企业的门店选址靠的是经验（想一想肯德基麦当劳在选址方面的传统经验优势）。原本优秀的传统企业在这方面是有独门绝技的，因此构成了企业独特的竞争优势。但在数据的加持下，这一优势就没有那么突出了。

不过，数据打通这个事也不是这么纯粹简单。首先数据打通这个事本身就是一个难题。全世界数据分析发展有几十年了，在我国逐渐兴起也有十来年了。到现在数据也没有完全打通。大量的企业即使有信息化基础，数据也存储在各个系统里无法互联。业内将这个现象称为“数据孤岛”。上面我举的例子是比较简单的，现实问题其实复杂得多。

另外数据隐私保护给数据打通这个事先上了一个紧箍咒，数据打通的难度自然也就更大一些了。当然这是正确的。没有人喜欢生活在隐私被肆意滥取的环境里。

所以时至今日，数据打通不一定是现实中真正刻意追求的解决方案了（但行业仍在努力。想想《精益数据分析》在国内头版的年份是2015年，由此可以理解作者当时提出的这个观点）。对此我个人实践研究的解决方案是：一方面尽量用较少的数据集完成分析目标。这与现实中企业收集数据的门槛也有关系。很多企业其实并不能收集到丰富的数据，尤其传统企业。这一点不能和头部互联网企业相比。另一方面，尽量采用一些数据分析、数据挖掘技术来增加数据维度信息，以实现最终的分析目的。比如我针对销售数据，经过多年探索，目前已经基本总结出仅依赖销售数据本身，实现对销售、客户、产品等多个角度进行深入洞察的方法。在后面的文章里，我将陆续给读者朋友们分享。

好了，关于《精益数据分析》第一部分的第3、4章内容，我就为大家解读完了。希望对大家有帮助。

一	二	三	四	五	六	日
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28	29
30	31

excel学习库

excel表格_excel函数公式大全_execl从入门到精通

商业模型与数据思维2024-04-13 16:17:17

精益画布的使用

理想客户

避免数据思维的圈套