在过去十年中,这一数字一直以惊人的速度增长。根据 Matillion 和 IDG 的一项调查,企业数据量每年增长 63%,而 12% 的受访企业报告的增幅高达 100%。数据源的数量使情况更加复杂:平均而言,企业需要处理来自约 400 个数据源的数据。
与此同时,企业绝不能错过数据带来的机遇。根据Statista关于企业大数据和人工智能应用现状的报告,全球75%的企业利用数据来推动创新,50%的企业表示数据有助于他们在市场中竞争。
大数据可视化带来改变
著名数学家和研究员 John Tukey 曾说过:“图片的最大价值在于它迫使我们注意到那些我们从未预料到的东西。”我们的数据可视化团队对此深表赞同。可视化使业务用户能够超越单个数据记录,轻松识别隐藏在大型数据集中的依赖关系和关联。事实上,BARC 和 Eckerson Group 开展的一项全球调查显示,13% 的组织因缺乏报表和可视化工具而阻碍了商业智能 (BI) 的采用。
这里有一些示例,分别展示了在实施和未实施良好数据可视化的情况下大数据分析结果的样子。
示例1:工业数据分析
在某些情况下,维护团队可以跳过“寻找见解”部分,只需通过分析系统通知机器 245 上的第 23 个部件可能出现故障。
然而,维护团队不太可能仅仅满足于即时警报。他们应该积极主动地开展工作,而不是被动应对,为此,他们需要了解依赖关系和趋势。大数据可视化可以帮助他们获得所需的洞察。例如,如果维护团队想了解机器故障与触发故障的某些事件之间的联系,他们应该查看连接图表来获取洞察,就像下面大数据可视化的示例一样。
示例2:社交评论分析
想象一下一家在全国范围内运营的零售商。一位顾客可能会去他们的商店并在Facebook上发帖:“伙计们,如果你们还没买圣诞礼物,那就去[零售商名称]吧。”另一位顾客可能会在Twitter上分享:“我讨厌新年!我从来没见过排那么长的队!我今天在[零售商名称]浪费了一个小时。而且工作人员很粗鲁。讨厌这个地方!”第三位顾客可能会在Instagram上发帖:“看看我在[零售商名称]买的一件多漂亮的驯鹿毛衣!”
该公司的客户群超过2000万。零售商不可能浏览整个互联网,搜索所有评论和评价,并试图通过滚动浏览所有评论来获取见解。为了使这些任务自动化,公司诉诸情绪分析。为了立即洞察分析结果,他们应用大数据可视化。例如,词云显示了单词的使用频率。频率越高,单词的字体就越大。所以,如果使用频率最高的词是“讨厌”、“糟糕”、“可怕”、“失败”以及它们的“喜欢”,那么现在是时候做出反应了。
示例3:客户行为分析
公司使用类似的场景来分析客户行为。他们努力实施大数据解决方案,以便收集实体店和线上商店的详细购买数据、浏览历史和参与度、GPS 数据、客户移动应用程序数据、客服中心来电数据等等。由于每天记录数十亿个事件,如果公司只有多条记录,就无法识别客户行为的趋势。例如,借助大数据可视化,电商零售商可以根据页面浏览量轻松发现特定产品的需求变化。他们还可以了解访客购物高峰时段,以及优惠券兑换的份额等。
最常用的大数据可视化技术
之前,我们研究了大数据可视化示例以及公司如何从大数据可视化中受益,现在我们将概述最广泛使用的数据可视化技术。
符号图
此类地图上的符号大小不一,便于比较。想象一下,一家美国制造商最近推出了一个新品牌。该制造商想知道哪些地区特别喜欢这个品牌。为了实现这一点,他们可以使用一张地图,其中的符号代表喜欢该产品的顾客数量(例如在社交媒体上留下正面评论、在顾客调查中对新产品给予高评价等)。
折线图
折线图 可以查看一个或多个变量随时间的变化并识别趋势。在传统的商业智能 (BI) 中,折线图可以显示过去 12 个月的销售额、利润和收入变化情况。在处理大数据时,公司可以使用这种可视化技术来跟踪按周计算的应用程序总点击量、按月计算的呼叫中心平均投诉数量等。
饼图
饼图 展现的是整体的组成部分。同时使用传统数据和大数据的公司可能会使用这种技术来分析客户细分或市场份额。区别在于这些公司获取原始数据进行分析的来源不同。
条形图
条形图 可以比较不同变量的值。在传统的商业智能 (BI) 中,公司可以按类别分析销售额、按渠道分析营销推广成本等。在分析大数据时,公司可以查看访客与其网站多个页面的互动情况、车间最常见的故障前案例等等。
热图
热图使用颜色来表示数据。用户可能会在 Excel 中看到热图,其中业绩最佳的商店用绿色突出显示,业绩最差的商店用红色突出显示。如果零售商想知道商店中顾客最常光顾的货架,他们也会使用其销售区域的热图。在这种情况下,零售商会分析大数据,例如来自视频监控系统的数据。
大数据可视化的最佳实践
关注仪表板性能
在大数据进入仪表板之前进行预处理,例如使用 ETL/ELT 管道、对大型数据库表进行分区,或在数据仓库中存储频繁的聚合数据。出于同样的目的,务必避免在同一页面上放置多个高粒度的可视化图表(例如,详细的散点图、热图)。
使用渐进式披露
确保不要 让用户感到不知所措。首先显示概要指标,然后让用户根据需要深入查看并打开更多视图。
在一个视觉对象中使用可比较的度量
例如,在条形图中,比较数字和百分比是有意义的。然而,将盈利能力与销售额进行比较则缺乏信息量。在这种情况下,可以结合两种视觉类型。例如,为了追踪销售收入的动态,我们可以将表示销售额的条形图叠加在反映货币收入的折线图上。
避免使用仅代表总数的视觉效果
大数据数据集通常隐藏方差和异常,因此最好使用能够反映统计分布、体量和密度的可视化图表,例如箱线图、直方图和散点图。例如,显示各部门总薪资的条形图无法显示各部门内部薪资的分布情况或是否存在异常值,而箱线图则可以揭示这些情况。同样,直方图可以显示员工之间的薪资分布,而散点图则有助于根据工作年限对薪资进行基准比较。
除了交互式之外,还有哪些其他数据可视化技术?
交互式视觉效果只是增强数据可视化实践的方法之一。随着近期技术的进步,大数据可视化的效果将更加显著,也更加易于使用。以下是一些示例:
人工智能驱动的视觉生成
BI 解决方案可以拥有自然语言界面,允许用户输入或口述命令,描述他们想要获得的视觉效果。相同的功能也可用于调整新生成的输出或现有的视觉效果。您可以观看 ScienceSoft 的Power BI 聊天机器人演示,了解 AI 驱动的数据可视化在实践中的工作原理。
实时数据可视化
能够立即反映数据更新的仪表板固然很有吸引力,但您需要一个底层的实时大数据处理基础架构来实现它。性能、优化和延迟等因素至关重要,否则任何仪表板都无法有效地支持传入的数据。
VR和AR
这两种技术都能确保沉浸式体验。例如,可以将财务数据投影到物理空间。