运营分析

运营分析的未来

在facebook上分享
在twitter上分享
分享在linkedin
在whatsapp分享

可视化工具的挑战

在过去的几年里,许多企业都擅长于构建大规模的数据平台,这些平台能够吸收和处理大量的结构化和非结构化数据,并将信息传递给数据消费者。所有这些信息的业务价值来自于使用数据来生成更好的决策见解,以及通过将模型嵌入操作系统来自动化决策。

我们见证了构建数据平台的许多架构转变,其中之一是Tableau和Looker等自助工具的兴起。这使得非技术用户能够通过连接任何数据源和动态地进行数据准备来独立进行分析。此外,这些工具还创造了像素完美的仪表板,并提供了漂亮的图表和表格展示。

随着这些自助服务可视化工具的广泛使用,我们看到了一个有趣的悖论:所有这些现成的信息海洋并不能带来更高的使用率和更好的决策。

这可能有很多原因。

首先是仪表盘的数量过多,导致信息过载.我们通常会看到企业有成千上万的仪表盘,其中很多都没有使用过。其中许多都有隐藏的数据管道和非标准的指标和属性。这降低了用户对这些仪表板中可用信息的信任。

另一个重要的原因可能是过多的信息流畅性.研究表明,非常高水平的信息流利并不总是导致更好的行动或任何行动。数据越容易阅读(设计良好的表格和图表),你对这些信息的操作就越少。人们只有在努力获取信息时才能理解信息。用数据做事情的秘诀就是玩它。为了让人们根据信息采取行动,需要有一点信息不流利(不是太多)。

这有点微妙,但这并不意味着你需要让用户很难获得他们想要的数据。但是,您必须为用户提供一个环境,以便在干净、集成和协调的基础信息之上构建他们自己的见解。今天的可视化工具非常适合执行人员讲故事,但它们不是操作用户的答案。随着功能的增加,非技术用户发现这些工具对他们来说变得非常复杂。

一个简单的操作分析工具

在La188bet金宝搏彩票tentView Analytics,我们开发了一个自助数据平台,并成功地将其部署到我们的客户。我们没有提供对数百个仪表板的访问,而是提供了一个工具,帮助用户使用他们理解的业务语义指定他们需要的各种数据段。此外,该应用程序使用简单,可视化都是表格形式的,可以导出到客户端选择的任何其他工具进行进一步分析。

这个工具已经获得了巨大的成功——它已经在所有层面上导致了显著的病毒式采用,导致了更好的数据使用,有传闻证据表明改进了决策和更好地获取信息。此外,用户有巨大的内部需求,以使业务的其他部分可用,特别是那些淹没在太多的仪表盘和SQL访问数据湖。

在一家《财富》100强公司的六个月内,它通过实现大规模数据民主化的承诺,每年帮助他们节省了数百万美元。

基本设计原则

我们在设计工具时遵循以下设计原则:

  • 便于非技术人员使用用户:基于浏览器的应用程序的基本界面,具有逻辑组织的选项卡和为不同用户组定制的智能默认值
  • 操作用户的简约界面:没有花哨的图表、图形或其他可视化,而是通过浏览器界面提供的简单表格
  • 复杂但极简的界面:具有非常友好的用户界面,许多高级特性将强大的分析能力交付给用户,从而提供有价值的/相关的见解,而不是预定义的参数仪表板
  • 透明的数据模型:每个有边界上下文的所有必要数据的单一逻辑视图(示例包括客户关系管理、收益管理和类别管理);没有杂乱的连接和分区
  • 可扩展:有能力支持一个庞大而不断增长的no。企业生态系统中并发用户的数量(数万),因为这是为了利用云而构建的
  • 快速:与传统报表平台相比,从TBs数据开始的批量数据分析延迟较低
  • 成本效益:没有复杂的许可成本,低运营成本,持续升级。我们计划用最小的特性集保持工具的简单性
  • 快速部署:一旦用例完成,产品原型可以在2-3周内进行定制和部署

快速浏览一下

让我们快速浏览一下运营分析工具是什么样子的。为了便于导航,分析工具中的功能被分组到各种选项卡中。顶部面板显示了选项卡之间的选择。管理员可以(通过管理用户界面)根据用户角色和用户可以访问的域上下文配置每个选项卡。

Dimensions选项卡允许用户选择在最终报告中显示的关键维度。可以查看、分解和比较非数字数据(例如人员、地点和产品)。这些都是完全可配置的。

指标

指标是可以在报告中显示的数值。这些值可以被查看,分解,并用于计算(包括销售$,数量案例,GP%,成本)。如果你会数学,它可能是一个度量。

计算

使用基本计算应用数学运算符(如加或乘)来构建我们所选择的定制度量。计算和SQL操作可以应用于任何度量字段。

报告分享

通过报表共享功能,用户可以创建报表,并立即共享给指定的用户或用户组。报表共享,采用严格的认证授权原则,保证数据的私密性和安全性。

术语表

它是面向最终用户的所有维度和度量数据定义的单一视图。

其他功能

还有其他一些特性,特别是对于管理员来说。例如,该工具允许管理员查看使用情况,并根据每日负载验证数据质量。下面是一些可用的关键特性。

  • 保存报告:一旦构建报告并生成输出,就可以将其保存并重新加载以供以后使用
  • 过滤器/阈值:添加过滤器以基于需求或限制结果的阈值来缩小分析范围
  • 下载报告:一旦构建并提交了查询,结果就可以导出到Excel或CSV进行进一步分析。它还允许为构建的查询导出SQL。
  • 进度报告:还可以按照计划的频率(如每日、每周或每月)调度已保存的报表。报告将根据时间表通过电子邮件发送给用户。

我们是如何建造它的

简单的设计背后是复杂的架构。这结合了数据湖和数据仓库的优势,创建了一个干净、集成和可扩展的数据基础。数据模型是非规范化的,可以针对常见的消费模式进行优化。此外,应用程序是由边界上下文划分的,所有内容都是针对每个上下文定制的。

数据平台以以下安全且可扩展的方式作为DaaS(数据即服务):

  • 它被设计用于服务企业域中不同的边界上下文。这使我们能够将数据作为服务交付给业务领袖、功能分析师、销售人员和数据科学家(毫无疑问)。
  • 它是一个无服务器交互查询栈,使用AWS组件,如AWS Lambda, AWS S3, AWS Cognito, API Gateway, Simple Queuing Service, DynamoDB和Redshift
  • 它使用双模式架构(简单查询和复杂查询)来实现这一点。如果查询的预期运行时间(根据历史数据和查询解析计算)小于30秒,它将启动简单堆栈。如果不是,则进入复杂堆栈。
  • 客户端的查询请求JSON (JavaScript对象表示法)通过安全的HTTP发送到AWS Lambda认证(AWS Cognito)和HTTP分发(AWS API网关)
  • 一个符合ANSI SQL的查询将基于请求JSON构造,并准备好访问数据库。查询被提交到高可用的FIFO(先进先出)队列,SQS(简单排队服务)与客户端现有的HTTP连接解耦
  • 查询消息的智能消费者确定访问数据库的正确时间(Redshift)。正确的时间由VPC(虚拟私有云)中Redshift和ip的可用性决定。这是很多工程奇迹发生的地方
  • 分派的查询在Redshift集群中执行,来自S3的客户端使用一个预先签名的URL来使用结果
  • 虽然该平台目前构建在AWS上,但它也可以部署在任何云服务平台上,比如Azure和GCP
体系结构
图1:体系结构
简单Vs复杂11 11 1
图2:简单与复杂

该体系结构的一个令人兴奋的部分是,它可以使用恒定轮询机制有效地处理Lambda和API超时的限制,从而为执行长时间运行的查询创造了可能性。

让我们知道你对建筑的看法。如果您想了解我们的业务以及我们如何帮助您的业务,请与LatentView Analytics的数据工程团队联系188bet金宝搏彩票金博宝188可靠吗marketing@latentview.com