一家美国大众传媒公司:数据管理的转变

更多

目标

• 作为中央自助服务接口和特定数据分析的存储库

•允许恢复和分析整个组织的数据

•满足不同利益相关者的数据需求并应对各种水平的技术熟练程度

•实现快速的业务洞察力和更深入的数据科学计划

挑战

• 当前数据存在于整个组织的孤岛中

• 不是通过自助服务进行恢复

• 背景和定义需要人工干预

工作流的核心

1.数据管理

目的是建立与“数据访问”方法和应用程序分开的“数据程序”例程和平台,以提高对分析平台能力的准备- 数据科学和机器学习。 

2.商业智能与分析

我们使用Tableau等表示层工具为数据可视化提供自助服务。我们构建了一个可以快速还原较小项目以实现任何业务需求的表示层。 

3.持续自动化和集成 

我们建立了以CI-CD为指导的数据提取、转换和加载例程,结合实施自动化测试,错误跟踪和警报以优化性能。

4.云端的基础架构 

我们建议建立一个既经济又具有竞争力的云端基础架构。可提供可扩展的基础结构以及ETL层和高性能商业智能。 

架构概观

分析平台背后的架构由基于云端产品和服务构建的定制组件组成。这些组件负责管理各种数据操作步骤,例如提取、转换和加载等。它们的构建方式使其可以轻松的在整个平台上重复使用,并相互连接以创建更复杂的管道。

您可以将这些组件视为独立的服务,这些服务可将数据从一个位置迁移到另一个位置,或者从一种格式更改为另一种格式。一个步骤的输出可以是另一步骤的输入,依此类推。通常,所有管道的构建方式都使数据最终存储在基于云端的数据仓库解决方案中,该解决方案使公司可以基于该数据进行查询和工作 - 即分析平台的主要业务目标。

Analytical Platform Architecture