• 收藏

  • 加书架

  • 引用

简介

在数据湖仓的所有新增要素中,排名第一的就是可以利于数据分析和机器学习所用的分析基础设施。分析基础设施包括一众大家广为熟悉的东西,当然也包括一些可能对大家还有些陌生或略带新鲜感的概念。比如包括:元数据、数据血缘、 数据体量的度量 、数据创建的历史记录、数据转换描述。 数据湖仓的第二个新增要素,是识别和使用通用连接器。通用连接器允许合并和比较所有不同来源的数据。如果没有通用连接器,就很难(实际上是几乎不可能)将数据湖仓中的不同数据关联起来。但有了这个中西,就可以关联任何类型的数据。 使用数据湖仓,就有可能实现以往任何其它方式都不可行或不可能实现的某种程度的数据分析和机器学习。 但与其它架构一样,我们需要理解数据湖仓的架构以及它的能力,以便于我们基于这种架构创建数据分析蓝图和开展数据分析规划。

编辑推荐

超越数据库与数据湖,新一代数据管理的新模式——数据湖仓为数据分析带来新变革,为更有效、更便捷、更科学、更可靠、更灵活的数据分析提供基础。

更多出版物信息
  • 版权: 清华大学出版社
  • 出版: 2023-03-01
  • 作者:(美)比尔·恩门(Bill Inmon),(美)玛丽·莱文斯(Mary Levins),(美)兰吉特·斯里瓦斯塔瓦(Ranjeet Srivastava)著;上海市静安区国际数据管理协会译
  • 更新: 2023-10-18
  • 书号:9787302624479
  • 中图:TP274
  • 学科:
    工学
    控制科学与工程
    工学
    计算机科学与技术

作者信息

(美)比尔·恩门(Bill Inmon),(美)玛丽·莱文斯(Mary Levins),(美)兰吉特·斯里瓦斯塔瓦(Ranjeet Srivastava)著;上海市静安区国际数据管理协会译

胡博,国际数据管理协会(DAMA)中国理事,国家重点研发计划课题负责人。发表过学术论文20余篇,在云平台、数据中台等方面授权国家发明专利12项;是中国计算机学会高级会员、中国计算机协会服务计算专委会执行委员、SCI期刊IJWSR 执行主编、华中农业大学、深圳大学、武汉科技大学和海南师范大学硕士生导师。

相关图书