数据湖是一个集中式存储库,可引入和存储大量原始格式的数据。然后,可以处理数据并将其用作各种分析需求的基础。由于数据湖是开放的可缩放体系结构,因此可以容纳从结构化源(数据库表、Excel 工作表)到半结构化源(XML 文件、网页)到非结构化源(图像、音频文件、推文)等任何源的所有类型的数据,而不会牺牲保真度。数据文件通常存储在分阶段的区域中(原始区、清理区和精选区),以便不同类型的用户可以使用各种格式的数据来满足其需求。数据湖在各种应用程序中提供核心数据一致性,为 大数据分析、 机器学习、预测分析和其他形式的智能操作提供支持。
借助架构良好的解决方案,创新的潜力是无限的。下面只是举例说明各行各业的组织如何使用数据湖平台来优化其增长:
数据湖用例
想了解更多关于什么是数据湖?的内容,请扫微信
或微信搜索jiemingpan
本文链接:http://www.soufuzi.com/yunying/1848