使用Apache Hudi对数据湖的ACID遵从
Apache Hudi是一个开源的数据管理框架,用于简化增量数据处理和数据管道开发。该框架更有效地管理数据生命周期等业务需求,并提高数据质量。Hudi使您能够在分布式文件系统的记录级管理数据,以简化更改数据捕获(CDC)和流数据导入,并帮助处理需要记录级更新和删除的数据隐私用例。
Apache Hudi是一个开源的数据管理框架,用于简化增量数据处理和数据管道开发。该框架更有效地管理数据生命周期等业务需求,并提高数据质量。Hudi使您能够在分布式文件系统的记录级管理数据,以简化更改数据捕获(CDC)和流数据导入,并帮助处理需要记录级更新和删除的数据隐私用例。