Delta Lake / Apache Iceberg / Apache Hudi — Định dạng bảng cho Lakehouse
2026-03-172 phút đọc
Ba định dạng bảng cho Lakehouse: Delta Lake, Iceberg, Hudi. ACID, time travel, schema evolution và khi nào dùng cái nào.
10 posts

2026-03-17·2 phút đọc
Ba định dạng bảng cho Lakehouse: Delta Lake, Iceberg, Hudi. ACID, time travel, schema evolution và khi nào dùng cái nào.

2026-03-17·2 phút đọc
Data versioning và time travel: đọc dữ liệu tại thời điểm quá khứ, debug pipeline, rollback, audit. So sánh Delta, Iceberg, Hudi.

2026-03-17·3 phút đọc
Schema evolution và enforcement: thay đổi cấu trúc bảng an toàn, mergeSchema, enforceSchema. Hỗ trợ Delta, Iceberg, Hudi và best practices.

2026-03-17·3 phút đọc
Tối ưu định dạng file trong Lakehouse: Parquet, Delta, Z-Ordering. Chi phí lưu trữ, hiệu năng truy vấn và best practices.

2026-03-17·3 phút đọc
Compaction và quản lý file trong Lakehouse: OPTIMIZE, VACUUM, ZORDER, lập lịch. Giảm file nhỏ và cải thiện hiệu năng truy vấn.

2026-03-17·3 phút đọc
Tối ưu bảng và clustering trong Lakehouse: partitioning, Z-Ordering, bucketing. Giảm thời gian scan và cải thiện hiệu năng truy vấn.

2026-03-17·3 phút đọc
Định dạng bảng và metadata trong Lakehouse: Delta, Iceberg, Hudi. ACID, time travel, schema evolution, tối ưu metadata.

2026-03-17·3 phút đọc
Bảo mật trong Lakehouse: mã hóa at-rest và in-transit, masking động, tokenization. PII, tuân thủ, audit.

2026-03-17·3 phút đọc
Metadata trong Lakehouse: metadata store, lineage, discovery, business glossary. Atlas, DataHub, OpenLineage.

2026-03-17·2 phút đọc
CDC: phát hiện và truyền thay đổi (insert/update/delete) từ DB nguồn sang warehouse hoặc lakehouse. Log-based, trigger, timestamp. Debezium, Airbyte.
Related Topics