Delta Lake / Apache Iceberg / Apache Hudi — Định dạng bảng cho Lakehouse
2026-03-172 phút đọc
Ba định dạng bảng cho Lakehouse: Delta Lake, Iceberg, Hudi. ACID, time travel, schema evolution và khi nào dùng cái nào.
5 posts

2026-03-17·2 phút đọc
Ba định dạng bảng cho Lakehouse: Delta Lake, Iceberg, Hudi. ACID, time travel, schema evolution và khi nào dùng cái nào.

2026-03-17·1 phút đọc
Curated Layer: đã làm sạch, chuẩn hóa, logic nghiệp vụ. Nguồn chính cho báo cáo, phân tích rủi ro, AI/ML, API. Join, enrich, quản trị schema.

2026-03-17·1 phút đọc
Analytics Layer: KPI tổng hợp cho dashboard, báo cáo, API. dbt, Trino, Spark. Partition, view tiền tổng hợp, SLA và phân quyền.

2026-03-17·2 phút đọc
Query Layer: cổng truy cập chính thức vào curated và analytics. Trino, DuckDB, Dremio. SQL chuẩn, federation, cache. Superset, Metabase. RBAC, row-level, audit.

2026-03-17·2 phút đọc
Consumption Layer: điểm tiêu thụ dữ liệu cho BI, ML, đối tác. Dashboard, báo cáo tự động, pipeline ML, API. Chính sách refresh, RBAC, MLflow, audit.