GBase 8a数据库的智能索引详解 介绍

发布时间:2026/5/29 22:40:08

GBase 8a数据库的智能索引详解 介绍 南大通用GBase 8a数据库gbase database智能索引也称 DC 索引是自动生成、粗粒度、基于数据块统计信息的轻量级索引核心作用是过滤无关数据块、减少解压与 I/O全程无需人工维护。一、基本结构数据按65536 行切分为一个 DCData Cell数据包。每列、每个 DC 自动生成智能索引记录数值列最小值、最大值、和、NULL 数、唯一值数。字符列前 8 字符的最值、NULL 数等。索引体积极小约为数据的 1%远小于传统索引20%–50%。二、工作流程查询时分区裁剪先过滤不相关分区。智能索引过滤核心对每个 DC用索引里的 Min/Max 与查询条件比对条件 col 100某 DC 最大值 80 → 直接跳过不解压。条件范围与 DC 范围有交集 → 进入下一步。3.聚合加速简单聚合SUM/COUNT可直接用索引统计值计算无需解压整包。4.解压计算仅对无法过滤的 DC 解压完成剩余计算。三、核心优势全自动数据加载时自动创建、自动更新零运维。高过滤范围 / 等值查询均可大幅减少扫描数据量。低成本空间占用极低不影响写入性能。适配列存与列存、压缩、延迟物化协同适合海量分析场景。四、总结智能索引就是给每个 64K 行数据块贴一个 “数据范围标签”查询时先看标签不符合条件直接跳过不解压、不读盘从而极大提升大表查询速度。

相关新闻