Apache Doris 2.1.10 版本正式发布

本文涉及的产品
Redis 开源版,标准版 2GB
推荐场景:
搭建游戏排行榜
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
RDS MySQL Serverless 高可用系列,价值2615元额度,1个月
简介: 亲爱的社区小伙伴们,Apache Doris 2.1.10 版本已正式发布。2.1.10 版本对湖仓一体、半结构化数据类型、查询优化器、执行引擎、存储管理进行了若干改进优化。欢迎大家下载使用。

亲爱的社区小伙伴们,Apache Doris 2.1.10 版本已正式发布。2.1.10 版本对湖仓一体、半结构化数据类型、查询优化器、执行引擎、存储管理进行了若干改进优化。欢迎大家下载使用。

行为变更

  • Audit Log 中的 SQLHash 通过当前执行的 SQL 精确计算,解决了同一请求中所有 SQL 使用相同 SQLHash 的问题。
  • DELETE 不再错误的需要目标表的 SELECT_PRIV 权限
  • Insert Overwrite 不再限制对同一个表并发只能为 1
  • Merge on write unique 表禁止使用时序 compaction
  • 禁止在 VARIANT 类型上 build index

新功能

查询执行引擎

  • 支持了更多的 GEO 类型的计算函数 ST_CONTAINSST_INTERSECTSST_TOUCHESGeometryFromTextST_IntersectsST_DisjointST_Touches
  • 支持 years_of_week 函数

湖仓一体

  • Hive Catalog 支持 Catalog 级别的分区缓存开关控制

改进提升

湖仓一体

  • Paimon 依赖版本升级到 1.0.1
  • Iceberg 依赖版本升级到 1.6.1
  • 将 Parquet Footer 的内存开销纳入 Memory Tracker 管控,以避免可能的 OOM 问题
  • 优化 JDBC Catalog 的谓词下推逻辑,支持 AND/OR 等连接谓词的下推
  • 预编译版本默认携带 Jindofs 扩展包以支持阿里云 OSS-HDFS 访问

半结构化管理

  • ANY 函数支持 JSON 类型
  • JSON_REPLACEJSON_INSERTJSON_SETJSON_ARRAY 函数支持 JSON 数据类型和复杂数据类型

查询优化器

  • 当 in 表达式的 options 多于 Config.max_distribution_pruner_recursion_depth 时,不执行分桶裁剪,以提升规划速度

存储管理

  • 减少日志和改进部分日志

其他

  • 避免 Thrift RPC END_OF_FILE 异常

Bug 修复

01 湖仓一体

  • 修复某些情况下,在 Hive 侧新建表,Doris 侧无法立即查看到的问题
  • 修复某些 Text 格式 Hive 表访问报错 "Storage schema reading not supported" 的问题
  • 查看文档 get_schema_from_table 详情
  • 修复某些情况下,写入 Hive/Iceberg 表时,元数据提交并发问题
  • 修复某些情况下,写入存储在 oss-hdfs 上的 Hive 表失败的问题
  • 修复当 Hive 分区键值有逗号的情况下,访问失败的问题
  • 修复某些情况下,Paimon 表 Split 分配不均匀的问题
  • 修复读取存储在 OSS 上的 Paimon 表时,无法正确处理 Delete 文件的问题
  • 修复 MaxCompute Catalog 中,读取高精度 Timestamp 列时无法访问的问题
  • 修复某些情况下,删除 Catalog 可能导致部分资源泄露的问题
  • 修复某些情况下,读取 LZO 压缩格式的数据失败的问题
  • 修复某些情况下,ORC 延迟物化功能导致复杂类型读取错误的问题
  • 修复某些情况下,读取 pyorc-0.3 版本产生的 ORC 文件报错的问题
  • 修复某些情况下,EXPORT 操作导致元数据死锁的问题

02 索引

  • 修复多次添加、删除和重命名列操作后构建倒排索引的错误
  • 在 index compaction 中索引对应的列唯一 ID 的校验,避免潜在的数据异常和系统错误

03 半结构化数据类型

  • 修复某些情况下,VARIANT 类型转 JSON 类型返回 NULL 错误的结果
  • 修复某些情况下,JSONB CAST 导致 crash
  • 禁止在 VARIANT 类型上 build index
  • 修复 named_struct 函数 decimal 类型精度正确性

04 查询优化器

  • 修复常量折叠中的一些问题
  • 公共表达式提取在 lambda 表达式上可能工作异常
  • 修复消除 group by key 中的常量可能不能正常工作的问题
  • 修复在极端场景下,由于统计信息的推导错误,规划无法正常执行的问题
  • 修复部分依赖 BE 中元数据的 information_schema 表,不能获取完整数据的问题

05 查询执行引擎

  • 修复了找不到 explode_json_array_json_outer 函数的问题
  • 修复了 substring_index 不支持动态参数的问题
  • 修复了很多 st_contains 函数计算结果不对的问题
  • 修复了 array_range 函数可能导致的core的问题
  • 修复了 date_diff 函数计算结果错误的问题
  • 修复了一系列字符串函数在非 ASCII 编码下的乱码或者结果错误的问题

06 存储管理

  • 修复某些情况下,动态分区表(Dynamic Partition Table)回放元数据失败的问题
  • 修复 ARM 下 streamload 可能因为操作序列丢数据的问题
  • 修复 full compaction 报错以及可能导致 mow 数据重复的问题
  • 修复没有持久化分区 Storage Policy 的问题
  • 修复导入之后文件极小概率不存在的问题
  • 修复 CCR 和磁盘均衡并发可能导致的文件找不见问题
  • 修复备份恢复大快照时可能出现的 connection reset 问题
  • 修复 FE Follower 丢失本地备份快照的问题

07 其他

  • 修复某些场景下,审计日志可能丢失的问题
  • 修复审计日志中 isQuery 标记可能不正确的问题
  • 修复审计日志中部分查询 sqlHash 不正确的问题
目录
相关文章
|
3月前
|
消息中间件 OLAP Kafka
Apache Doris 实时更新技术揭秘:为何在 OLAP 领域表现卓越?
Apache Doris 为何在 OLAP 领域表现卓越?凭借其主键模型、数据延迟、查询性能、并发处理、易用性等多方面特性的表现,在分析领域展现了独特的实时更新能力。
276 9
|
2月前
|
存储 自然语言处理 分布式计算
Apache Doris 3.1 正式发布:半结构化分析全面升级,湖仓一体能力再跃新高
Apache Doris 3.1 正式发布!全面升级半结构化分析,支持 VARIANT 稀疏列与模板化 Schema,提升湖仓一体能力,增强 Iceberg/Paimon 集成,优化存储引擎与查询性能,助力高效数据分析。
387 4
Apache Doris 3.1 正式发布:半结构化分析全面升级,湖仓一体能力再跃新高
|
2月前
|
SQL 人工智能 数据挖掘
Apache Doris 4.0 AI 能力揭秘(二):为企业级应用而生的 AI 函数设计与实践
Apache Doris 4.0 原生集成 LLM 函数,将大语言模型能力深度融入 SQL 引擎,实现文本处理智能化与数据分析一体化。通过十大函数,支持智能客服、内容分析、金融风控等场景,提升实时决策效率。采用资源池化管理,保障数据一致性,降低传输开销,毫秒级完成 AI 分析。结合缓存复用、并行执行与权限控制,兼顾性能、成本与安全,推动数据库向 AI 原生演进。
227 0
Apache Doris 4.0 AI 能力揭秘(二):为企业级应用而生的 AI 函数设计与实践
|
3月前
|
存储 分布式计算 Apache
湖仓一体:小米集团基于 Apache Doris + Apache Paimon 实现 6 倍性能飞跃
小米通过将 Apache Doris(数据库)与 Apache Paimon(数据湖)深度融合,不仅解决了数据湖分析的性能瓶颈,更实现了 “1+1>2” 的协同效应。在这些实践下,小米在湖仓数据分析场景下获得了可观的业务收益。
697 9
湖仓一体:小米集团基于 Apache Doris + Apache Paimon 实现 6 倍性能飞跃
|
3月前
|
人工智能 运维 监控
智能运维与数据治理:基于 Apache Doris 的 Data Agent 解决方案
本文基于 Apache Doris 数据运维治理 Agent 展开讨论,如何让 AI 成为 Doris 数据运维工程师和数据治理专家的智能助手,并在某些场景下实现对人工操作的全面替代。这种变革不仅仅是技术层面的进步,更是数据运维治理思维方式的根本性转变:从“被动响应”到“主动预防”,从“人工判断”到“智能决策”,从“孤立处理”到“协同治理”。
501 11
智能运维与数据治理:基于 Apache Doris 的 Data Agent 解决方案
|
3月前
|
SQL 存储 运维
Apache Doris 在菜鸟的大规模湖仓业务场景落地实践
本文介绍了 Apache Doris 在菜鸟的大规模落地的实践经验,菜鸟为什么选择 Doris,以及 Doris 如何在菜鸟从 0 开始,一步步的验证、落地,到如今上万核的规模,服务于各个业务线,Doris 已然成为菜鸟 OLAP 数据分析的最优选型。
226 2
Apache Doris 在菜鸟的大规模湖仓业务场景落地实践
|
3月前
|
人工智能 自然语言处理 数据挖掘
Apache Doris 4.0 AI 能力揭秘(一):AI 函数之 LLM 函数介绍
在即将发布的 Apache Doris 4.0 版本中,我们正式引入了一系列 LLM 函数,将前沿的 AI 能力与日常的数据分析相结合,无论是精准提取文本信息,还是对评论进行情感分类,亦或生成精炼的文本摘要,皆可在数据库内部无缝完成。
215 0
Apache Doris 4.0 AI 能力揭秘(一):AI 函数之 LLM 函数介绍
|
4月前
|
SQL 人工智能 数据挖掘
Apache Doris + MCP:Agent 时代的实时数据分析底座
数据不再是静态的存储对象,而是流动的智能资源;数据库不再是单纯的存储系统,而是智能化的服务平台。Apache Doris 以其在 AI 方向的深度布局和技术创新,正在成为连接数据与智能的重要桥梁。
1041 0
Apache Doris + MCP:Agent 时代的实时数据分析底座
|
3月前
|
存储 人工智能 Apache
ApacheCon 2025中国开源年度报告:Apache Doris 国内第一
在 Apache 基金会管理的近 300 个顶级项目中,Doris 已经成为仅次于 Apache Airflow 的全球第二大影响力项目。
184 0

推荐镜像

更多