Dataphin MCP:让数据查询 “轻而易举”

本文涉及的产品
智能数据建设与治理Dataphin,200数据处理单元
简介: Dataphin推出MCP服务,助力Agent高效获取数据,释放企业数据价值。

一、前言

在AI Agent蓬勃发展的当下,优质数据资产已然成为释放AI生产力的关键因素。Dataphin作为企业一站式数据建设和治理平台,拥有着庞大的元数据知识,包括逻辑模型、资产元数据信息、业务知识(标准、指标、码表)等。为了打开这座数据金库,Dataphin推出MCP服务,助力Agent高效获取数据。

二、什么是MCP?

MCP(Model Context Protocol)是由 Anthropic 公司提出的开源协议,旨在解决AI应用程序与外部数据源、应用的集成问题。在没有MCP之前,AI应用程序的开发者普遍通过Function Call的方式来与外部应用进行集成,普遍面临着如下困境:

  • 开发复杂度高:需要在应用中通过硬编码的方式适配不同平台的API,每一个任务都需要单独开发和维护;
  • 复用性低:每个集成模块通常是为特定任务定制的,缺乏通用性和可移植性,难以在其他项目中复用;

MCP定义了为大模型提供上下文的接口标准,使其能够无缝连接各种外部应用的数据,可以通过插拔式的配置决定AI应用是否集成某个应用,大大降低了开发成本,提高了可复用性。

三、Dataphin MCP

Dataphin MCP采用SSE(Server-Sent Events)协议,如下是对应的JSON配置:

{
  "mcpServers": {
    "Dataphin": {
      "url": "https://xxxxx/mcp/sse",
      "headers": {
        "Authorization": "Bearer xxxx"
      }
    }
  }
}


参数

说明

url

Dataphin实例的访问URL

Authorization

采用Bearer Token的认证方式,目前处于内测阶段,请联系Dataphin运维团队获取对应Token

Dataphin MCP目前提供两个与数据服务相关的Tools,分别为:

  • listDataServiceAPI: 根据所提供的应用,获取有权限调用的数据服务API信息,包括API ID、输入和输出参数、API调用文档等
  • invokeDataServiceAPI:调用数据服务API来获取数据

四、场景举例

作为行业360的开发人员,您通过Dataphin数据服务API来获取商品、用户、订单等数据。现在公司期望您能开发一款移动端的信息查询工具,让运营同学可以随时随地查询用户信息、订单数据等。您可以通过“大模型”+“Dataphin MCP”的方式,快速构建数据查询助手。演示如下:

  1. 创建一个“智能查询助手”,关联Dataphin MCP服务,如下是在阿里云百炼中开发智能体应用时,为该智能体快速配置MCP服务;

  1. 在右侧输入您的问题测试模型效果,以“帮我查询今年所有品类的销售额,同时查询销售额第一的品类中单品销量TOP1”问题为例。
  1. 首先,模型会调用listDataServiceAPI这个Tool以查询所有可调用的API;
  2. 然后,模型会根据可用的API名称、描述、入参等信息,规划出为了解决当前用户问题需要调用哪些API。在本问题中,模型从众多API中选择了两个API进行调用,并将调用结果呈现给用户,分别是:
  1. QueryTransactionByProductCategory:根据产品品类查询总交易额
  2. QueryProductSaleInCat:查询指定品类下每个商品的销售额。

image.png

--图中所有的数据都是模拟的演示数据,并不具备实际意义,如有侵权请联系删除。

五、结语

未来Dataphin将持续丰富和迭代MCP Server的工具集,包括数据研发、任务运维、数据治理等,有了这些工具您可以通过自然语言体验更多的场景,例如:

  • 查询项目A中的任务运行状态,并对失败实例进行批量重跑;
  • 在项目A中创建一个集成任务,其中数据来源于MySQL数据库test_mysql 的表customer ,同步到项目计算源中,并一键建表;
  • 创建一个规则强度为弱的质量规则,要求被监控字段需要满足国内有效的电话号码格式,同时将表customer的字段phone 作为监控对象;

......

目前Dataphin MCP处于公测阶段,如需使用欢迎联系我们,也欢迎提供您的场景和需求~

扫描下方二维码添加企业微信

image.png



相关文章
|
4月前
|
SQL 运维 自然语言处理
Dataphin智能化重磅升级!编码难题一扫光,开发运维更高效!
Dataphin重磅推出三大核心智能化能力:智能代码助手提升SQL开发效率;智能运维助手实现移动化任务管理;智能分析通过自然语言生成SQL,助力数据价值释放。未来将持续开放智能ETL、安全助手等能力,助力企业构建高效、稳定的数据资产体系。
424 0
|
6月前
|
数据可视化 数据挖掘 BI
指标透明化+管理敏捷化:Dataphin指标关系图与业务指标管理
通过Dataphin的业务指标定义和管理功能,业务人员能够以标准化方式快速创建业务指标并详细说明其详情,从而实现与技术人员的高效沟通,促进相关技术指标的快速开发。此外,业务人员还可以利用Dataphin的指标关系图功能,直观地理解指标的加工逻辑,并迅速定位异常数据根因,从而显著提高问题解决的效率。
309 8
|
5月前
|
运维 安全 关系型数据库
【产品升级】Dataphin V5.1版本发布:跨云数据集成、指标管理、平台运维带来重大更新!
V5.1版本新增多项功能:对接AWS生态(支持Amazon EMR、Redshift等),强化研发技术支撑(如API认证升级、全量任务隔离),完善运营消费链路(新增业务指标管理、指标关系图),提升平台综合能力(自定义菜单、缩短升级停机时间)。这些功能助力企业实现高效数据治理与分析,未来还将拓展智能化与国际化支持。
350 0
|
6月前
|
数据采集 存储 监控
星河中的数据旅程:从普通字段到核心指标 -- 基于Dataphin的数据源资产全链路管理
在数据星河中,Starrocks星球的字段居民渴望登上资产管理平台,贡献数据力量。通过元数据采集、标准稽核与质量监控,字段们获得新身份“核心业务指标”。借助Dataphin平台功能,如自定义属性和QuickBI对接,它们最终参与经营分析报表,助力决策。Dataphin V4.4提升了全链路管理能力,新增大数据存储元数据采集、自定义指标等功能,释放数据潜力。加入Dataphin,探索数据无限可能!
169 8
|
3月前
|
搜索推荐 数据管理
Dataphin功能Tips系列(70)自定义菜单:构建一站式数据管理平台
Dataphin通过自定义菜单功能,支持嵌入企业其他平台URL,实现统一的数据开发与管理平台,提升团队协作效率。
134 8
|
8月前
|
数据采集 SQL 人工智能
告别数据混乱:瓴羊Dataphin 通过AI+标准让企业数据“活”起来 | 【瓴羊数据荟】数据MeetUp第四期
AI技术的快速发展促使企业重新审视数据治理的重要性。当前,企业在数据治理中常因指标口径不统一、数据血缘不透明等问题陷入困境。阿里云智能集团瓴羊高级技术专家周鑫提出,以数据标准为核心贯穿数据全生命周期,可有效解决治理难题。
467 15
告别数据混乱:瓴羊Dataphin 通过AI+标准让企业数据“活”起来 | 【瓴羊数据荟】数据MeetUp第四期
|
4月前
|
数据可视化 Java 数据库连接
Dataphin JDBC:助您实现数据权限的集中管理
Dataphin JDBC提供了统一访问Dataphin中数据的功能,助您实现数据权限的集中式管理。
183 3
|
6月前
|
运维 监控
Dataphin V5.0:增全量一体实时集成
数据集成中,离线与实时方式各有优劣。为解决传统“全量+增量”双轨模式运维复杂的问题,Dataphin 5.0推出“全量+增量一体化实时同步”功能。用户仅需创建一个实时任务,即可完成整库或多表的数据迁移,系统自动协调全量与增量同步,简化管理并降低运维成本。该功能支持灵活配置启动范围与方式,提供实时监控及操作能力,大幅提升数据同步效率与稳定性。
209 41
|
3月前
|
SQL 数据管理 API
【产品升级】Dataphin V5.2 全新上线:四大能力升级,数据管理更统一、更智能!
Dataphin是阿里巴巴推出的数据建设与治理平台,提供全链路数据服务,助力企业构建标准化数据资产体系。V5.2版本新增“数据资产一站式运营平台”,引入X-数据管家、X-ETL等智能应用,提升数据运营效率。开发平台全面升级,支持多云复杂环境,强化API行级权限管控,保障数据安全。新版还适配国际化多时区场景,助力企业高效协同,释放数据价值。
343 9
|
6月前
|
SQL 存储 大数据
Dataphin V5.0:支持创建异步调用API,实现慢 SQL 复杂计算的直连消费
本文介绍了数据服务产品中异步调用的应用场景与优势,包括大数据引擎查询、复杂SQL及大规模数据下载等场景,解决了同步调用可能导致的资源浪费和性能问题。通过创建异步API、测试发布以及权限申请等功能,实现高效稳定的服务提供。以电商订单查询为例,展示了如何利用异步调用提升系统性能与用户体验。
221 9