魔搭中文开源模型社区:模型即服务-大模型驱动的自然语言开放生态(下)

本文涉及的产品
模型在线服务 PAI-EAS,A10/V100等 500元 1个月
模型训练 PAI-DLC,100CU*H 3个月
交互式建模 PAI-DSW,每月250计算时 3个月
简介: 魔搭中文开源模型社区:模型即服务-

二、 丰富的自然语言算法模型和应用

 

image.png

 

如上图所示,命名实体识别任务(NER)的目的是识别出文本中的核心短语,如新闻领域中的人名、地名、组织名等。在解决实体识别问题中,其核心问题是引入新的信息或知识。

 

阿里云通过获取文本相关的额外知识,来补齐文本中的缺失信息,以此来提升NER的性能。

 

从2021年开始,阿里云提出隐式增强技术,通过动态融合不同预训练模型的知识,NER在六大词法分析任务中,横跨了24个公开数据集,超过业界所有SOTA。

 

在此基础之上,阿里云进一步提出显式上下增强技术,通过检索搜索引擎、相关文本、去躁文本等操作,来进一步提升原始模型的能力。相关工作发表在ACL 2021。

 

在2022年,阿里云再此基础上进行推广,提出的“知识检索技术”在全球规模最大的语义评测SemEval 2022大赛多语言NER的13个赛道中,取得10个第一,并斩获唯一的最佳系统论文奖。

 

image.png

 

在文本分类方面,阿里云基于预训练模型,构建了多维感知器,进行文本分类。多维感知器能够无监督的学习文本中的关键信息,使分类结果更具有可解释性。

 

阿里云多维感知器不仅在中文的自然语言理解任务中,取得了三榜第一。而且把它应用在外呼意图识别、司法分类等环节。目前,ModelScope上相关模型有情感分类、外呼意图识别、零样本分类等等。

 

image.png 

 

如上图所示,阿里云基于对话问答Space序列,上线了意图分类模型。大家可以通过数据扫描,进行意图分类、回复生成、任务推理,代码可复现等等。

 

在表格问答方面,阿里云预制了一些表格问答的预算模型,大家可以直接在ModelScope社区体验。

 

image.png

 

OCR是文字光学字符识别,文档理解非常重要的技术。阿里云将视觉和语言联合建模,通过视觉的二维信息和语言的上下文信息,更好的理解文档或表格中的文字边界,进一步识别文字。

 

image.png

 

与此同时,阿里云对表格结构进行检测与重建,上线了一些基础模型,包括文字检测识别、表格检测识别、中英文表格识别等等。

 

image.png

 

在机器翻译方面,阿里云最新自研的连续语义增强机器翻译模型。获得了自然语言处理顶ACL 2022的最佳论文奖。目前,该模型已开源部署在ModelScope社区。

 

image.png

 

目前,在ModelScope社区上线的机器翻译主要是中英、英中、英法、法英的双向模型。开源模型包含5.7亿参数,翻译质量达到业内第一梯队训练数据包括UN、WMT21、OPUS等,规模达到3亿以上。

 

image.png

 

自然语言理解是从感知智能进化到认知智能的重要阶段,也是形成决策智能的重要基石。阿里云在ModelScope上提供了structBertPALMmPLUG中文基础模型等预训练模型底座,共计100+NLP应用模型。

 

这些模型涵盖了分词,词性,命名实体识别等基础技术,以及文本分类,情感分类,对话问答,OCR机器翻译等应用技术。涵盖了通用,新闻,电商,医疗等多领域。支持中,英,法,西等10多种语言模型。阿里云达摩院为大量的应用场景,提供了丰富易用,性能领先的模型库。

 

相关文章
|
1月前
|
人工智能 自然语言处理 IDE
模型微调不再被代码难住!PAI和Qwen3-Coder加速AI开发新体验
通义千问 AI 编程大模型 Qwen3-Coder 正式开源,阿里云人工智能平台 PAI 支持云上一键部署 Qwen3-Coder 模型,并可在交互式建模环境中使用 Qwen3-Coder 模型。
420 109
|
18天前
|
分布式计算 测试技术 Spark
科大讯飞开源星火化学大模型、文生音效模型
近期,科大讯飞在魔搭社区(ModelScope)和Gitcode上开源两款模型:讯飞星火化学大模型Spark Chemistry-X1-13B、讯飞文生音频模型AudioFly,助力前沿化学技术研究,以及声音生成技术和应用的探索。
117 2
|
18天前
|
人工智能 Java API
AI 超级智能体全栈项目阶段一:AI大模型概述、选型、项目初始化以及基于阿里云灵积模型 Qwen-Plus实现模型接入四种方式(SDK/HTTP/SpringAI/langchain4j)
本文介绍AI大模型的核心概念、分类及开发者学习路径,重点讲解如何选择与接入大模型。项目基于Spring Boot,使用阿里云灵积模型(Qwen-Plus),对比SDK、HTTP、Spring AI和LangChain4j四种接入方式,助力开发者高效构建AI应用。
682 122
AI 超级智能体全栈项目阶段一:AI大模型概述、选型、项目初始化以及基于阿里云灵积模型 Qwen-Plus实现模型接入四种方式(SDK/HTTP/SpringAI/langchain4j)
|
2月前
|
存储 人工智能 自然语言处理
告别文字乱码!全新文生图模型Qwen-Image来咯
通义千问团队开源了Qwen-Image,一个20B参数的MMDiT模型,具备卓越的文本渲染和图像编辑能力。支持复杂中英文文本生成与自动布局,适用于多场景图像生成与编辑任务,已在魔搭社区与Hugging Face开源。
459 2
|
26天前
|
机器学习/深度学习 人工智能 自然语言处理
迁移学习:让小数据也能驱动AI大模型
迁移学习:让小数据也能驱动AI大模型
233 99
|
21天前
|
机器学习/深度学习 人工智能 自然语言处理
AI Compass前沿速览:Qwen3-Max、Mixboard、Qwen3-VL、Audio2Face、Vidu Q2 AI视频生成模型、Qwen3-LiveTranslate-全模态同传大模型
AI Compass前沿速览:Qwen3-Max、Mixboard、Qwen3-VL、Audio2Face、Vidu Q2 AI视频生成模型、Qwen3-LiveTranslate-全模态同传大模型
248 13
AI Compass前沿速览:Qwen3-Max、Mixboard、Qwen3-VL、Audio2Face、Vidu Q2 AI视频生成模型、Qwen3-LiveTranslate-全模态同传大模型
|
17天前
|
自然语言处理 机器人 图形学
腾讯混元图像3.0正式开源发布!80B,首个工业级原生多模态生图模型
腾讯混元图像3.0,真的来了——开源,免费开放使用。 正式介绍一下:混元图像3.0(HunyuanImage 3.0),是首个工业级原生多模态生图模型,参数规模80B,也是目前测评效果最好、参数量最大的开源生图模型,效果可对…
357 2
腾讯混元图像3.0正式开源发布!80B,首个工业级原生多模态生图模型
|
26天前
|
机器学习/深度学习 算法 数据可视化
从零开始训练推理模型:GRPO+Unsloth改造Qwen实战指南
推理型大语言模型兴起,通过先思考再作答提升性能。本文介绍GRPO等强化学习算法,详解其原理并动手用Qwen2.5-3B训练推理模型,展示训练前后效果对比,揭示思维链生成的实现路径。
208 1
从零开始训练推理模型:GRPO+Unsloth改造Qwen实战指南
|
2月前
|
人工智能 算法 测试技术
轻量高效,8B 性能强劲书生科学多模态模型Intern-S1-mini开源
继 7 月 26 日开源『书生』科学多模态大模型 Intern-S1 之后,上海人工智能实验室(上海AI实验室)在8月23日推出了轻量化版本 Intern-S1-mini。
538 50

相关产品

  • 自然语言处理