《机器学习在线:解析阿里云机器学习平台》| 每天读本书

简介: 以机器学习中的典型案例为主线,条分缕析梳理阿里云的平台功能,讲解如何用阿里云的机器学习平台来实现各类应用。

机器学习在线:解析阿里云机器学习平台


内容简介:

以机器学习中的典型案例为主线,条分缕析梳理阿里云的平台功能,讲解如何用阿里云的机器学习平台来实现各类应用,包括商家作弊检测、生存预测、信用风险预测、用户购买行为预测等,并完整地介绍了机器学习的基本原理与实践技巧。

杨旭 著
电子工业出版社

image.png

图书试读:

飞速发展的互联网、物联网每时每刻都在产生大量的数据,数据的价值也因此被提升到前所未有的高度:越来越多的人投身数据分析的领域,希望通过机器学习及深度学习,从数据中获取更大的价值。另一方面,云计算的蓬勃发展极大地扩展了数据的存储能力,它使计算可以同时使用成百上千台机器,快速解决问题,而在计算完成后,又能及时释放掉资源,控制成本。

在这样的大背景下,机器学习算法平台也获得了飞速发展,积累了大量高效的机器学习算法组件,基于这些组件我们可以快速实现业务流程,解决具体问题。在为本书定书名时,受到王坚博士《在线》一书的影响,觉得用“在线”一词来说明目前机器学习平台的状态非常恰当:丰富的算法功能可以在线使用、不需要购买硬件、不需要安装配置各种环境;数据和计算资源一直处在“在线”状态,不必担心数据太大或计算资源不足的问题。

阿里云机器学习算法平台不仅在阿里集团内部使用,也已对阿里集团外部开放,读者可以通过阿里云官网试用或使用本书中介绍的功能。

机器学习平台提供了一个舞台,主角是其上面的近百种算法。本书的重点放在这些算法的使用上——通过实际的数据和具体的场景,帮助读者理解各算法所擅长处理的问题;另外,本书是根据机器学习的知识点由浅入深来逐步组织的,以降低阅读本书的门槛,使读者对所学的内容能产生清晰的印象。

在具体章节的组织上,阿里云机器学习平台的介绍占两个章节,即第1章和附录A。第1章为平台简介,在内容组织上尽量减少文字说明,将最基本的内容用图例来表示;附录A介绍了些琐碎但重要的事情,像如何试用、如何上传数据以及预处理函数的详细说明。第2章至第12章是按照机器学习的知识点逐步深入的思路来编排的。分类模型是机器学习理论和应用方面的重头,首先是数值类型特征的二分类模型、扩展特征的类型、多分类模型;之后介绍聚类模型;然后是回归模型;再后面介绍文本分析领域的应用(主题模型、向量化、关键词等),根据文本描述进行预测、情感分析,并以电影数据为例,搭建推荐系统。深度学习的内容放在第12章,围绕TensorFlow框架组件,介绍了一个能体现TensorFlow特点的Softmax模型的例子,然后介绍了使用深度学习DNN分类器的例子。

机器学习平台降低了我们使用机器学习知识的门槛,将各个算法作为组件,即使不了解其背后的理论知识,读者仍然可以仿照书中实例,将组件连接起来解决一些实际问题。希望本书能帮助读者在机器学习的实践中学习。

最后,感谢一起研发阿里云机器学习平台的各位同事!感谢家人的理解和支持!


杨旭
2017年7月

相关文章
|
2月前
|
存储 域名解析 弹性计算
阿里云上云流程参考:云服务器+域名+备案+域名解析绑定,全流程图文详解
对于初次通过阿里云完成上云的企业和个人用户来说,很多用户不仅是需要选购云服务器,同时还需要注册域名以及完成备案和域名的解析相关流程,从而实现网站的上线。本文将以上云操作流程为核心,结合阿里云的活动政策与用户系统梳理云服务器选购、域名注册、备案申请及域名绑定四大关键环节,以供用户完成线上业务部署做出参考。
|
8月前
|
存储 缓存 网络协议
阿里云特惠云服务器99元与199元配置与性能和适用场景解析:高性价比之选
2025年,阿里云长效特惠活动继续推出两款极具吸引力的特惠云服务器套餐:99元1年的经济型e实例2核2G云服务器和199元1年的通用算力型u1实例2核4G云服务器。这两款云服务器不仅价格亲民,而且性能稳定可靠,为入门级用户和普通企业级用户提供了理想的选择。本文将对这两款云服务器进行深度剖析,包括配置介绍、实例规格、使用场景、性能表现以及购买策略等方面,帮助用户更好地了解这两款云服务器,以供参考和选择。
|
8月前
|
弹性计算 运维 安全
优化管理与服务:操作系统控制平台的订阅功能解析
本文介绍了如何通过操作系统控制平台提升系统效率,优化资源利用。首先,通过阿里云官方平台开通服务并安装SysOM组件,体验操作系统控制平台的功能。接着,详细讲解了订阅管理功能,包括创建订阅、查看和管理ECS实例的私有YUM仓库权限。订阅私有YUM仓库能够集中管理软件包版本、提升安全性,并提供灵活的配置选项。最后总结指出,使用阿里云的订阅和私有YUM仓库功能,可以提高系统可靠性和运维效率,确保业务顺畅运行。
|
6月前
|
PyTorch 调度 算法框架/工具
阿里云PAI-DLC任务Pytorch launch_agent Socket Timeout问题源码分析
DLC任务Pytorch launch_agent Socket Timeout问题源码分析与解决方案
294 18
阿里云PAI-DLC任务Pytorch launch_agent Socket Timeout问题源码分析
|
6月前
|
机器学习/深度学习 人工智能 自然语言处理
阿里云人工智能平台 PAI 开源 EasyDistill 框架助力大语言模型轻松瘦身
本文介绍了阿里云人工智能平台 PAI 推出的开源工具包 EasyDistill。随着大语言模型的复杂性和规模增长,它们面临计算需求和训练成本的障碍。知识蒸馏旨在不显著降低性能的前提下,将大模型转化为更小、更高效的版本以降低训练和推理成本。EasyDistill 框架简化了知识蒸馏过程,其具备多种功能模块,包括数据合成、基础和进阶蒸馏训练。通过数据合成,丰富训练集的多样性;基础和进阶蒸馏训练则涵盖黑盒和白盒知识转移策略、强化学习及偏好优化,从而提升小模型的性能。
|
6月前
|
缓存 并行计算 测试技术
阿里云PAI-全模态模型Qwen2.5-Omni-7B推理浅试
阿里云PAI-全模态模型Qwen2.5-Omni-7B推理浅试
1351 12
|
8月前
|
运维 API 开发工具
【阿里云】操作系统控制台操作体验与性能评测全解析
操作系统控制台是现代云计算环境中进行系统管理和运维的重要工具,提供系统概览、诊断、观测、管理等功能,支持API、SDK、CLI等管理方式。通过创建角色、系统配置和组件安装等操作,用户可以高效管理云端资源,提升操作系统的使用效率和稳定性。尤其适合需要高效管理操作系统的用户及学习云计算、网络管理的学生。建议增强自定义功能、优化性能报告和完善文档支持,以进一步提升用户体验。
254 21
【阿里云】操作系统控制台操作体验与性能评测全解析
|
7月前
|
机器学习/深度学习 存储 Kubernetes
【重磅发布】AllData数据中台核心功能:机器学习算法平台
杭州奥零数据科技有限公司成立于2023年,专注于数据中台业务,维护开源项目AllData并提供商业版解决方案。AllData提供数据集成、存储、开发、治理及BI展示等一站式服务,支持AI大模型应用,助力企业高效利用数据价值。
|
8月前
|
存储 人工智能 云栖大会
【云栖大会】阿里云设计中心 × 教育部协同育人项目成果展,PAI ArtLab助力高校AIGC教育新路径
【云栖大会】阿里云设计中心 × 教育部协同育人项目成果展,PAI ArtLab助力高校AIGC教育新路径

热门文章

最新文章

推荐镜像

更多
  • DNS