[2020年5月12日,北京] 亚马逊云服务Amazon Web Services, Inc. (AWS) 今天宣布,Amazon SageMaker在由西云数据运营的AWS中国 (宁夏) 区域和光环新网运营的AWS中国(北京)区域正式上线。Amazon SageMaker 是一项完全托管的服务,可以帮助开发者和数据科学家快速地规模化构建、训练和部署机器学习 (ML) 模型。Amazon SageMaker在中国的上线还使中国客户获得一系列新发布的工具,例如弹性Notebook、实验管理、模型自动创建、模型调试分析,以及模型概念漂移检测等强大功能,所有这些工具都封装在首个面向机器学习的集成开发环境(IDE) Amazon SageMaker Studio中。进一步了解Amazon SageMaker,请访问: https://www.amazonaws.cn/sagemaker/。
机器学习的实施是一项非常复杂的工作,涉及大量试错,并且需要专业技能。开发者和数据科学家首先必须对数据进行可视化、转换和预处理,这些数据才能变成算法可以使用的格式,用以训练模型。即使是简单的模型,企业也需要花费庞大的算力和大量的训练时间,并可能需要招聘专门的团队来管理包含多台GPU服务器的训练环境。从选择和优化算法,到调节影响模型准确性的数百万个参数,训练模型的所有阶段都需要大量的人力和猜测。然后,在应用程序中部署训练好的模型时,客户又需要另一套应用设计和分布式系统方面的专业技能。并且,随着数据集和变量数的增加,模型会过时,客户又必须一次又一次地重新训练模型,让模型从新的信息中学习和进化。所有这些工作都需要大量的专业知识,并耗费庞大的算力、数据存储和时间成本。而且,由于没有集成化的工具用于整个机器学习的工作流,机器学习模型的传统开发方式是复杂、繁复和昂贵的。
Amazon SageMaker消除了机器学习过程中各个步骤的繁重工作。通过预置的Notebook、针对PB级数据集优化的常用算法,以及自动模型调优,Amazon SageMaker大大降低了模型构建和训练的难度。并且,Amazon SageMaker显著简化和加快了模型训练过程,可以通过自动提供和管理基础设施来训练模型和运行推理。同时,AWS 最近宣布了多项重要功能和高级特性,让客户能够更轻松地构建、训练、调优和部署机器学习模型。这些功能包括:
面向机器学习的集成开发环境(IDE):Amazon SageMaker Studio将所有用于机器学习的组件集中在一个地方。跟使用集成开发环境(IDE)做软件开发一样,开发者现在可以在Amazon SageMaker Studio中查看和组织源代码、依赖项、文档和其它应用程序资产,例如用于移动应用程序的图像。当前,机器学习工作流有大量组件,其中许多组件都带有它们自己的一组各自独立的工具。Amazon SageMaker Studio IDE为所有Amazon SageMaker功能和整个机器学习工作流提供了一个统一界面。Amazon SageMaker Studio为开发者提供了创建项目文件夹、组织Notebook和数据集,以及协作讨论Notebook和结果的功能。Amazon SageMaker Studio使构建、训练、解释、检查、监视、调试和运行机器学习模型变得更简单、更快。
弹性笔记本:Amazon SageMaker Notebooks提供了一键启用的Jupyter Notebook,具有秒级的弹性计算提升能力。Notebooks包含了运行或重新创建机器学习工作流所需的一切要素。在此之前,要查看或运行Notebook,开发者需要在Amazon SageMaker中启动计算实例。如果他们发现需要更多的算力,必须启动一个新实例,转移Notebook,关闭旧实例。而且,由于Notebook与计算实例是耦合的,通常存在于开发者的工作站上,其共享和迭代协作很不容易。Amazon SageMaker Notebooks提供了弹性的Jupyter Notebook,让开发者可以轻松地调高或降低Notebook需要的算力(包括GPU加速)。这些调整在后台自动发生,不会打断开发者的工作。开发者不再需要浪费时间来关闭旧实例、在新实例中重新创建所有工作,从而可以更快地开始构建模型。Amazon SageMaker Notebook还可以自动复制特定环境和库依赖项,实现Notebook一键共享。这将使构建模型的协作变得更容易,比如,一个工程师可以很容易地将手头工作共享给其他工程师,让他们在现有工作的基础上构建模型。
实验管理:Amazon SageMaker Experiments可以帮助开发者组织和跟踪机器学习模型的迭代。机器学习通常需要多次迭代,目的是隔离和衡量更改特定输入时的增量影响。这些迭代过程可能会生成数百个实验构件,如模型、训练数据和参数设置。但是,开发者目前缺乏一个便利的实验管理机制,甚至不得不依赖电子表格来跟踪实验,手动对这些构件进行排序,以了解对应的影响。Amazon SageMaker Experiments自动捕获输入参数、配置和结果,并将它们存储为“实验”,帮助开发者管理这些迭代。开发者可以浏览活跃的实验,根据特征搜索以前的实验,回顾以前的实验结果,还能用可视化的方式比较实验结果。Amazon SageMaker Experiments也保留了实验的完整谱系,如果一个模型开始偏离其预期结果,开发者可以及时回溯和检查。因此,Amazon SageMaker Experiments使开发者更容易快速迭代和开发高质量的模型。
调试与分析:Amazon SageMaker Debugger用于调试和分析模型训练,提高准确性,减少训练时间,让开发者更好地理解模型。当前,机器学习训练过程基本上是不透明的,训练时间可能很长、很难优化;而且,往往就像一个“黑箱”,解读和解释模型都很困难。使用Amazon SageMaker Debugger,在Amazon SageMaker中训练的模型将自动发出收集到的关键指标,这些指标可以在Amazon SageMaker Studio中查看,也可以通过Amazon SageMaker Debugger的API查看,为训练的准确性和性能提供实时反馈。当检测到训练问题时,Amazon SageMaker Debugger会提供警告和补救建议。Amazon SageMaker Debugger也可帮助开发者解读模型是如何工作的,向神经网络的可解释性迈出了第一步。
自动构建模型:Amazon SageMaker Autopilot是业内首个可以让开发者对其模型保持控制和可见性的自动化机器学习功能。当前的机器学习自动化方法,在创建初始模型方面做得不错,但是对于如何创建模型、模型中包含什么内容,并没有数据提供给开发者。因此,如果模型达不到期望,开发者想要改进它,就没有什么办法了。此外,当前的机器学习自动化服务只给客户一个简单的模型。有时客户希望做出一些取舍,例如以某个版本的模型牺牲一点准确性,以换取更低延迟的预测。但是如果客户只有一个模型可用,就没有这样的可选项。Amazon SageMaker Autopilot会自动检查原始数据,应用特征处理器,挑选最佳算法集,训练多个模型,对它们进行调优,跟踪其性能,然后根据性能对模型进行排名。点击几下鼠标,用户可以得到用于部署的、性能最佳的模型推荐,而这只需很少一点时间和精力用于训练。并且,用户可以清楚地看到模型是如何创建的,以及模型中包含什么内容。缺乏机器学习经验的人可以使用Amazon SageMaker Autopilot轻松地生成仅基于数据的模型,经验丰富的开发者可以使用它快速开发基础模型,团队可以在此基础上进行进一步迭代。Amazon SageMaker Autopilot为开发者提供了多达50种不同的模型,可以在Amazon SageMaker Studio中查看。因此,开发者能够针对应用场景选择最佳模型,并且可以结合不同的优化因子考虑多个候选模型。
概念漂移检测:Amazon SageMaker Model Monitor允许开发者检测和纠正概念漂移(concept drift)。影响部署到生产环境后的模型的准确性的一大因素就是生产环境中的输入数据开始不同于模型训练所使用的数据集,从而影响预测结果,例如经济状况改变导致的新利率会影响国内采购预测,季节变化带来不同的温度、湿度和空气压力会影响设备维护时间表的预测,等等。如果输入数据开始出现这样的差异,就会导致所谓的“概念漂移”,即模型用于预测的模式不再适用。Amazon SageMaker Model Monitor自动检测模型部署中的概念漂移。Amazon SageMaker Model Monitor在训练期间创建一组关于模型的基线统计数据,将用于预测的数据与训练基线进行比较。当检测到漂移时,Amazon SageMaker Model Monitor会向开发者发出告警,并帮助他们直观地确定原因。开发者可以使用Amazon SageMaker Model Monitor的开箱即用功能立即检测漂移,也可以为Amazon SageMaker Model Monitor编写自己的规则用于监测。Amazon SageMaker Model Monitor让开发者更容易调整训练数据或算法以解决概念漂移问题。
“国内越来越多的企业正在探讨机器学习和人工智能技术带来的巨大潜力,探索如何把这些技术融入到日常应用当中。但实际上,除了少数具有专家人才和数据科学家的企业外,大部分公司还是很难应用机器学习这项技术,因此客户希望我们可以让这项技术变得更方便、更易用。”AWS全球副总裁及大中华区执行董事张文翊表示,“AWS提供了广泛、深入的机器学习和人工智能服务。Amazon SageMaker在AWS中国(宁夏)区域和AWS中国(北京)区域上线,将帮助更多中国客户去除机器学习涉及的混乱和复杂性,让他们能够胜任构建、训练和部署模型的工作,以应对新的挑战。”
全球已有数以万计的客户利用Amazon SageMaker加快机器学习部署, Autodesk、Change Healthcare、拜耳、英国航空、盖洛普、洛杉矶快船队、松下航空电子(Panasonic Avionics)、环球邮报和T-Mobile等等。中国客户如虎牙、大宇无限、嘉谊互娱、华来科技等也已选择Amazon SageMaker大规模地构建、训练和部署机器学习模型。
大宇无限是一家专门从事移动应用程序开发的公司,主要为中东、东南亚和拉丁美洲等新兴市场提供移动短视频服务。大宇无限技术副总裁刘克东表示:“在大宇无限的产品中实现视频内容的在线推荐,对我们的开发团队来说是一个巨大的挑战。构建机器学习系统的整个流程极为复杂,需要大量的开发者耗费很长的时间才有可能完成。Amazon SageMaker极大地简化了机器学习系统的构建、训练和部署流程,使我们无需构建基础设施,我们的算法工程师只需为Amazon SageMaker准备数据,仅用了三个月的时间就从零完成了整个系统的建设并承受了实际用户访问的压力。”
借助AWS提供的Amazon EC2 GPU实例和Amazon SageMaker,华来科技以优化的成本将机器学习创新融合到其智能家居、智慧安防设备和服务中。天津华来科技有限公司云业务部总监季宝平说:“在AWS上,我们可以完成算法的构建和模型训练,并且该过程完全不需要我们在本地投资昂贵的计算硬件,一切都是在云端以按需使用的方式完成。与行业通用的公开算法不同,更重要的是我们自己训练的模型在应用场景中具有更多个性化空间,并且我们对自己训练出的模型具有知识产权,这将是我们未来的核心竞争力。”
AWS合作伙伴网络 (APN) 成员对Amazon SageMaker在中国区域的上线也表示欢迎。
德勤D.Data是一个基于AWS的 PaaS (平台即服务) 平台,为企业客户提供数据分析和业务洞察。它为不同的行业和业务场景提供了各种数据建模和预测服务。德勤创新、数字化研发中心主管合伙人賴有猷评价道:“通过Amazon SageMaker,我们大大提高了算法和机器学习建模能力,提高了分析效率。Amazon SageMaker的IDE平台也帮助我们加快了开发进程。”
伊克罗德是AWS的核心级咨询合作伙伴 (APN Premier Consulting Partner),其基于AWS的解决方案极大地减少了用户的开发时间与运营费用。伊克罗德中国区副总裁桂梓捷表示:“我们运用Amazon SageMaker平台加速企业导入行业AI解决方案,如标签标注、文本分析、语意理解、预测分类、推荐系统与诈欺侦测等,针对客户实际遇到的商业问题,量身打造真正解决问题的端到端AI应用。随着Amazon SageMaker在中国区域落地,我们将会以SageMaker平台作为企业MLOps(机器学习运营)核心,协助企业构建MLOps流程,尤其在金融行业领域,帮助企业内部数据科学家与AI工程师建立、训练与部署机器学习模型。”