2022年12月20日,亚马逊云科技在2022re:Invent全球大会上发布了一系列涵盖底层基础架构、计算、数据库、数据分析、AI/ML、安全、行业应用等新的服务及功能,通过不断创新帮助全球客户重塑未来。
在大数据层面,亚马逊云科技构建端到端的云原生数据战略,让客户可以更便捷、安全地获取数据洞察。新服务及功能重点包括数据管理服务Amazon DataZone,帮助客户实现“Zero-ETL”的全新服务集成功能;五项数据库和分析服务全新功能;Amazon SageMaker以及Amazon QuickSight等的多项新功能。
亚马逊云科技还推出了安全数据湖Amazon Security Lake,方便客户针对安全数据做出快速行动。针对行业需求,亚马逊云科技推出Amazon Supply Chain,帮助企业更好地管理供应链;Amazon Clean Rooms助力企业更高效地处理组合数据集等。亚马逊云科技正式开启2022 re:Invent中国巡展活动,覆盖15座城市,展示2022 re:Invent全球大会的最新产品和技术、前沿趋势以及最佳实践。
亚马逊云科技大中华区产品部总经理陈晓建表示:“亚马逊云科技在每年的re:Invent全球大会上,都会发布许多重磅的新服务、功能和应用,来支持遍及全球各地、来自千行百业的客户进行不断的创新和重塑。面临全球经济的不确定性,各种规模的客户都希望能进一步消减成本、增强业务的灵活性并加速创新。我们希望能通过技术的不断创新,让全球包括中国的客户能凌云驭势、重塑未来。”
十年领跑,加速底层技术创新
亚马逊云科技自2013年推出Amazon Nitro系统以来,已经开发了多个自研芯片,包括五代Nitro系统、致力于为各种工作负载提升性能和优化成本的三代Graviton芯片、用于加速机器学习推理的两代Inferentia芯片,以及用于加速机器学习训练的Trainium芯片。定制化的芯片设计帮助客户运行要求更高的工作负载,包括更快的处理速度、更高的内存容量、更快的存储输入/输出(I/O)和更高的网络带宽。
在本次2022 re:Invent全球大会上,亚马逊云科技再次推出了一系列底层技术更新,包括第五代虚拟化芯片Nitro5、Gravition3E以及机器学习推理芯片Inferentia2,并推出了由三款自研芯片支持的Amazon Elastic Compute Cloud(Amazon EC2)最新实例。其中,Amazon EC2 Hpc7g实例采用了Amazon Graviton3E芯片,与当前一代Amazon EC2 C6gn实例相比,浮点性能提高了2倍;与当前一代Amazon EC2 Hpc6a实例相比,性能提高了20%,为高性能计算工作负载提供了超高性价比。Amazon EC2 C7gn实例采用Amazon Nitro5,与当前一代网络优化型实例相比,为每个CPU提供了多达2倍的网络带宽,同时将每秒数据包转发性能提升50%,为网络密集型工作负载提供了超高的网络带宽、数据包转发性能和性价比。Amazon EC2 Inf2实例采用Inferentia2,是专门为运行多达1,750亿个参数的大型深度学习模型而构建的,与当前一代Amazon EC2 Inf1实例相比,可提供高达4倍的吞吐量,降低多达10倍的延迟,且成本更优,延迟更低。
亚马逊云科技还对核心的底层亚马逊云科技SRD网络协议(Scalable Reliable Datagram,可扩展的可靠数据报)进行了创新,推出了高速虚拟网卡ENA Express,提供一致的更低延迟和更高网络吞吐量。SRD协议是亚马逊云科技开发的一种网络协议,专为亚马逊云科技环境中实现一致且低延迟的网络而构建的,具备多路径传输、微秒级重传和Nitro芯片提供专用资源三大优势,能够显著降低网络延迟,提高网络吞吐量。
针对负载巨大且高度复杂的模拟应用场景,亚马逊云科技推出了Amazon SimSpace Weaver服务,帮助客户构建、操作和运行大规模的空间模拟仿真系统。客户使用该服务可模拟出100万个以上、实时交互的仿真对象,创建比以往更加复杂的环境,并且将模拟仿真系统部署的时间从数年缩短至数月。
构建云原生端到端的数据战略,应对海量数据挑战
数据是企业业务决策流程的中心,是构建数字化转型的基石。随着数据规模和增长的不断加速,企业需要一整套完整的数据工具来应对海量的多样化数据;需要整合来自于不同部门、不同服务和不同应用中的所有数据,以获取更全面的数字洞察;需要通过数据治理保障人员和应用快速访问所需数据并同时确保数据安全;还需要改善发现和分享数据的方式以提升获取洞察的效率。
应对数字时代的企业挑战,在本次发布会上,亚马逊云科技基于自身的深厚技术与案例积累,发布了赋能数据驱动型企业的全新技术架构——“亚马逊云原生数据战略”。每一个组织和企业都有不同的数据源、不同的分析需求和不同的治理要求,这些需求会随着时间而动态变化。“亚马逊云原生数据战略”能够为企业提供管理、访问、分析和处理数据的全面规划,帮助企业构建一个完整的端到端数据解决方案,帮助企业或组织处理数据的快速增长,并满足当下和未来的使用需求。
云原生数据战略不是某一个或者几个数据分析工具的堆砌,而是从数据战略和技术架构的角度服务于整体业务数据在全部数据里程中所有的步骤。亚马逊云原生数据战略通过“云原生数据基础设施”、“数据一体化融合”、“数据驱动智能创新”三个支柱与“数据治理与数据安全”一个基石,帮助企业或组织做出更好、更明智的决策,实现更快、更高效的发展,并能不断驱动业务创新,保障业务的稳定,控制风险。
亚马逊云科技在2022 re:Invent全球大会发布了全新的数据管理服务Amazon DataZone,助力客户更快、更轻松地对存储在亚马逊云科技、客户本地和第三方来源的数据进行编目、发现、共享和治理,同时提供更精细的控制工具,管理和治理数据访问权限,确保数据安全。企业中的各类人员都可以通过Amazon DataZone轻松访问整个组织的数据以提升企业的数据洞察力。
亚马逊云科技还新推出五项数据库和分析服务全新功能,让客户能够更快、更轻松地管理和分析PB级数据。Amazon DocumentDB Elastic Clusters可将客户的文档工作负载扩展到支持每秒数百万次请求,并支持PB级数据存储;Amazon OpenSearch推出了Serverless无服务器功能,可帮助客户在无需配置、扩展或管理底层基础设施的情况下运行搜索和分析工作负载,这一更新也标志着亚马逊云科技数据分析服务的全面无服务器化;Amazon Athena for Apache Spark能让客户开始使用Apache Spark进行交互式分析的时间从数分钟缩短到一秒以内;Amazon Glue Data Quality可以跨数据湖和数据管道自动管理数据质量; Amazon Redshift现在支持跨多个亚马逊云科技可用区(AZ)的高可用配置。
此外,亚马逊云科技在本次大会上推出了机器学习服务Amazon SageMaker的八项新功能以及Amazon QuickSight的五项全新功能。其中,新的 Amazon SageMaker治理功能可以在整个机器学习生命周期中提供对模型性能的可见性;新的 Amazon SageMaker Studio Notebook功能提供了增强的Notebook体验,让客户只需点击几下即可检查和解决数据质量问题,促进数据科学团队之间的实时协作,通过将Notebook代码转变到自动化作业,加速机器学习实验到生产的过程;其他一些新功能可自动执行模型验证,并且让地理空间数据处理变得更容易。Amazon QuickSight新功能可以支持业务人员直接用自然语言提问各类预测问题,并能够给出预测依据,大大降低了企业从数据中获取业务洞察的门槛。
助力企业构建Zero ETL的未来
针对ETL(数据的提取、转换和加载过程),亚马逊云科技在本次大会上发布了两项全新的集成功能,帮助客户实现“Zero-ETL”(零ETL)。
Zero ETL是由亚马逊云科技持续投入的技术方向,Zero ETL是一种云原生的数据处理方式,可以减少企业在不同服务间手动迁移或转换数据的工作,以助力客户专注于分析数据,以得到更多面向业务的洞察。亚马逊云科技在re:Invent 2022上正式发布几项将数据管理推向Zero ETL的新服务,提出“Zero ETL”。业务数据往往需要通过ETL才能进行分析从而提供洞察,但这一过程往往耗时且枯燥。现在,客户可以使用Amazon Redshift近乎实时地分析Amazon Aurora中的数据,无需在不同服务之间进行ETL。客户还可以使用亚马逊云科技的分析和机器学习服务在Amazon Redshift的数据上轻松运行 Apache Spark应用程序。实现将数据库,数据服务底层打通,把各种各样的数据都连接到执行分析所需要的地方,实现数据平滑“无感”的流动。"
Serverless Data,云原生数据服务的下一代技术架构与“新常态”
“Serverless无服务器”一词并不意味着不再涉及服务器,它只是意味着开发人员不再需要考虑那么多的物理容量或其他基础设施资源管理责任。通过消除后端基础设施的复杂性,无服务器让开发人员将注意力从服务器级别转移到任务级别。
2022年亚马逊云科技re:Invent上,发布了Amazon OpenSearch Serverless,无服务器的日志分析引擎。它的发布代表着在数据分析领域,亚马逊云科技已经实现了“全Serverless架构”。回看亚马逊云科技的Serverless服务发展进程,从2006年亚马逊云科技诞生开始,其第一个服务Amazon S3就是一个Serverless服务。2021年,亚马逊云科技一口气发布了三款Serverless架构的数据分析服务,分别是流式数据管道Amazon MSK Serverless,大数据分析平台Amazon EMR Serverless,数据仓库Amazon Redshift Serverless。
Serverless Data是亚马逊云科技具备Serverless特性数据服务的统称,是云原生数据服务的下一代技术架构与“新常态”.它的典型产品包含了无服务器数据库,无服务器数据分析,无服务器人工智能服务等。越来越多的数据服务,客户要求其易用性,要求不去管理底层的基础设施,越来越走向Serverless化。 Serverless作为一种先进的云原生的架构,正在推动云计算的发展且它已不仅是计算,它已成为云原生数据库、云原生数据分析乃至人工智能的标配。亚马逊云科技致力于无服务器技术的相关探索,各行各业已经从单个场景的“部分拥抱Serverless”走向“全Serverless架构”。
推出开箱即用的行业应用突破行业限制
针对企业的行业应用,亚马逊云科技在2022 re:Invent全球大会推出了多项新的服务。基于 Amazon.com近30年的物流网络经验,亚马逊云科技在本次大会上推出的新应用程序Amazon Supply Chain,帮助企业提高供应链的可见性,做出更快、更明智的决策,并降低风险、优化成本及改善客户体验。Amazon Supply Chain可自动合并、分析多个供应链系统的数据,企业因此可以实时观察供应链运营的情况,更快地发现趋势,更准确的预测需求,确保充足的库存满足客户预期。Amazon Supply Chain还通过提供统一的数据湖、机器学习驱动的洞察、行动建议和应用程序内协作功能,提高客户供应链的韧性。
新推出的分析服务Amazon Clean Rooms,它可以帮助不同行业的公司轻松、安全地分析和协作处理组合数据集,无需共享或泄露原始的底层数据。借助Amazon Clean Rooms,客户可以在几分钟内创建一个安全的数据清洗空间,与亚马逊云科技之上的其它公司协作,生成与广告营销活动、投资决策、临床研究等相关的独特洞察。Amazon Clean Rooms为保护敏感数据提供了一组内建的数据访问控制,包括查询控制、查询输出限制、查询日志和加密计算工具。
针对生物医疗行业,亚马逊云科技推出了Amazon Omics。这是一项用于存储、分析和阐述基因组学、转录组学和其他组学数据的托管服务。该服务专为医疗保健和生命科学组织而设计,旨在加强患者护理并推进科学研究,它的推出将有助于靶向疾病的治疗。
通过本次2022 re:Invent全球大会,亚马逊云科技向大家展现了怎样通过持续创新,用更多更好的云服务来为客户创造价值,从大量复杂数据中获得洞察探索未知领域。亚马逊云科技也希望能够成为客户坚实的肩膀,助力所有企业和机构,凌云驭势,重塑未来。