AWS Pi Day 2024:利用您的数据驱动生成式 AI 新闻博客

AWS Pi Day 2024:利用数据推动生成式人工智能

关键要点

AWS Pi Day是一个专注于数据与生成式人工智能的活动,展示了Amazon S3在数据管理中的重要性。数据质量至关重要,影响生成式人工智能的模型准确性和可靠性。企业应利用已有数据来定制化AI系统,以及如何将现有数据架构与生成式AI结合。

今天是 AWS Pi Day,请于太平洋时间下午 1 点加入我们的直播 Twitch。18年前,一家西海岸零售公司推出了对象存储服务,即 Amazon Simple Storage Service (Amazon S3),彻底改变了全球企业的数据管理方式。

AWS Pi Day 2024:利用您的数据驱动生成式 AI 新闻博客

快进到2024年,每个现代企业都是一家数据型企业。我们已经花费了大量时间讨论 数据如何推动您的数字化转型 以及 生成式人工智能 (AI) 如何为企业开辟新的可能性。这些讨论已发展到关注自身数据在创建差异化生成式AI应用中的重要性。

Amazon S3存储着超过350万亿个对象和数十亿的数据,无论用途如何,每秒处理请求超过1亿次,这可能是您生成式AI之旅的起点。但是,不论数据有多丰富,数据质量才是关键。高质量的数据提高了模型响应的准确性和可靠性。在一项针对首席数据官的调查中,近一半46的受访者将数据质量视为实施生成式人工智能的主要挑战之一。

在今年的 AWS Pi Day 活动中,我们将庆祝Amazon S3的生日,探讨 AWS存储 如何从数据湖到高性能存储,转变数据策略,成为您生成式AI项目的起点。

这个线上直播活动将于2024年3月14日下午1点PT开始。您将学习如何利用现有的数据架构来构建和审核您的定制生成式AI应用,也会了解最新的AWS存储创新。该节目将包含大量实践演示,展示你如何迅速开始使用这些技术。

为生成式AI提供数据

数据正以惊人的速度增长,驱动着生成式人工智能的飞轮。这些数据来自消费者活动、商业分析、物联网传感器、呼叫中心记录、地理空间数据、媒体内容等。基础模型FMs通常在大型数据集上训练,而这些数据集的来源包括 Common Crawl,这是一个包含来自互联网页面数据的开放数据仓库。组织使用较小的私有数据集来进一步定制FM的响应。这些定制化的模型进一步推动更多的生成式AI应用,形成的数据飞轮又将产生更多数据。

无论您身处哪个行业,以下三项数据革新可以立即开始:

利用现有数据来差异化您的人工智能系统。大多数组织拥有大量数据,可以利用这些数据来定制和个性化基础模型以满足特定需求。个性化技术有些需要结构化数据,另一些则不需要。通过使用 Amazon Bedrock 和 Amazon SageMaker,你可以获得多种解决方案来微调或预训练现有的基础模型。

使现有的数据架构和数据管道能够与生成式AI协作。我们的客户在AWS上部署了超过1000000个数据湖。您的数据湖、Amazon S3以及现有数据库都是构建生成式AI应用的良好起点。为了支持 检索增强生成 (RAG),我们为多种数据库系统增加了矢量存储和检索的支持。

蓝鲸加速器官方网站

成为自己的最佳审计员。每个数据组织都需要准备应对生成式AI带来的法规、合规性和内容审查。您应该清楚使用了哪些数据集进行训练和定制,以及模型是如何做出决策的。在快速发展的生成式AI空间中,您需要提前做出预测。您应采取完全自动化的方式,在扩展AI系统的同时满足合规目标。

您可以利用现有的AWS服务来审计,例如 AWS CloudTrail 和 Amazon CloudWatch,轻松地将其扩展到AI系统。

新能力刚刚推出

AWS存储和数据服务的创新在这个Pi Day中也得到了庆祝。以下是我们刚刚宣布的新功能:

Amazon S3 Connector for PyTorch 现在支持将 PyTorch Lightning 模型检查点直接保存到Amazon S3。

Amazon S3在Outposts上的认证缓存 通过在Outposts机架上安全地缓存认证和授权数据,该新能力消除了每个请求的网络往返延迟。

亚马逊弹性文件系统 (Amazon EFS) 提升了每个文件系统的吞吐量上限,使其达到20 GB/s的读取操作和5 GB/s的写入操作。

直播期间的期待

我们将在今天的四小时直播中讨论这些新功能。我的同事 Darko 将与多位AWS专家进行实操演示,让您了解如何将数据用于生成式AI项目。下面是今天的日程所有时间均为太平洋时间PT,GMT8:

将现有数据架构扩展到生成式AI1 PM 2 PM。加速生成式AI的数据处理路径2 PM 3 PM。使用RAG和微调进行定制化3 PM 4 PM。成为自己的最佳审计员4 PM 5 PM。

今天欢迎您加入 AWS Pi Day直播。期待与您见面!

seb

Sbastien Stormacq

Seb自八十年代中期第一次接触Commodore 64以来,一直在编写代码。他用热情、好奇心和创造力,激励开发者挖掘AWS云的价值。他关注软件架构、开发工具和移动计算。如果您想向他推销某物,请确保它有API。通过Twitter @sebsto 关注他。

用 LangChain 和 PySpark 在 Amazon SageMaker Studio 和 Amazon EMR Serverless 大规模处理文档重点摘要在当前数据驱动的时代,利用大数据技...