如今,科技界的舆论风投显然是人工智能。不过,人工智能背后所依赖的科技底座云计算也是这场较力的核心动力。正如,人工智能明星战场背后都少不了云计算市场的头部企业出来撑腰。所以,那些云计算市场头部厂商的风吹草动,似乎也成了人工智能市场谁能问鼎中原的草蛇灰线。尤其是。亚马逊云科技re:Invent——AWS这么大规模的“内部消息”披露。自然,依旧是业界关注重点。
逆向工作法与re:Invent
前不久2023年的re:Invent放在了美国拉斯维加斯。好在,几天后亚马逊云科技re:Invent中国站落地北京,亚马逊云科技大中华区产品部总经理陈晓建在现场,分享了之前在美国拉斯维加斯举办的2023年re:Invent大会上展现的亚马逊创新亮点。陈晓建介绍,那次re:Invent上,一共发布了200多项新服务和功能,以及超过350项持续的更新。所以,本次的re:Invent北京之行,陈晓建更多是对这些创新其中的重点作出一些梳理,并就其中的一些亮点作出面向符合国国内市场情况的一些解读。
不夸张地讲,AWS的re:Invent一直都是业界发展的风向标。这种“风向”往往不在于未来市场中会有更多同行来衍生AWS的某某技术。更多在于,AWS作为行业头部的地位来看,re:Invent透露的那些“内部消息”,会成为解决这一市场中那些最需要解决问题的最重要的指引。诸如,在金融服务行业,有摩根大通、高盛、纳斯达克与AWS与等开展合作,在医疗保健领域,有辉瑞、诺华、罗氏、美敦力等等,在汽车制造领域,有宝马、奔驰、丰田、本田、大众等等。全球500强的那些头部企业很多都在亚马逊云上成了客户。这种市场体量的承载就决定着其创新路径不能只关注奇技淫巧,也要注重“重剑无锋”。否则,有类似国内前不久的几次短时间大范围的业务难以连续事件的发生,为创新的激进蒙上一些阴影,便会得不偿失。
毕竟,根据PitchBook的统计,全球目前已经有超过1000家初创企业或者估值超过了十亿美元的初创公司,有超过80%的选择了亚马逊云科技作为他们底层的IT平台。即使那些云供应商最需要解决问题还没暴露的时候,他们这些初创企业的迅速转身,就会成为云供应商的重大问题了。
亚马逊云科技如今全球基础设施横跨了世界32个地理区域,并有5区域在建。陈晓建首先强调的就是,亚马逊致力于给客户提供全球一致的体验,高可用和灾难恢复能力。“全球统一高标准的设计是帮助客户实现自身业务系统韧性的非常重要的基础。”
所以,作为这一市场的更多人士,我们或许并非需要深入理解那200多项新服务和功能到底是什么,350项持续的更新具体又应用在哪里。而是需要了解,未来的云服务能力,更多需要承担怎样的责任,或是什么才是更值得长期考虑的因素。这样,让这次陈晓建对AWS re:Invent的解读,对国内2024的云市场发展,便显得有些非常合时宜了。
陈晓建在分享中介绍,亚马逊云科技一直秉承着逆向工作法(Working backwards)的理念。所谓逆向,就是强调亚马逊的2023 “re:Invent”依旧是一场“从客户中来,到客户中去”的操作。
那么,亚马逊要不要重塑自己的老本行——云计算?那AI呢?
那么,接下来的内容,会告诉你答案。
重塑云服务——从计算芯片、对象存储到Serverless
计算芯片方面,亚马逊继续坚持ARM架构可以承担数据中心服务,当然底气是其自研的Graviton芯片。如今,Graviton3处理器的Amazon EC2 C7g、M7g、R7g实例在亚马逊云科技中国(北京)区域和中国(宁夏)区域已经正式可用。陈晓建介绍,Graviton芯片目前有超过5万客户在使用,这其中包括Top 100 的EC2客户全部都在使用Graviton为他们的业务降本增效。
也发布了,相信不久也能全区可用。号称平均性能比Amazon Graviton 3提升30%,对某些工作负载的加速更明显,数据库应用程序速度提升40%,大型Java应用程序速度提升45%。基于Amazon 的Amazon EC2 R8g实例的预览版已经推出。
存储方面,发布了Amazon S3 Express One Zone。Amazon S3 Express One Zone是新的S3存储类别,采用专门设计的软硬件来加速数据处理,可提供比Amazon S3标准存储快10倍的性能,同时能够以一致的毫秒级延迟处理每分钟数百万次的请求,同时请求成本降低了50%。这项新服务帮助Pinterest提升了10倍以上的写入速度,并将其机器学习驱动的视觉灵感引擎的总成本降低了40%。
Serverless是云计算中的一种新兴趋势,其中云服务商为客户提供运行时环境。通过这种方式,客户就可以专注于维护他们的功能代码,而将与硬件、操作系统(OS)相关的管理工作留给AWS。陈晓建介绍,无服务器这种云服务形式,对于用户来说,最直观的收益就是更好的业务韧性和更优的成本效益。此次,方面显然是AWS重塑云服务的重点。
亚马逊云科技此前推出的无服务器产品包括Amazon DynamoDB高性能数据库;Amazon S3和Amazon SQS,弹性文件系统EFS、Serverless计算服务Amazon Lambda、无服务器容器服务Amazon Fargate等。新发布的Amazon Aurora Limitless Database,简化了跨单台服务器读写吞吐量限制进行扩展,实现自动分布式分片,最大程度提升性能,并还提供了跨分片事务的一致性。通过Aurora Limitless Database, 客户可以实现真正意义上的无扩展上线的关系性数据库。Amazon ElastiCache Serverless,可以帮助客户在一分钟内创建高可用的缓存,并实时进行垂直和水平扩展以支持客户复杂的应用程序,且无需管理基础架构。Amazon Redshift Serverless新的基于AI的扩展和优化功能的预览,可根据多个工作负载维度自动调整资源并执行优化操作以完成预设的性价比目标。
不断降低生成式AI落地复杂度
当云服务商把底层的云在计算、存储、网络、运维方面都推向一个更为大规模的极致的时候,不妨思考一下用户该如何利用这种大规模的云服务商创新来快速提高自己的收益。不难知道,落地符合自己的生成式AI项目,或许是当下他们最大的期许。当下的形式是,可能想到了生成式AI可以的无所不能,但却没有合适的AI基础设施可用。例如,陈晓建就谈到用户在接触生成式AI时会遇到很多问题,“怎么去兼顾规模和成本,怎么去选择最适合的生成式AI模型,如何去保证我们自身业务的安全性和隐私,怎么去利用我的私有数据去训练模型,让生成式AI的模型成为我所在这个专业领域的专家,……”
所以说,“逆向工作法”的坚守者,就需要为客户建立合适的云服务与AI基础设施的联系。AWS将生成式AI的端到端应用划分三个层面,并提供持续赋能。
在底层应是主打最为前沿的的算力性能赋能。
首先是有自研的训练芯片提供,并有大幅性能提升。例如Amazon Trainium2处理器,用于生成式 AI 和机器学习训练的专用芯片,针对训练具有数千亿至数万亿参数的基础模型进行优化,相较 Amazon Trainium 有4 倍性能提升,65 exaflops的按需超级计算性能。
同时,不忘加强同英伟达的合作,披露首款使用NVIDIA最新芯片GH200 NVL32 的NVIDIA DGX云即将登录。令两家公司共同开展“Project Ceiba”合作项目, 将全球最快的GPU驱动AI超级计算机和NVIDIA DGX云超级计算机用于NVIDIA AI的训练、研发、定制化模型的开发,它将拥有1.6万个最新的GH200超级芯片,提供高达65 ExaFLOPS的惊人算力。
此外,还提供了Amazon SageMaker HyperPod。这是预置了Amazon SageMaker的分布式训练库,使客户能够自动将训练工作负载分布到数千个加速器上,以便并行处理工作负载,提高模型性能。Amazon SageMaker HyperPod 服务,可大规模加速基础模型训练,能够缩短高达40%的训练时间,并可以确保持续数周或数月的训练过程不中断。
中间层充当工具百宝箱,提供使用基础模型进行构建的各种工具。
由于企业的各种场景差异化需求,市场上的各个大模型都有其锋芒之处。所以Amazon Bedrock主打“重剑无锋”,主打可提供市场上各种领先的语言模型的全面托管的服务,例如AI21 Labs、Anthropic、Cohere、Meta、Stability AI以及亚马逊云科技自己的Amazon Titan。Amazon Bedrock新增支持Anthropic Claude 2.1和Meta LLama 2 70B。Claude 2.1为企业提供了先进的关键功能,包括业界领先的200K标记上下文窗口,与此前模型相比,Claude 2.1 在开放式对话中的错误陈述减少了50%。支持 Meta 的 LLama 2 70B,适用于大规模任务,如语言建模、文本生成和对话系统。
独占的Amazon Titan 模型优势包括但不限于:Amazon Titan Text Lite 是一种更小巧、更具成本效益的模型,支持聊天机器人问答或文本摘要等用例。 它重量轻,非常适合微调,为业务需求提供高度可定制的选择。Amazon Titan Text Express 模型参数量更大,可用于更广泛的任务,如开放式文本生成和对话聊天。Amazon Titan Multimodal Embeddings多模态嵌入模型,能够创建更丰富的多模态搜索和推荐体验。Amazon Titan Image Generator图像生成模型预览版,现已推出预览版,使客户能够使用自然语言提示生成高质量、逼真的图像或增强现有图像。
除此之外,Amazon Bedrock 的“模型评估”功能还能帮助企业穿透大模型选择的“迷雾”,简化确定基准、设置评估工具和运行评估等原本复杂耗时的流程,实现科学的评估和筛选,最终克服模型“选择困难症”。
在顶层应用层,提供利用基础模型构建的应用程序,主打聊天机器人。
等同于OpenAI之于ChatGPT,谷歌之于Bard,微软之于Copilots,则亚马逊之于Amazon Q。可能是由于是最贴近基层开发者的应用,陈晓建介绍中给了Amazon Q很浓墨重彩的介绍。
-是亚马逊云科技的专家,由亚马逊云科技17年来积累的知识和经验训练而成,可以在多种界面回答客户提出的各种亚马逊云科技相关的专业问题。Amazon Q可以在Amazon CodeWhisperer中回答开发人员的各种代码相关的问题并附上可一键实施的代码,并提供代码转换功能可以将应用维护和升级时的代码转换所需时间从几天缩短至几分钟。
-也是企业业务的专家,它拥有40多个兼容流行数据源的内置连接器,并支持自定义连接器,企业可以轻松将其连接至其业务数据和系统中。Amazon Q可使用身份验证系统来确认用户职能和访问权限,并支持指定话题屏蔽或关键词过滤等管理控制功能。
-也是商业智能专家,Amazon Q支持将其引入多种服务和应用中以提供基于生成式AI的帮助。 将Amazon Q引入BI应用Amazon QuickSight中,它能够在几秒钟内响应用户要求,创建精准且美观的月度业务变化的相关描述,该功能现已提供预览。
-也是联络中心专家。将Amazon Q引入云联络中心应用Amazon Connect中,它能够根据实时对话检测客户问题,并能够自动回复、给出建议以及提供相关资料,该功能现已正式可用。
在这有数百项创新发布de1内容中,我们无法断定2023的亚马逊云科技re:Invent上的表现,哪项终可以成为新一年里全球云计算产业发展动向的燎原之火。但是,得益于亚马逊逆向工作法的创新精神,re:Invent依旧是云计算时代最好的风向标。当重塑的各种服务,因背负着规模、可扩展、智能、便捷……这些被最需要AI的客户贴上各种标签的时候,其背后是云服务供应商自身成为AI时代更好的科技宿主。
AI时代,re:Invent之后,AWS依旧是人们拥抱云计算值得信赖的对象。
网友评论