北京2024年9月18日 /美通社/ -- 亚马逊云科技宣布由英伟达H200 GPU提供支持的 Amazon Elastic Compute Cloud P5e(Amazon EC2 P5e)实例现已正式可用。亚马逊云科技是首个将英伟达H200 GPU用于生产环境的领先云提供商。与基于英伟达H100 GPU的Amazon EC2 P5实例相比,Amazon EC2 P5e实例GPU内存容量提升1.7倍,GPU内存宽带提升1.5倍。Amazon EC2 P5e非常适用于复杂的大型语言模型(LLM)和多模态基础模型(FM)的训练、微调和推理,用于支持最苛刻和计算密集型的生成式AI应用,如问答、代码生成、视频和图像生成、语音识别等。
Amazon EC2 P5e实例提供8个英伟达H200 GPU,具有1128GB高带宽GPU内存,同时提供第三代AMD EPYC处理器,2TB系统内存和30TB本地NVMe存储。Amazon EC2 P5e实例还提供 3,200 Gbps的聚合网络带宽并支持GPUDirect RDMA,从而能够绕过CPU进行节点间通信,实现更低的延迟和高效的横向扩展性能。Amazon EC2 P5e实例具有的更高的内存带宽、更大的GPU内存容量和对更大的batch sizes的支持,从而显著提升客户工作负载的性能、降低成本并简化运营。
Amazon EC2 P5e实例现已可通过Amazon EC2 Capacity Block for ML工具访问并在美国东部(俄亥俄州)区域正式可用。
此外,亚马逊云科技还宣布将推出Amazon EC2 P5en实例,通过将英伟达H200 GPU与定制的第四代英特尔Xeon可扩展处理器相结合支持PCle Gen5,将提供高达四倍的CPU和GPU之间的带宽,降低网络延迟,进一步提高工作负载性能。
- 卡西欧推出金属极简设计G-SHOCK新品 佩戴舒适度再升级
- 政企协同赋能就业新生态!济南市领导一行莅临菜鸟无忧集团总部视察指导
- 学 AI,用极客时间:极客时间品牌升级,持续推动数智人才全面发展
- 多伦科技与影智科技达成战略合作,共拓机器人与智能产业新蓝海
- 众合云科亮相HRU10中国大学生人力资源创新实践大赛京津冀蒙晋赛区
- 下沉市场破局者:CoCo都可“深度扶持”模式构筑加盟共生路
- 51社保荣获MeetHR2025年度人力资源行业优秀品牌服务商
- 凯斯纽荷兰与黑龙江农业工程职业学院校企合作再深化
- 2025 Altair Enlighten Award 获奖名单揭晓
- 一诺仪器与吹田电气强强联手,加速布局新能源赛道
- 氢风正劲,聚能成势!FCVC 2025展览亮点全剧透
- 举办首届医疗后勤服务技能竞赛,新大正以赛促训锻造“硬核”团队
- 5月甜蜜季丨婚礼纪:科技牵线钱塘畔,助力百人邂逅心动时刻
- 格兰云天武汉再添一子 军山新城首家格兰云天大酒店签约
- ACC 2025:SOUL试验证实诺和忻®(司美格鲁肽片14 mg)在降低心血管事件方面具有优效性