返回热力追踪
关注AI产品

Amazon SageMaker AI异步推理新增内联请求负载支持,无需预传S3

AWS官方宣布为Amazon SageMaker AI异步推理新增内联请求负载支持,用户可直接在API请求体发送推理负载,省去提前上传输入数据到Amazon S3的步骤,简化了调用流程。

编辑视角

该更新降低了用户使用SageMaker异步推理的门槛,简化部署调用流程,对使用AWS部署AI推理的开发者和企业有直接实用价值。

深度解读

本次信号主旨是AWS更新旗下Amazon SageMaker AI的异步推理功能,新增内联请求负载能力优化使用流程。证据来自AWS官方博客的正式发布公告,属于官方确认的产品功能更新。边界方面:该更新仅改变异步推理的请求方式,未解决现有用户反馈的大体积负载运行异常问题,也没有提升异步推理本身的核心性能,原有需上传S3的使用方式不变。后续可观察该更新后用户体验改善情况,以及AWS对大负载问题的后续修复动作。

核心要点
  • Amazon SageMaker AI异步推理正式新增内联请求负载支持
  • 用户可直接在API请求体发推理负载,无需预存S3
  • 简化异步推理调用流程,降低用户使用门槛
  • 本次更新未解决大体积负载运行异常问题
延伸阅读
  • Amazon SageMaker AI 现已支持用于推理端点的兼容 OpenAI 的 API同属Amazon SageMaker AI近期推理功能更新