🤖 New Amazon Bedrock service tiers help you match AI workload performance with cost
原文链接: New Amazon Bedrock service tiers help you match AI workload performance with cost 作者: Sébastien Stormacq 发布日期: 2025-11-18 22:29:46 UTC
📋 内容摘要
Amazon Bedrock推出三种新的服务层级(Priority、Standard和Flex),使客户能够根据AI工作负载的性能需求与成本进行更灵活的平衡。Priority层级以溢价提供优先计算分配,适用于需要快速响应的任务如客户交互聊天助手;Standard层级为日常AI任务提供稳定性能;Flex层级则为可接受较长延迟的工作负载(如内容摘要、模型评估)提供更经济实惠的选择。对于大多数支持Priority层级的模型,与Standard层级相比,输出令牌每秒(OTPS)延迟可改善高达25%。客户可以通过审查现有使用模式、确定哪些工作负载需要即时响应,并使用AWS价格计算器估算不同层级的成本来优化支出。新服务层级可立即使用,客户可在API调用时指定所需层级。
🔗 相关信息
这是来自 AWS 官方博客的最新资讯摘要。点击上方原文链接查看完整内容和技术细节。
🏷️ 涉及的 AWS 服务和主题
- Amazon Bedrock
- Launch
- News
📚 延伸阅读
本文为 AWS 官方博客内容摘要,完整内容请访问原文链接。版权归原作者所有。