正文
OpenAI据称发现新优化方式,可将推理成本降低超过50%
发布时间:55 分钟前
OpenAI 工程团队近期向部分同事透露,公司已找到一种新的系统优化方法,可将 AI 模型“推理(inference)”成本降低一半以上推理成本指模型在实际运行与响应用户请求时所消耗的计算资源成本。此次优化主要来自对现有服务器资源利用效率的提升,而非依赖新增算力芯片投入,这一进展反映出 AI 公司在持续争夺算力资源的同时,也在通过软件与系统层优化提升现有基础设施的使用效率,以缓解快速增长的模型运行成本压力。(The Information)






