随着企业内部对 AI 工具的依赖加深,原本鼓励多用的策略正在转向成本控制。多家企业开始为员工设置 Token 配额,限制高成本模型的使用范围,并重新评估 AI 投入是否真正带来产出提升。
Pylon 首席执行官 Marty Kausas 表示,公司员工规模接近 150 人后,Anthropic 服务费用可能跃升至 140 万美元。面对账单快速扩大,公司决定结束“无限使用”模式,开始为部分非技术岗位设定 Token 上限。公司财务团队目前正评估具体额度。
企业开始收紧 AI 预算
过去几个月,不少公司还在鼓励员工尽量使用 AI,以提升效率。但随着费用持续攀升,管理层开始把重点转向预算约束。OpenAI 首席执行官 Sam Altman 近日也提到,年初企业客户对 AI 支出普遍较为接受,如今成本已成为突出问题。
Business Insider 援引 AlphaSense 数据称,2026 年第二季度财报电话会上,“tokens”一词出现 129 次,高于前一季度的 57 次。这反映出企业管理层正更频繁地讨论 AI 成本与资源分配。
Coinbase 已设置 AI 使用上限 沃尔玛也开始限制相关预算 亚马逊关闭内部 Token 排行榜 人均支出继续上升
Ramp 的 AI Index 显示,科技和媒体公司 5 月人均 AI 支出为 66.29 美元,高于 4 月的 58.84 美元。Ramp 首席经济学家 Ara Kharazian 认为,这一指标仍可能继续上升,但企业已经出现收紧迹象,例如更多使用模型路由器来控制调用成本。
也有公司没有直接削减预算,但开始重新衡量“人力与 Token”的投入比例。Y Combinator 支持的 AI 初创公司 MindFort 只有 6 名员工,其首席执行官 Brandon Veiseh 表示,如果没有 AI,公司要达到当前规模,过去可能需要约 20 人。
企业软件公司 Pega 则较早对高消耗用法保持谨慎。该公司没有公布固定 Token 上限,但会对超额请求进行限制。公司管理层认为,单纯追求更高调用量,并不一定带来更好的业务结果。
工程师开始关注配额
随着配额制度出现,工程师对 AI 资源的可得性也更加敏感。报道提到,求职者已经开始在面试中询问模型预算、可使用的模型等级,以及公司是否与 AI 实验室有合作,能否获得更早的产品接入机会。
Everlaw 首席技术官 Max Christoff 认为,可以先给工程师设定基础配额,再允许他们在有明确需求时申请更高额度。这样既能保留关键项目所需资源,也能减少无效消耗。
Larridin 创始人 Russ Franklin 则预计,即便企业不直接设置 Token 上限,也会限制高端模型的使用权限。更昂贵、能力更强的模型,未来可能只向少数核心岗位开放。
报道认为,这种变化可能影响工程师的职业竞争力。若员工长期无法接触先进模型,未来在技能积累和求职市场上的位置都可能受到影响。对企业而言,如何在控制成本和维持人才吸引力之间取得平衡,正成为新一轮 AI 落地中的现实问题。