xAI推出具备持续推理能力的Grok 4.3及自定义语音克隆套件

2026年5月2日，xAI在AI行业掀起波澜，推出两款突破性工具：具备持续推理能力的大语言模型（LLM）Grok 4.3，以及仅限美国使用的语音克隆套件Custom Voices。此次发布附带详细定价、第三方基准测试结果及明确使用限制，标志着xAI产品生态体系迈出重要一步。

Grok 4.3：持续推理搭配超大上下文窗口

Grok 4.3与前代产品的不同之处在于，它默认开启推理功能——无需手动切换。这意味着该模型无需额外提示即可处理复杂的多步骤任务，为开发者和高级用户简化工作流程。它拥有高达100万token的上下文窗口，可处理大量文本和图像输入，输出连贯文本。该模型完全集成智能体工作流，用户可直接通过提示生成电子表格、PDF、演示文稿等复杂文件。

Grok 4.3的训练数据截至2025年12月，还支持实时网页搜索和X平台集成，确保用户获取最新信息。两个演示案例展现了它的潜力：耗时约6分钟生成的多工作表《旧版符文之地》（Old School RuneScape，OSRS）海战DPS分析工具，以及包含品牌标识和数据表的12页SpaceX产品报告。

Grok 4.3 API定价：阶梯式结构降低成本

xAI重新设计了Grok 4.3的定价模式，相比Grok 4.2大幅降低成本：输入token费用降低40%，输出token费用降低60%。以下是API定价结构明细：

服务	定价
输入token	每百万token1.25美元
输入token（超过20万）	每百万token2.50美元（费率翻倍）
输出token	每百万token2.50美元
推理token	与标准输出token费率相同
提示缓存服务	每百万token0.20美元
工具调用（网页搜索、代码执行）	每1000次调用5.00美元
拦截请求	每次请求0.05美元

这种阶梯式定价方案兼顾个人开发者和企业用户，可随使用量扩展，同时确保高容量任务的成本可控。

第三方基准测试：细分任务表现顶尖，仍有提升空间

独立基准测试显示，Grok 4.3在专业领域表现出色，在CaseLaw v2和CorpFin基准测试中位居榜首——这证明它在法律和金融推理任务上的实力。不过，该模型在两个关键领域出现性能倒退：通用编码任务和智能体一致性测试。此外，一家基准测试公司指出，在模拟环境中存在“嗜睡问题”，即模型在长时间运行过程中可能停止响应或生成不完整输出。

自定义语音：仅限美国用户使用，120秒完成语音克隆

与Grok 4.3相辅相成的是xAI的自定义语音套件，这是一款仅需120秒音频即可生成逼真合成语音的克隆工具。目前，该服务仅限美国用户使用（伊利诺伊州除外），可通过网页控制台和企业API访问。

自定义语音的定价简单明了：文本转语音服务为每百万字符4.20美元，语音智能体API为每小时3.00美元。对于希望在应用中集成个性化语音体验的企业而言，这是一个高性价比的解决方案。

xAI此次发布将Grok 4.3的先进推理能力与易用的语音克隆技术相结合，解决了AI工作流效率和个性化内容创作中的关键痛点。尽管Grok 4.3在通用编码和智能体一致性方面仍有提升空间，但它在细分领域的表现和降低后的定价使其成为目标用例的理想选择。自定义语音仅限美国使用的限制可能会影响其覆盖范围，但随着监管框架的完善，为未来的扩张奠定了基础。

HelloGeo

xAI推出具备持续推理能力的Grok 4.3及自定义语音克隆套件

Grok 4.3：持续推理搭配超大上下文窗口

Grok 4.3 API定价：阶梯式结构降低成本

第三方基准测试：细分任务表现顶尖，仍有提升空间

自定义语音：仅限美国用户使用，120秒完成语音克隆

sell 相关标签

管理员

分享文章

相关文章

超越免费的AI工作空间：OpenAI的Prism将重塑科学写作与协作

超越内部工具：OpenAI 的数据代理揭开可扩展的 AI 驱动型企业分析的神秘面纱

兼顾效率与隐私：OpenAI 的 Codex Agent Loop，LLM Agent 开发者的蓝图