# 讯飞星辰 MaaS · Astron Token Plan 使用文档
# 一、关键配置信息(必读)
以下信息为 Token Plan 接入所需的核心参数,请复制到对应工具的配置文件中。
# 1.1 API Key 获取
- 访问讯飞星辰MaaS平台Token Plan套餐订阅页面 (opens new window)
- 购买后复制 Token Plan 专属 API Key
每个套餐对应一个独立 API Key,仅用于 Token Plan 接口。
# 1.2 接口地址
| 协议 | Base URL |
|---|---|
| OpenAI 协议 | https://maas-token-api.cn-huabei-1.xf-yun.com/v2 |
| Anthropic 协议 | https://maas-token-api.cn-huabei-1.xf-yun.com/anthropic |
# 1.3 模型名称
在配置文件中指定 Model id,可实现切换模型。当前支持配置的 modelId列表如下
| 模型名称 | modelId |
|---|---|
| Spark X2 | xsparkx2 |
| Spark-X2-Flash | xsparkx2flash |
| GLM-5.1 | xopglm51 |
| GLM-5 | xopglm5 |
| DeepSeek-V4-Pro | xopdeepseekv4pro |
| DeepSeek-V4-Flash | xopdeepseekv4flash |
| DeepSeek-V3.2 | xopdeepseekv32 |
| Kimi-K2.6 | xopkimik26 |
| KiMi-K2.5 | xopkimik25 |
| MiniMax-M2.5 | xminimaxm25 |
| Qwen3.5-397B-A17B | xopqwen35397b |
| Qwen3.6-35B-A3B | xopqwen36v35b |
| Qwen3.5-35B-A3B | xopqwen35v35b |
| Qwen3-Coder-Next-FP8 | xop3qwencodernext |
| GLM-4.7-Flash | xopglmv47flash |
# 二、工具配置模板
# 2.1 OpenClaw
配置文件路径:~/.openclaw/openclaw.json
{
"models": {
"mode": "merge",
"providers": {
"astrontokenplan": {
"baseUrl": "https://maas-token-api.cn-huabei-1.xf-yun.com/v2",
"apiKey": "您的Token Plan API Key",
"api": "openai-completions",
"models": [
{
"id": "您配置的modelId",
"name": "您配置的modelId",
"reasoning": false,
"input": ["text"],
"contextWindow": 92160,
"maxTokens": 32768
}
]
}
}
},
"agents": {
"defaults": {
"model": {
"primary": "astrontokenplan/您配置的modelId"
},
"models": {
"astrontokenplan/您配置的modelId": {
"alias": "astrontokenplan"
}
}
}
}
}
# 2.2 Claude Code
配置文件路径:~/.claude/settings.json
{
"env": {
"ANTHROPIC_AUTH_TOKEN": "您的Token Plan API Key",
"ANTHROPIC_BASE_URL": "https://maas-token-api.cn-huabei-1.xf-yun.com/anthropic",
"CLAUDE_CODE_DISABLE_NONESSENTIAL_TRAFFIC": 1,
"API_TIMEOUT_MS": 600000,
"ANTHROPIC_MODEL": "您配置的modelId",
"ANTHROPIC_SMALL_FAST_MODEL": "您配置的modelId"
},
"permissions": {
"allow": [],
"deny": []
}
}
可选配置:~/.claude.json
{
"hasCompletedOnboarding": true
}
# 2.3 Cursor
配置入口:Ctrl + Shift + J → 搜索 「Models」
| 配置项 | 值 |
|---|---|
| Override OpenAI Base URL | https://maas-token-api.cn-huabei-1.xf-yun.com/v2 |
| OpenAI API Key | 您的 Token Plan API Key |
| 模型 | 您配置的modelId |
# 2.4 OpenCode
配置文件路径:项目根目录 opencode.config.json 或 OpenCode 指定配置路径(以 OpenCode 文档 (opens new window) 为准)
Token Plan 使用 独立 Base URL(
maas-token-api),与常规推理服务(maas-api)不同,请勿混用。
完整配置示例:
{
"$schema": "https://opencode.ai/config.json",
"provider": {
"AstroTokenPlan": {
"npm": "@ai-sdk/openai-compatible",
"name": "讯飞星辰 Token Plan",
"options": {
"baseURL": "https://maas-token-api.cn-huabei-1.xf-yun.com/v2",
"apiKey": "您的Token Plan API Key"
},
"models": {
"astron-code-latest": {
"name": "您配置的modelId"
}
}
}
}
}
# 三、产品简介
讯飞星辰 MaaS 平台 Token Plan 是面向企业/团队的包月订阅制大模型调用服务,根据积分统一计量;以"成员"为基本单位,每个成员获得固定额度。用户在额度内可调用多个大模型,不同模型消耗不同额度。支持通过 OpenAI 协议与 Anthropic 协议接入,兼容 OpenClaw、Cursor、Claude Code 等主流 AI 编程工具,覆盖代码编写、理解与优化等场景,助力提升开发效率与代码质量。
- 限时折扣: 6月2日至7月2日订购,折后低至每成员 160 元/月。
- 连续订阅 / 混采优惠: 同类套餐连续订阅、不同套餐混合采购,均享活动折扣,灵活搭配。
- 错峰更省: 周一至周五(08:00-22:00以外的时段),周六周日(全天全时段),积分消耗享 0.8 倍系数,错峰执行任务更划算。(周一至周五 08:00 <= 时间 < 22:00 积分消耗为1.0 倍系数)
- 赠送 AstronClaw 会员: 每份套餐附赠价值 168 元的 AstronClaw 基础版月度会员,助你安全、轻松“养虾”,让算力投资转化为翻倍的业务生产力。
- 购买即赠讯飞优质Skills能力:开通任意档位套餐,即可享用超拟人合成、一句话声音复刻、票据识别、图片理解、文本翻译等讯飞核心AI能力
# 四、套餐与计费
| 成员类型 | 月价格(元/成员) | 月积分额度 | TPM | 限时活动 即日起至2026年7月2日 |
|---|---|---|---|---|
| 标准成员 | 200 | 20000 | 200w | 8折,160元 |
| 高级成员 | 600 | 60000 | 300w | 7折,420元 |
| 尊享成员 | 2000 | 200000 | 500w | 6折,1200元 |
说明 -三种成员类型套餐:标准成员-高级成员-尊享成员,支持升级并且按实际使用周期折算补差价。
# 4.1 套餐额度消耗说明
单次提问将按实际模型使用情况扣除积分,在 讯飞星辰MaaS平台Token Plan套餐订阅页面 (opens new window)可以查看积分用量。
积分消耗遵循统一计算规则,不同模型消耗数值请查阅模型列表。
消耗积分 = 非缓存输入Token数(百万) × 输入积分
+ 缓存命中Token数(百万) × 缓存命中积分
+ 输出Token数(百万) × 输出积分
+ 思考Token数(百万) × 思考积分(如有思考模式)
实际消耗积分 = 消耗积分 × 时段系数
# 五、支持模型列表
| 模型 | 上下文 | 描述 | 输入(积分/百万Token) | 缓存命中(积分/百万Token) | 输出(积分/百万Token) | 思考(积分/百万Token) |
|---|---|---|---|---|---|---|
| Spark X2 | 192K | 星火自研 | 300 | 60 | 300 | 300 |
| Spark-X2-Flash | 256K | 星火自研 | 100 | 20 | 200 | 200 |
| GLM-5.1 | 200K | 高效稳定 | 800 | 160 | 2800 | 2800 |
| GLM-5 | 200K | 高效稳定 | 600 | 120 | 2200 | 2200 |
| DeepSeek-V4-Pro | 1M | 首发尝鲜 | 1200 | 240 | 2400 | 2400 |
| DeepSeek-V4-Flash | 1M | 首发尝鲜 | 100 | 20 | 200 | 200 |
| DeepSeek-V3.2 | 128K | 高效稳定 | 200 | 40 | 300 | 300 |
| Kimi-K2.6 | 256K | 多模输入 | 650 | 130 | 2700 | 2700 |
| Kimi-K2.5 | 128K | 多模输入 | 400 | 80 | 2100 | 2100 |
| MiniMax-M2.5 | 128K | 高效稳定 | 210 | 42 | 840 | 840 |
| Qwen3.5-397B-A17B | 256K | 多模输入 | 120 | 24 | 720 | 720 |
| Qwen3.6-35B-A3B | 128K | 多模输入 | 100 | 20 | 360 | 360 |
| Qwen3.5-35B-A3B | 128K | 多模输入 | 40 | 8 | 170 | 170 |
| Qwen3-Coder-Next-FP8 | 256K | 代码专精 | 250 | 50 | 1000 | 1000 |
| GLM-4.7-Flash | 128K | 轻量快速 | 100 | 20 | 150 | 150 |
# 六、Skill列表
- 购买即赠讯飞优质Skills能力。开通任意档位套餐,即可享用超拟人语音合成、一句话复刻、票据识别、图片理解、文本翻译等讯飞核心AI能力,高峰期权益到账或存在 1~3 分钟延迟。
- Skill赠送调用量统一发放至席位购买方账号,使用下单手机号登录讯飞开放平台控制台 (opens new window),即可查询可用调用量和鉴权参数(APPID、APISecret、APIKey);免费赠量耗尽后,可在控制台内点击立即购买完成充值续费。
| Skill(点击跳转控制台地址) | 安装命令 | Skill详细文档 |
|---|---|---|
| 超拟人语音合成 (opens new window) | npx clawhub@latest install ifly-hyper-tts | https://clawhub.ai/qingzhe2020/ifly-hyper-tts |
| 一句话复刻 (opens new window) | npx clawhub@latest install ifly-voiceclone-tts | https://clawhub.ai/qingzhe2020/ifly-voiceclone-tts |
| 极速语音转写 (opens new window) | npx clawhub@latest install ifly-speed-transcription | https://clawhub.ai/qingzhe2020/ifly-speed-transcription |
| 图片/PDF OCR (opens new window) | npx clawhub@latest install ifly-pdf-image-ocr | https://clawhub.ai/qingzhe2020/ifly-pdf-image-ocr |
| 票据识别 (opens new window) | npx clawhub@latest install ifly-ocr-invoice | https://clawhub.ai/qingzhe2020/ifly-ocr-invoice |
| 公文校对 (opens new window) | npx clawhub@latest install ifly-text-proofread | https://clawhub.ai/qingzhe2020/ifly-text-proofread |
| 文本翻译 (opens new window) | npx clawhub@latest install ifly-translate | https://clawhub.ai/qingzhe2020/ifly-translate |
| 图片理解 (opens new window) | npx clawhub@latest install ifly-image-understanding | https://clawhub.ai/qingzhe2020/ifly-image-understanding |
# 七、AstronClaw会员
每份套餐购买即赠价值 168 元的 AstronClaw 基础版月度会员,使用席位被分配人的手机号登录AstronClaw (opens new window)即可使用,高峰期权益到账或存在 1~3 分钟延迟。
- 详细使用说明,请参考 AstronClaw 配套使用教程 (opens new window)
# 八、订阅管理
# 8.1 订阅与购买
- 登录讯飞星辰 MaaS 平台,进入 Astron Token Plan 套餐订阅 页面。
- 选择标准成员 / 高级成员 / 尊享成员,每个套餐订阅支付完成后,开始计算套餐生效时间和流控周期,各版本月套餐支付完成后的使用有效期为31天。
- 在套餐订阅页可查看(查阅内容以页面实际展示内容为准):当前套餐、周期性用量、API Key与升级入口。
# 8.2 套餐升级与叠加
- 升级:支持从标准成员升级至高级成员或尊享成员,支持从高级成员升级至尊享成员,升级费用按当前生效套餐剩余天数折算差价。
- 叠加:支持在同一档位多次购买,或多档位混合购买。
- 降级:不支持当前生效套餐从尊享成员或高级成员降级,如需降级使用,需等待当前生效套餐到期后,重新购买更低套餐。
# 8.3 退订与退款
除下列情形以外,Token Plan套餐服务一经购买,不支持退订退款,请谨慎下单:1.由于平台原因,用户付费后无法获得服务;2.法律法规另有规定。
# 8.4 生效时间
- 套餐模型:在配置文件中指定 modelId,即可一键切换所用模型。
- 套餐升级:预计升级后1-3分钟生效并可用。
- AstronClaw会员:高峰期权益到账或存在 1~3 分钟延迟。
- Skill权益:高峰期权益到账或存在 1~3 分钟延迟。
# 九、协议与规范
- 本服务遵循讯飞星辰 MaaS 平台用户协议及相关产品条款。
- 使用 Token Plan 即视为同意本产品文档中的额度用途与使用限制。
- 具体 SLA、计费细则以控制台与最新公告为准。
# 十、错误码列表
| 错误码 | 原因 | 解决方案 |
|---|---|---|
| 401-无效的身份验证 | 身份验证无效。 | 建议优先检查model ID(model ID配置统一为:astron-code-latest)、url、API Key,参考本文第一章内容。 |
| 401-提供的API密钥不正确 | 请求的API密钥不正确。 | 检查所用API密钥是否正确。 |
| 403-不支持的国家、地区或领土 | 您正在从不支持的国家、地区或领土访问API。 | 检查所用API密钥是否正确,确保API密钥从订阅页面(https://maas.xfyun.cn/packageSubscription)复制使用 |
| 429-请求速率限制已达上限 | 您发送请求过快。 | 控制请求频率,阅读速率限制指南。 |
| 429-超出当前配额,请检查计划和计费详情 | 您的额度已用尽或已达到每月最高消费限制。 | 购买更多额度或了解如何提高使用限制。 |
| 500-服务器处理请求时发生错误 | 服务器内部出现问题。 | 稍后重试请求;若问题持续,请联系我们查看状态页面。 |
| 503-引擎当前过载,请稍后重试 | 服务器流量过大。 | 稍候重试您的请求。 |
| 0 | 成功 | |
| 10000 | 升级为ws出现错误 | |
| 10001 | 通过ws读取用户的消息 出错 | |
| 10002 | 通过ws向用户发送消息 出错 | |
| 10003 | 用户的消息格式有错误 | |
| 10004 | 用户数据的schema错误 | |
| 10005 | 用户参数值有错误 | |
| 10006 | 用户并发错误:当前用户已连接,同一用户不能多处同时连接。 | |
| 10007 | 用户流量受限:服务正在处理用户当前的问题,需等待处理完成后再发送新的请求。(必须要等大模型完全回复之后,才能发送下一个问题) | |
| 10008 | 服务容量不足,联系服务商 | |
| 10009 | 和引擎建立连接失败 | |
| 10010 | 接收引擎数据的错误,或引擎处于排队状态,建议切换模型重试 | |
| 10011 | 向引擎发送数据的错误 | |
| 10013 | 用户问题涉及敏感信息,审核不通过,拒绝处理此次请求。 | |
| 10014 | 回复结果涉及到敏感信息,审核不通过,后续结果无法展示给用户。(建议清空当前结果,并给用户提示/警告:该答案涉及到敏感/政治/恐怖/色情/暴力等方面,不予显示/回复) | |
| 10015 | appid在黑名单中 | |
| 10016 | appid授权类的错误。比如:未开通此功能,未开通对应版本,token不足,并发超过授权等等。(联系我们开通授权或提高限制) | |
| 10018 | 用户在5分钟内持续发送ping消息,但并没有实际请求数据,会返回该错误码并断开ws连接。短链接使用无需关注 | |
| 10019 | 该错误码表示返回结果疑似敏感,建议拒绝用户继续交互 | |
| 10110 | 服务忙,请稍后再试。 | |
| 10163 | 请求引擎的参数异常,引擎的schema检查不通过。 | |
| 10222 | 引擎网络异常 | |
| 10223 | LB找不到引擎节点 | |
| 10404 | 用户配置参数值有错误 | 建议优先检查model ID(model ID配置统一为:astron-code-latest)、url、API Key,参考本文第一章内容。 |
| 10907 | token数量超过上限。对话历史+问题的字数太多,需要精简输入。 | |
| 10910 | token数量超过上限。需要控制输入长度或输出长度。 | 使用DeepSeek-V3.2时contextWindow建议配置为96k以下,maxTokens配置为32k以下;使用GLM-5时contextWindow建议配置为96k以下,会明显提升服务响应和工具体验(配置上限为256k);其余模型建议配置为128k以下。 |
| 11200 | 授权错误:该appid没有相关功能的授权或者业务量超过限制 | |
| 11201 | 次数超限。超过当前最大调用次数限制。 | |
| 11202 | 授权错误:秒级流控超限。秒级并发超过授权路数限制。 | |
| 11203 | 授权错误:并发流控超限。并发路数超过授权路数限制。 | |
| 11221 | 模型配置错误:当前套餐不支持您在控制台或配置文件中指定的模型,请更换可用模型或升级套餐。 | |
| 11210 | tpm超限。超过当前最大tpm限制,注意:tpm每分钟动态刷新,建议您等待后重试。 | |
| 10012 | 引擎内部错误,或引擎处于排队状态,建议切换模型重试 | 常见原因:上下文超长 1、可配置 contextWindow 上下文窗长和 maxTokens 最大输出长度两个参数(使用DeepSeek-V3.2时contextWindow建议配置为96k以下,maxTokens配置为32k以下;使用GLM-5时contextWindow建议配置为96k以下,会明显提升服务响应和工具体验;其余模型建议配置为128k以下) 2、主动管理对话:使用 /compact 命令 — 压缩当前对话上下文;使用 /new 命令 — 开启新会话,清空历史 |
# 十一、联系我们
本文档由讯飞星辰 MaaS 平台团队维护。如有疑问可扫描下方社群二维码,入群反馈问题并获取技术支持。
![]()