AI 设置
这些设置控制为你提供体验的 AI 模型及其行为方式。它们在所有世界中全局生效。你可以在设置 > AI 配置中找到它们。
选择模型
Yumina 提供四个价格档位的精选模型:
| 档位 | 示例 | 说明 |
|---|---|---|
| 经济 | Yumina Free、Gemini 2.5 Flash Lite、Grok 4.1 Fast、DeepSeek V3.2 | 适合休闲游玩。Grok 4.1 Fast 是平台默认模型。 |
| 标准 | Gemini 2.5 Flash、Gemini 3 Flash、DeepSeek V4 Pro | 更好的写作质量和指令遵从能力。 |
| 高级 | Claude Haiku 4.5、Grok 4.20、Gemini 3.1 Pro | 角色塑造和叙事连贯性明显更好。需要 Go 计划或以上。 |
| 旗舰 | Claude Sonnet 4.6、Claude Opus 4.7 | 最高写作质量。需要 Plus 计划或以上。 |
更高档位每次回复消耗更多积分,但写作质量更好。如果不确定,从默认模型(Grok 4.1 Fast)开始,然后自行尝试。
置顶模型
你可以置顶最多 8 个模型,方便在模型选择器中快速切换。默认已置顶四个。前往设置 > AI 配置 > 你的模型来管理置顶列表。点击任意置顶模型可将其设为默认。
最近使用
你最近使用过的模型会显示在置顶列表下方(如果它们还未被置顶)。你可以从那里将它们置顶。
上下文长度
什么是上下文长度: AI 生成回复时能够「看到」多少对话历史,以 token 为单位。上下文越大,AI 能记住你会话中更早发生的事情就越多。
默认值: 64,000 tokens(免费计划)/ 96,000 tokens(Gold 计划)/ 最高 2M(使用 BYOK 时)。
建议: 对于大多数游玩场景,42k-62k 是最佳范围——足够让 AI 保持叙事一致性,又不会产生不必要的消耗。除非你在一个状态复杂的超长会话中,否则超过 96k 很少能改善体验。设置位置在设置 > AI 配置 > 上下文长度。
免费计划用户的上下文长度有上限。升级计划或使用 BYOK 可以解除限制。
创造力(温度)
温度滑块控制 AI 回复的随机性和创造力:
- 偏低(接近 0.5): 更可预测、专注、一致。适合策略游戏或需要精确性的世界。
- 偏高(接近 1.5): 更有创意、多变、出人意料。适合创意写作和探索。
- 默认值:1.0 —— 适用于大多数场景的平衡值。
设置中的滑块范围是 0.5 到 1.5。除非你想让 AI 变得明显更加不可预测,否则不建议超过 1.3。
回复长度(最大 token 数)
控制单次 AI 回复的最大长度。默认值为 12,000 tokens。增大可以获得更长、更详细的回复;减小可以获得更简洁、更紧凑的回复。范围:256 到 32,768。
推理强度
对于支持推理的模型(Claude、GPT-5),此设置控制 AI 在回复前进行多少「思考」:
| 级别 | 效果 |
|---|---|
| 最小 | 最少思考,最快回复,最低消耗 |
| 低 | 轻度推理(默认) |
| 中 | 更谨慎的回复 |
| 高 | 最彻底,最慢,最高消耗 |
对于大多数角色扮演和互动小说场景,「低」就足够了。如果 AI 出现逻辑错误或忘记约束条件,可以提高推理强度。
流式输出
开启时(默认),AI 回复会在生成过程中逐 token 显示。关闭时,完整回复会在生成完成后一次性显示。除非你的网络连接不稳定,否则建议保持开启。
高级采样参数
在 AI 配置中的高级参数开关下:
| 参数 | 默认值 | 说明 |
|---|---|---|
| Top P | 1.0 | 核采样——将候选 token 池限制在概率最高的前 P%。值越低越集中。 |
| Frequency Penalty | 0.0 | 减少词语重复。如果 AI 总是重复自己,可以试试 0.3-0.5。 |
| Presence Penalty | 0.0 | 鼓励新话题。如果 AI 总是围绕同样的想法打转,可以试试 0.2-0.3。 |
| Top K | 0(关闭) | 候选 token 的硬性上限。通常与 Top P 同时使用时不需要。 |
| Min P | 0(关闭) | 最小概率阈值。是 Top K 的更智能替代方案。 |
经验法则: 先调整温度。只有当温度本身无法解决问题时才调整这些参数,而且一次只改一个。
自带密钥 (BYOK)
你可以使用自己的 API 密钥来代替 Yumina 积分。前往设置 > AI 配置并切换到私有密钥模式。
支持的服务商:
| 服务商 | 获取密钥 |
|---|---|
| OpenRouter | openrouter.ai/keys —— 一个密钥解锁数百个模型 |
| Anthropic | console.anthropic.com |
| OpenAI | platform.openai.com |
| aistudio.google.dev | |
| Ollama | ollama.com —— 在本地运行模型 |
设置步骤:
- 将服务商开关从「Yumina API」切换到「私有密钥」
- 选择你的服务商并输入密钥
- 点击验证来测试密钥
你的密钥在存储时会被加密(AES-256-GCM)。原始密钥在存储后永远不会从服务器返回——只会返回元数据(服务商、标签、脱敏后缀)。
使用 BYOK 后,你没有上下文长度上限,并且可以使用你的服务商提供的任何模型。费用直接由你的 API 服务商收取,而不是消耗 Yumina 积分。
自定义提示词
这是一个高级功能,用于在所有世界中调整 AI 行为。位于设置 > AI 配置底部。
你可以在三个位置注入自己的提示词:
- 系统 —— 注入到系统提示词中(效果最强)
- 聊天中 —— 注入到聊天历史的中间位置
- 末尾 —— 在最末尾,AI 回复之前
如果 AI 总是在某个方面表现不正确(总是忘记某条规则、总是用错误的语言回复等),可以使用此功能。大多数玩家不需要这个。
提示词预设
每个世界的创作者都会设置默认的提示词预设。你可以选择:
- 使用创作者的 —— 使用创作者设定的配置(推荐)
- 使用自己的 —— 用你自己的配置覆盖
除非你了解提示词架构,否则建议保持使用创作者的设置。更改预设可能会以微妙的方式破坏世界的体验。
