AI 设置

这些设置控制为你提供体验的 AI 模型及其行为方式。它们在所有世界中全局生效。你可以在设置 > AI 配置中找到它们。

选择模型

Yumina 提供四个价格档位的精选模型：

档位	示例	说明
经济	Yumina Free、Gemini 2.5 Flash Lite、DeepSeek V4 Flash、DeepSeek V3.2、Claude 3 Haiku	适合休闲游玩。Claude 3 Haiku 是平台默认模型（平均每条消息约消耗 5 mushies）。
标准	Gemini 3.1 Flash Lite、Gemini 2.5 Flash、Gemini 3 Flash、DeepSeek V4 Pro	更好的写作质量和指令遵从能力。
高级	Claude Haiku 4.5、Grok 4.20、Gemini 3.1 Pro	角色塑造和叙事连贯性明显更好。需要 Gold 套餐或以上。
旗舰	Claude Sonnet 4.6、Claude Opus 4.7	最高写作质量。需要 Platinum 套餐或以上。

更高档位每次回复消耗更多 mushies，但写作质量更好。如果不确定，从默认模型（Claude 3 Haiku）开始，然后自行尝试。

置顶模型

你可以置顶最多 8 个模型，方便在模型选择器中快速切换。默认已置顶四个。前往设置 > AI 配置 > 你的模型来管理置顶列表。点击任意置顶模型可将其设为默认。

上下文长度

什么是上下文长度： AI 生成回复时能够「看到」多少对话历史，以 token 为单位。上下文越大，AI 能记住你会话中更早发生的事情就越多。

套餐上限： 免费 64,000 tokens / Gold 96,000 tokens / Platinum 及以上不限（按模型原生最大值，一般 200k，部分模型可达 ~2M）。BYOK 在所有套餐都不限。

建议： 对于大多数游玩场景，42k-62k 是最佳范围——足够让 AI 保持叙事一致性，又不会产生不必要的消耗。除非你在一个状态复杂的超长会话中，否则超过 96k 很少能改善体验。设置位置在设置 > AI 配置 > 上下文长度。

创造力（温度）

温度滑块控制 AI 回复的随机性和创造力：

偏低（0.7 左右）： 更可预测、专注、一致。适合策略游戏或需要精确性的世界。
偏高（1.1–1.2）： 更有创意、多变。适合创意写作和探索。
默认值：1.0 —— 适用于大多数场景的平衡值。

设置中的滑块范围是 0.5 到 1.5，但两端都属于极端值：1.3 已经算是相当高了，到 1.5 文风通常会开始失控；低于 0.7 则会明显变得机械。日常调整在 0.8–1.2 之间就够用了，超过 1.3 只在你刻意追求"放飞"效果时才考虑。

回复长度（最大 token 数）

控制单次 AI 回复的最大长度。默认值为 12,000 tokens。增大可以获得更长、更详细的回复；减小可以获得更简洁、更紧凑的回复。范围：256 到 32,768。

推理强度

对于支持推理的模型（Claude、GPT-5），此设置控制 AI 在回复前进行多少「思考」：

级别	效果
最小	最少思考，最快回复，最低消耗
低	轻度推理（默认）
中	更谨慎的回复
高	最彻底，最慢，最高消耗

对于大多数角色扮演和互动小说场景，「低」就足够了。如果 AI 出现逻辑错误或忘记约束条件，可以提高推理强度。

流式输出

开启时（默认），AI 回复会在生成过程中逐 token 显示。关闭时，完整回复会在生成完成后一次性显示。除非你的网络连接不稳定，否则建议保持开启。

高级采样参数

在 AI 配置中的高级参数开关下：

参数	默认值	说明
Top P	1.0	核采样——将候选 token 池限制在概率最高的前 P%。值越低越集中。
Frequency Penalty	0.0	减少词语重复。如果 AI 总是重复自己，可以试试 0.3-0.5。
Presence Penalty	0.0	鼓励新话题。如果 AI 总是围绕同样的想法打转，可以试试 0.2-0.3。
Top K	0（关闭）	候选 token 的硬性上限。通常与 Top P 同时使用时不需要。
Min P	0（关闭）	最小概率阈值。是 Top K 的更智能替代方案。

经验法则： 先调整温度。只有当温度本身无法解决问题时才调整这些参数，而且一次只改一个。

自带密钥 (BYOK)

你可以使用自己的 API 密钥来代替 Yumina 积分。前往设置 > AI 配置并切换到私有密钥模式。

支持的服务商：

服务商	获取密钥
OpenRouter	openrouter.ai/keys —— 一个密钥解锁数百个模型
Anthropic	console.anthropic.com
OpenAI	platform.openai.com
Google	aistudio.google.dev
Ollama	ollama.com —— 在本地运行模型
自定义（OpenAI 兼容）	粘贴任意 OpenAI 兼容的 base URL —— DeepSeek、xAI (Grok)、Mistral、Groq、Together、Fireworks、Moonshot，或你自己的代理。常见服务商有一键预设。

设置步骤：

将服务商开关从「Yumina API」切换到「私有密钥」
选择你的服务商并输入密钥
点击验证来测试密钥

你的密钥在存储时会被加密（AES-256-GCM）。原始密钥在存储后永远不会从服务器返回——只会返回元数据（服务商、标签、脱敏后缀）。

使用 BYOK 后，你没有上下文长度上限，并且可以使用你的服务商提供的任何模型。费用直接由你的 API 服务商收取，而不是消耗 Yumina 积分。

自定义提示词

这是一个高级功能，用于在所有世界中调整 AI 行为。位于设置 > AI 配置底部。

你可以在三个位置注入自己的提示词：

系统 —— 注入到系统提示词中（效果最强）
聊天中 —— 注入到聊天历史的中间位置
末尾 —— 在最末尾，AI 回复之前

如果 AI 总是在某个方面表现不正确（总是忘记某条规则、总是用错误的语言回复等），可以使用此功能。大多数玩家不需要这个。

提示词预设

每个世界的创作者都会设置默认的提示词预设。你可以选择：

使用创作者的 —— 使用创作者设定的配置（推荐）
使用自己的 —— 用你自己的配置覆盖

除非你了解提示词架构，否则建议保持使用创作者的设置。更改预设可能会以微妙的方式破坏世界的体验。

AI 设置 ​

选择模型 ​

置顶模型 ​

最近使用 ​

上下文长度 ​

创造力（温度） ​

回复长度（最大 token 数） ​

推理强度 ​

流式输出 ​

高级采样参数 ​

自带密钥 (BYOK) ​

自定义提示词 ​

提示词预设 ​