AI設定
これらの設定は、あなたの体験を支えるAIモデルとその挙動を制御します。すべてのワールドにグローバルに適用されます。設定 > AI構成から見つけられます。
モデルを選ぶ
Yuminaは4つのコスト階層にわたって厳選されたモデルラインナップを提供しています。
| 階層 | 例 | 備考 |
|---|---|---|
| Budget | Yumina Free、Gemini 2.5 Flash Lite、DeepSeek V4 Flash、DeepSeek V3.2、Claude 3 Haiku | カジュアルプレイに適しています。Claude 3 Haikuはプラットフォームのデフォルトです(平均 ~5マッシュ/メッセージ)。 |
| Standard | Gemini 3.1 Flash Lite、Gemini 2.5 Flash、Gemini 3 Flash、DeepSeek V4 Pro | より高品質な文章と指示への追従性。 |
| Premium | Claude Haiku 4.5、Grok 4.20、Gemini 3.1 Pro | キャラクター造形と物語の一貫性が明らかに向上。Goldプラン以上が必要です。 |
| Ultra | Claude Sonnet 4.6、Claude Opus 4.7 | 利用可能な最高品質の文章。Platinumプラン以上が必要です。 |
階層が高いほど応答あたりのマッシュ消費は増えますが、より良い文章が得られます。迷ったら、まずデフォルト(Claude 3 Haiku)から始めて、そこから試してみてください。
最近の変更点
- Claude 3 Haikuが新しいデフォルトモデルになりました(廃止されたGrok 4.1 Fastに代わって)。
- DeepSeek V4 FlashがBudget階層に新価格で追加されました。
- モデルピッカーには色付きのコスト階層ドット(エメラルド = Budget、ブルー = Standard、パープル = Premium、アンバー = Ultra)が表示され、ラインナップを一目で確認できます。
ピン留めモデル
モデルピッカーでの素早いアクセスのため、最大8つのモデルをピン留めできます。デフォルトでは4つがピン留めされています。設定 > AI構成 > マイモデルでピン留めを管理できます。ピン留めしたモデルをクリックすると、デフォルトとして設定できます。
最近使用したモデル
最近使用したモデルは、ピン留めリストの下に表示されます(まだピン留めされていない場合)。そこからピン留めもできます。
コンテキストサイズ
何か: 応答を生成する際にAIが「見える」会話履歴の量で、トークン数で測定されます。コンテキストが多いほど、セッション内で以前に起きたことをAIがより多く記憶できます。
プランの上限: Freeは64,000トークン、Goldは96,000トークン、Platinum以上では無制限(モデルのネイティブ最大値まで。通常200k、一部モデルでは最大 ~2M)。BYOKはどのプランでも無制限です。
推奨値: ほとんどのプレイでは、42k〜62kがスイートスポットです。不必要なコストをかけずに、AIが物語の一貫性を保つのに十分なコンテキストになります。96kを超えるのは、複雑な状態を持つ非常に長いセッションでない限り、ほとんど体験を改善しません。設定は設定 > AI構成 > コンテキストサイズにあります。
創造性(temperature)
temperatureスライダーはAIの応答のランダムさ・創造性を制御します。
- 低め(0.7前後): より予測可能で、焦点が定まり、一貫性があります。戦略ゲームや精度が重要なワールドに向いています。
- 高め(1.1〜1.2): より創造的で多様性があります。創作的な執筆や探索的なプレイに向いています。
- デフォルト: 1.0 -- ほとんどの用途でバランスの取れた値。
設定のスライダーは0.5から1.5の範囲ですが、両端はどちらも極端です。1.3はすでにかなり高く、1.5になるとたいてい文章が崩れ始めます。0.7を下回るとモデルは明らかに機械的になります。日常的な調整は0.8〜1.2の範囲で行います。1.3を超えるのは、意図的に「タガを外した」効果を狙うときだけにしましょう。
応答の長さ(max tokens)
1つのAI応答の最大長を制御します。デフォルトは12,000トークンです。長く詳細な応答にしたければ増やし、短くスナップ感のあるやり取りにしたければ減らします。範囲は256〜32,768です。
推論の強さ(Reasoning effort)
推論をサポートするモデル(Claude、GPT-5)では、応答前のAIの「考える量」を制御します。
| レベル | 効果 |
|---|---|
| Minimal | 思考は最小、応答最速、コスト最低 |
| Low | 軽めの推論(デフォルト) |
| Medium | より慎重な応答 |
| High | 最も徹底的、最も遅く、コスト最高 |
ほとんどのロールプレイとインタラクティブフィクションではLowで十分です。AIが論理的なミスをしたり制約を忘れたりする場合は、上げてみましょう。
ストリーミング
オン(デフォルト)の場合、AIの応答は生成されるそばからトークン単位で表示されます。オフの場合は、生成が完了した後に応答全体が一度に表示されます。接続が不安定でない限り、オンのままにしておきましょう。
高度なサンプリングパラメーター
AI構成の高度なパラメータートグルの下:
| パラメーター | デフォルト | 内容 |
|---|---|---|
| Top P | 1.0 | Nucleusサンプリング -- 候補プールを確率の高い上位P%のトークンに限定。低いほど焦点が定まる。 |
| Frequency Penalty | 0.0 | 単語の繰り返しを減らす。AIが同じ表現を繰り返すなら0.3-0.5を試す。 |
| Presence Penalty | 0.0 | 新しいトピックを促す。AIが同じアイデアを巡り続けるなら0.2-0.3を試す。 |
| Top K | 0(オフ) | 候補トークンのハードリミット。Top Pと併用する必要は通常なし。 |
| Min P | 0(オフ) | 最小確率閾値。Top Kよりも賢い代替手段。 |
鉄則: まずtemperatureを調整します。temperatureだけで問題が解決しない場合のみこれらに触れ、一度に1つずつ変更しましょう。
Bring Your Own Key(BYOK)
Yuminaクレジットの代わりに自分のAPIキーを使うことができます。設定 > AI構成でプライベートキーモードに切り替えてください。
対応プロバイダー:
| プロバイダー | キーの取得先 |
|---|---|
| OpenRouter | openrouter.ai/keys -- 1つのキーで数百のモデルにアクセス可能 |
| Anthropic | console.anthropic.com |
| OpenAI | platform.openai.com |
| aistudio.google.dev | |
| Ollama | ollama.com -- モデルをローカルで実行 |
| カスタム(OpenAI互換) | OpenAI互換のベースURLを貼り付け -- DeepSeek、xAI(Grok)、Mistral、Groq、Together、Fireworks、Moonshot、自前のプロキシなど。よく使うものはワンクリックプリセットでカバー。 |
セットアップ:
- プロバイダーのトグルをYumina APIからプライベートキーに切り替え
- プロバイダーを選択し、キーを入力
- 検証ボタンをクリックしてキーをテスト
キーは保存時に暗号化されます(AES-256-GCM)。生のキーが保存後にサーバーから返されることはありません。返ってくるのはメタデータ(プロバイダー、ラベル、マスクされた末尾)のみです。
BYOKを使うと、コンテキストサイズの上限がなくなり、プロバイダーが提供するあらゆるモデルにアクセスできます。コストはYuminaクレジットではなく、直接APIプロバイダーに支払われます。
カスタムプロンプト
すべてのワールドでAIの挙動を調整するための高度な機能です。設定 > AI構成の最下部にあります。
3つの位置に自分のプロンプトを挿入できます。
- System -- システムプロンプトに挿入(最も強い効果)
- In-Chat -- チャット履歴の中間に挿入
- Final -- 最後、AIが応答する直前に挿入
AIが特定の挙動で常に問題を起こす(あるルールを常に忘れる、間違った言語で常に応答するなど)場合に使ってください。ほとんどのプレイヤーにとっては不要です。
プロンプトプリセット
すべてのワールドのクリエイターがデフォルトのプロンプトプリセットを設定します。以下から選べます。
- クリエイター設定を使用 -- クリエイターが意図したものを使用(推奨)
- 自分の設定を使用 -- 自分の構成で上書き
プロンプトアーキテクチャを理解していない限り、クリエイター設定のままにしておきましょう。プリセットを変えると、ワールドが分かりにくい形で壊れることがあります。
