Ajustes de IA
Estos ajustes controlan qué modelo de IA impulsa tu experiencia y cómo se comporta. Se aplican globalmente a todos los mundos. Los encuentras en Ajustes > Configuración de IA.
Elegir un modelo
Yumina ofrece una selección curada de modelos en cuatro niveles de costo:
| Nivel | Ejemplos | Notas |
|---|---|---|
| Budget | Yumina Free, Gemini 2.5 Flash Lite, DeepSeek V4 Flash, DeepSeek V3.2, Claude 3 Haiku | Bueno para juego casual. Claude 3 Haiku es el predeterminado de la plataforma (promedio ~5 mushies / mensaje). |
| Standard | Gemini 3.1 Flash Lite, Gemini 2.5 Flash, Gemini 3 Flash, DeepSeek V4 Pro | Mejor calidad de escritura y seguimiento de instrucciones. |
| Premium | Claude Haiku 4.5, Grok 4.20, Gemini 3.1 Pro | Caracterización y coherencia narrativa notablemente mejores. Requiere plan Gold o superior. |
| Ultra | Claude Sonnet 4.6, Claude Opus 4.7 | La mejor calidad de escritura disponible. Requiere plan Platinum o superior. |
Los niveles más altos cuestan más mushies por respuesta pero producen mejor escritura. Si no estás seguro, empieza con el predeterminado (Claude 3 Haiku) y experimenta desde ahí.
Qué cambió recientemente
- Claude 3 Haiku ahora es el modelo predeterminado (reemplazando a Grok 4.1 Fast, que fue retirado).
- DeepSeek V4 Flash añadido al nivel budget con precios actualizados.
- El selector de modelos muestra puntos de colores según el nivel de costo (esmeralda = Budget, azul = Standard, púrpura = Premium, ámbar = Ultra) para que puedas escanear la lineup de un vistazo.
Modelos fijados
Puedes fijar hasta 8 modelos para acceso rápido en el selector de modelos. Cuatro están fijados por defecto. Ve a Ajustes > Configuración de IA > Tus Modelos para gestionar los fijados. Haz clic en cualquier modelo fijado para establecerlo como tu predeterminado.
Usados recientemente
Los modelos que has usado recientemente aparecen debajo de tu lista de fijados (si no están ya fijados). Puedes fijarlos desde ahí.
Tamaño de contexto
Qué es: Cuánto historial de conversación puede "ver" la IA al generar una respuesta, medido en tokens. Más contexto significa que la IA recuerda más de lo que pasó antes en tu sesión.
Límites por plan: 64.000 tokens en Free, 96.000 tokens en Gold, sin límite (hasta el máximo nativo del modelo — típicamente 200k, hasta ~2M para algunos modelos) en Platinum y superiores. BYOK no tiene límite en ningún plan.
Recomendación: Para la mayoría del juego, 42k–62k es el punto óptimo -- suficiente contexto para que la IA mantenga consistencia narrativa sin costo innecesario. Pasar de 96k rara vez mejora la experiencia a menos que estés en una sesión muy larga con estado complejo. El ajuste está en Ajustes > Configuración de IA > Tamaño de Contexto.
Creatividad (temperatura)
El slider de temperatura controla qué tan aleatorias/creativas son las respuestas de la IA:
- Más baja (alrededor de 0.7): Más predecible, enfocada, consistente. Buena para juegos de estrategia o mundos donde la precisión importa.
- Más alta (1.1–1.2): Más creativa, variada. Buena para escritura creativa y exploración.
- Predeterminado: 1.0 -- balanceado para la mayoría de los casos de uso.
El slider en Ajustes va de 0.5 a 1.5, pero ambos extremos son extremos: 1.3 ya es bastante alto y para 1.5 la escritura usualmente empieza a desmoronarse; por debajo de 0.7 el modelo se vuelve visiblemente mecánico. Los ajustes del día a día viven en 0.8–1.2 -- solo empuja más allá de 1.3 si estás persiguiendo deliberadamente un efecto de "soltarse".
Longitud de respuesta (max tokens)
Controla la longitud máxima de una sola respuesta de la IA. El predeterminado es 12.000 tokens. Aumenta para respuestas más largas y detalladas; disminuye para intercambios más ágiles y concisos. Rango: 256 a 32.768.
Esfuerzo de razonamiento
Para modelos que soportan razonamiento (Claude, GPT-5), esto controla cuánto "piensa" la IA antes de responder:
| Nivel | Efecto |
|---|---|
| Mínimo | Menor pensamiento, respuestas más rápidas, menor costo |
| Bajo | Razonamiento ligero (predeterminado) |
| Medio | Respuestas más cuidadosas |
| Alto | Más exhaustivo, más lento, mayor costo |
Para la mayoría del roleplay y ficción interactiva, Bajo está bien. Súbelo si la IA está cometiendo errores lógicos u olvidando restricciones.
Streaming
Cuando está activado (predeterminado), las respuestas de la IA aparecen token por token mientras se generan. Cuando está desactivado, la respuesta completa aparece de una vez después de que la generación se complete. Mantenlo activado a menos que tu conexión sea inestable.
Parámetros de muestreo avanzados
Bajo el toggle de Parámetros Avanzados en Configuración de IA:
| Parámetro | Predeterminado | Qué hace |
|---|---|---|
| Top P | 1.0 | Nucleus sampling -- limita el grupo de candidatos al top P% de tokens probables. Más bajo = más enfocado. |
| Frequency Penalty | 0.0 | Reduce la repetición de palabras. Prueba 0.3-0.5 si la IA sigue repitiéndose. |
| Presence Penalty | 0.0 | Fomenta nuevos temas. Prueba 0.2-0.3 si la IA sigue girando alrededor de las mismas ideas. |
| Top K | 0 (desactivado) | Límite estricto en tokens candidatos. Normalmente no se necesita junto con Top P. |
| Min P | 0 (desactivado) | Umbral de probabilidad mínima. Alternativa más inteligente a Top K. |
Regla general: Ajusta primero la temperatura. Solo toca estos si la temperatura por sí sola no resuelve tu problema, y cambia uno a la vez.
Bring Your Own Key (BYOK)
Puedes usar tu propia clave API en lugar de los créditos de Yumina. Ve a Ajustes > Configuración de IA y cambia al modo Clave Privada.
Proveedores soportados:
| Proveedor | Dónde obtener una clave |
|---|---|
| OpenRouter | openrouter.ai/keys -- una clave desbloquea cientos de modelos |
| Anthropic | console.anthropic.com |
| OpenAI | platform.openai.com |
| aistudio.google.dev | |
| Ollama | ollama.com -- ejecuta modelos localmente |
| Personalizado (compatible con OpenAI) | Pega cualquier URL base compatible con OpenAI — DeepSeek, xAI (Grok), Mistral, Groq, Together, Fireworks, Moonshot, tu propio proxy. Presets de un clic cubren los más comunes. |
Configuración:
- Cambia el toggle de proveedor de Yumina API a Clave Privada
- Selecciona tu proveedor e ingresa tu clave
- Haz clic en verificar para probar la clave
Tu clave está encriptada en reposo (AES-256-GCM). La clave en bruto nunca se devuelve desde el servidor después de almacenarla -- solo metadatos (proveedor, etiqueta, sufijo enmascarado).
Con BYOK, no tienes límite de tamaño de contexto y acceso a cualquier modelo que tu proveedor ofrezca. Los costos van directamente a tu proveedor de API en lugar de a los créditos de Yumina.
Prompts personalizados
Una función avanzada para ajustar el comportamiento de la IA en todos los mundos. Se encuentra en Ajustes > Configuración de IA en la parte inferior.
Puedes inyectar tus propios prompts en tres posiciones:
- Sistema -- en el prompt del sistema (efecto más fuerte)
- En-Chat -- en medio del historial del chat
- Final -- al final mismo, justo antes de que la IA responda
Usa esto si la IA se comporta consistentemente mal de una manera específica (siempre olvidando una regla, siempre respondiendo en el idioma incorrecto, etc.). La mayoría de los jugadores no necesitará esto.
Presets de prompt
El creador de cada mundo configura presets de prompt predeterminados. Puedes elegir:
- Usar del Creador -- usa lo que el creador pretendía (recomendado)
- Usar el Mío -- sobreescribe con tu propia configuración
A menos que entiendas la arquitectura de prompts, déjalo en el del Creador. Cambiar presets puede romper mundos de formas sutiles.
