Ajustes de IA

Estos ajustes controlan qué modelo de IA impulsa tu experiencia y cómo se comporta. Se aplican globalmente a todos los mundos. Los encuentras en Ajustes > Configuración de IA.

Elegir un modelo

Yumina ofrece una selección curada de modelos en cuatro niveles de costo:

Nivel	Ejemplos	Notas
Budget	Yumina Free, Gemini 2.5 Flash Lite, DeepSeek V4 Flash, DeepSeek V3.2, Claude 3 Haiku	Bueno para juego casual. Claude 3 Haiku es el predeterminado de la plataforma (promedio ~5 mushies / mensaje).
Standard	Gemini 3.1 Flash Lite, Gemini 2.5 Flash, Gemini 3 Flash, DeepSeek V4 Pro	Mejor calidad de escritura y seguimiento de instrucciones.
Premium	Claude Haiku 4.5, Grok 4.20, Gemini 3.1 Pro	Caracterización y coherencia narrativa notablemente mejores. Requiere plan Gold o superior.
Ultra	Claude Sonnet 4.6, Claude Opus 4.7	La mejor calidad de escritura disponible. Requiere plan Platinum o superior.

Los niveles más altos cuestan más mushies por respuesta pero producen mejor escritura. Si no estás seguro, empieza con el predeterminado (Claude 3 Haiku) y experimenta desde ahí.

Qué cambió recientemente

Claude 3 Haiku ahora es el modelo predeterminado (reemplazando a Grok 4.1 Fast, que fue retirado).
DeepSeek V4 Flash añadido al nivel budget con precios actualizados.
El selector de modelos muestra puntos de colores según el nivel de costo (esmeralda = Budget, azul = Standard, púrpura = Premium, ámbar = Ultra) para que puedas escanear la lineup de un vistazo.

Modelos fijados

Puedes fijar hasta 8 modelos para acceso rápido en el selector de modelos. Cuatro están fijados por defecto. Ve a Ajustes > Configuración de IA > Tus Modelos para gestionar los fijados. Haz clic en cualquier modelo fijado para establecerlo como tu predeterminado.

Usados recientemente

Los modelos que has usado recientemente aparecen debajo de tu lista de fijados (si no están ya fijados). Puedes fijarlos desde ahí.

Tamaño de contexto

Qué es: Cuánto historial de conversación puede "ver" la IA al generar una respuesta, medido en tokens. Más contexto significa que la IA recuerda más de lo que pasó antes en tu sesión.

Límites por plan: 64.000 tokens en Free, 96.000 tokens en Gold, sin límite (hasta el máximo nativo del modelo — típicamente 200k, hasta ~2M para algunos modelos) en Platinum y superiores. BYOK no tiene límite en ningún plan.

Recomendación: Para la mayoría del juego, 42k–62k es el punto óptimo -- suficiente contexto para que la IA mantenga consistencia narrativa sin costo innecesario. Pasar de 96k rara vez mejora la experiencia a menos que estés en una sesión muy larga con estado complejo. El ajuste está en Ajustes > Configuración de IA > Tamaño de Contexto.

Creatividad (temperatura)

El slider de temperatura controla qué tan aleatorias/creativas son las respuestas de la IA:

Más baja (alrededor de 0.7): Más predecible, enfocada, consistente. Buena para juegos de estrategia o mundos donde la precisión importa.
Más alta (1.1–1.2): Más creativa, variada. Buena para escritura creativa y exploración.
Predeterminado: 1.0 -- balanceado para la mayoría de los casos de uso.

El slider en Ajustes va de 0.5 a 1.5, pero ambos extremos son extremos: 1.3 ya es bastante alto y para 1.5 la escritura usualmente empieza a desmoronarse; por debajo de 0.7 el modelo se vuelve visiblemente mecánico. Los ajustes del día a día viven en 0.8–1.2 -- solo empuja más allá de 1.3 si estás persiguiendo deliberadamente un efecto de "soltarse".

Longitud de respuesta (max tokens)

Controla la longitud máxima de una sola respuesta de la IA. El predeterminado es 12.000 tokens. Aumenta para respuestas más largas y detalladas; disminuye para intercambios más ágiles y concisos. Rango: 256 a 32.768.

Esfuerzo de razonamiento

Para modelos que soportan razonamiento (Claude, GPT-5), esto controla cuánto "piensa" la IA antes de responder:

Nivel	Efecto
Mínimo	Menor pensamiento, respuestas más rápidas, menor costo
Bajo	Razonamiento ligero (predeterminado)
Medio	Respuestas más cuidadosas
Alto	Más exhaustivo, más lento, mayor costo

Para la mayoría del roleplay y ficción interactiva, Bajo está bien. Súbelo si la IA está cometiendo errores lógicos u olvidando restricciones.

Streaming

Cuando está activado (predeterminado), las respuestas de la IA aparecen token por token mientras se generan. Cuando está desactivado, la respuesta completa aparece de una vez después de que la generación se complete. Mantenlo activado a menos que tu conexión sea inestable.

Parámetros de muestreo avanzados

Bajo el toggle de Parámetros Avanzados en Configuración de IA:

Parámetro	Predeterminado	Qué hace
Top P	1.0	Nucleus sampling -- limita el grupo de candidatos al top P% de tokens probables. Más bajo = más enfocado.
Frequency Penalty	0.0	Reduce la repetición de palabras. Prueba 0.3-0.5 si la IA sigue repitiéndose.
Presence Penalty	0.0	Fomenta nuevos temas. Prueba 0.2-0.3 si la IA sigue girando alrededor de las mismas ideas.
Top K	0 (desactivado)	Límite estricto en tokens candidatos. Normalmente no se necesita junto con Top P.
Min P	0 (desactivado)	Umbral de probabilidad mínima. Alternativa más inteligente a Top K.

Regla general: Ajusta primero la temperatura. Solo toca estos si la temperatura por sí sola no resuelve tu problema, y cambia uno a la vez.

Bring Your Own Key (BYOK)

Puedes usar tu propia clave API en lugar de los créditos de Yumina. Ve a Ajustes > Configuración de IA y cambia al modo Clave Privada.

Proveedores soportados:

Proveedor	Dónde obtener una clave
OpenRouter	openrouter.ai/keys -- una clave desbloquea cientos de modelos
Anthropic	console.anthropic.com
OpenAI	platform.openai.com
Google	aistudio.google.dev
Ollama	ollama.com -- ejecuta modelos localmente
Personalizado (compatible con OpenAI)	Pega cualquier URL base compatible con OpenAI — DeepSeek, xAI (Grok), Mistral, Groq, Together, Fireworks, Moonshot, tu propio proxy. Presets de un clic cubren los más comunes.

Configuración:

Cambia el toggle de proveedor de Yumina API a Clave Privada
Selecciona tu proveedor e ingresa tu clave
Haz clic en verificar para probar la clave

Tu clave está encriptada en reposo (AES-256-GCM). La clave en bruto nunca se devuelve desde el servidor después de almacenarla -- solo metadatos (proveedor, etiqueta, sufijo enmascarado).

Con BYOK, no tienes límite de tamaño de contexto y acceso a cualquier modelo que tu proveedor ofrezca. Los costos van directamente a tu proveedor de API en lugar de a los créditos de Yumina.

Prompts personalizados

Una función avanzada para ajustar el comportamiento de la IA en todos los mundos. Se encuentra en Ajustes > Configuración de IA en la parte inferior.

Puedes inyectar tus propios prompts en tres posiciones:

Sistema -- en el prompt del sistema (efecto más fuerte)
En-Chat -- en medio del historial del chat
Final -- al final mismo, justo antes de que la IA responda

Usa esto si la IA se comporta consistentemente mal de una manera específica (siempre olvidando una regla, siempre respondiendo en el idioma incorrecto, etc.). La mayoría de los jugadores no necesitará esto.

Presets de prompt

El creador de cada mundo configura presets de prompt predeterminados. Puedes elegir:

Usar del Creador -- usa lo que el creador pretendía (recomendado)
Usar el Mío -- sobreescribe con tu propia configuración

A menos que entiendas la arquitectura de prompts, déjalo en el del Creador. Cambiar presets puede romper mundos de formas sutiles.

Ajustes de IA ​

Elegir un modelo ​

Modelos fijados ​

Usados recientemente ​

Tamaño de contexto ​

Creatividad (temperatura) ​

Longitud de respuesta (max tokens) ​

Esfuerzo de razonamiento ​

Streaming ​

Parámetros de muestreo avanzados ​

Bring Your Own Key (BYOK) ​

Prompts personalizados ​

Presets de prompt ​