Generación de Imágenes y Videos
Tu agente puede generar imágenes y clips de video cortos a demanda — incluyendo anuncios verticales de 30 segundos con un presentador hablando tu guion con su propia voz y sincronización labial.
Por qué usar MorphMind para esto
No tienes que aprender una herramienta nueva, hacer malabares con tres proveedores ni recordar qué modelo combina con cuál. El agente se encarga de todo eso. Lo que recibes es un flujo de trabajo que se queda contigo:
- Construye la receta una sola vez. Tu flujo de "anuncio de 30 segundos" guarda la voz de tu marca, el avatar del presentador, el encuadre y el ritmo. Vuelve a ejecutarlo con un nuevo brief de producto y obtienes un nuevo anuncio con la misma estética.
- Workflows y Specialists reutilizables. Un paso personalizado que le enseñas al agente — un pulidor de guiones, un formateador de storyboard, un guardián del color de marca — perdura y mejora con cada ejecución.
- Producción masiva variando las entradas. Mismo flujo, diez productos, diez anuncios. Mismo flujo, diez idiomas, diez versiones localizadas.
- Memoria de lo que funciona. El agente aprende qué prompts y modos de referencia te dan el resultado que buscas, y los usa la próxima vez sin que se lo pidas.
Esta página cubre los bloques de construcción: qué modelos hay, cuándo usar cuál y aproximadamente cuántos créditos cuesta cada generación.
Elige un modelo
El agente elige uno automáticamente cuando describes lo que quieres. Puedes anularlo.
Imágenes
| Modelo | Mejor para |
|---|---|
| Seedream 5.0 Lite | Avatares digitales, especialmente cuando el mismo personaje aparecerá luego en un video. |
| Gemini Image | Ilustraciones rápidas, banners, imágenes hero para blog. |
| GPT Image 2 — Draft | Bocetos rápidos; el más barato y rápido. |
| GPT Image 2 — Standard | Trabajo pulido de propósito general. |
Video
| Modelo | Mejor para |
|---|---|
| Seedance Cinematic | Máxima calidad con audio sincronizado nativo. 480p / 720p / 1080p, hasta 15s por clip. La opción por defecto para piezas terminadas. |
| Seedance Quick Draft | Más barato y rápido para iterar. Tope 720p. Úsalo para cortes preliminares antes de comprometerte con Cinematic. |
La regla Seedream → Seedance
Si tu video tiene un presentador humano que debe mantenerse visualmente consistente a lo largo de varios clips, genera el avatar con Seedream 5.0 Lite y reutiliza la misma imagen como referencia para cada clip. Los avatares hechos con Gemini Image o GPT Image 2 rompen la consistencia de personaje de Seedance.
Modos de referencia para video
- Una imagen — pasa una referencia de avatar o de escena. El predeterminado para anuncios con un personaje recurrente. El más fiable.
- Dos imágenes (keyframes inicio + fin) — Seedance interpola el movimiento entre ellas. Funciona bien para escenas no humanas; evítalo con presentadores humanos.
- Referencia de video — pasa un trim corto de un clip existente como referencia de movimiento/contexto. La misma advertencia que el modo de dos imágenes.
Cuántos créditos aproximadamente
El costo real varía según el prompt y los reintentos. Toma estos valores como guía aproximada.
Por imagen
| Modelo | Créditos |
|---|---|
| Seedream 5.0 Lite | ~10 |
| Gemini Image | ~10 |
| GPT Image 2 — Draft | ~5 |
| GPT Image 2 — Standard | ~15 |
Por clip Seedance (vertical 9:16)
| Especificación | Créditos |
|---|---|
| Cinematic 720p / 5s | ~150 |
| Cinematic 720p / 10s | ~300 |
| Cinematic 1080p / 5s | ~400 |
| Cinematic 1080p / 10s | ~750 |
| Cinematic 1080p / 15s | ~1,100 |
| Cinematic 1080p / 10s con referencia de video | ~550 |
| Quick Draft 720p / 5s | ~150 |
| Quick Draft 720p / 10s | ~250 |
Entregables comunes
- Anuncio vertical de 30 segundos (3 × 10s Cinematic 1080p + avatar Seedream) → ~2,200 créditos
- Anuncio vertical de 60 segundos (5 × 12s Cinematic 1080p + avatar) → ~4,300 créditos
Un clip reintentado — bloqueo por moderación de contenido, audio mudo — vuelve a cobrar el costo de ese clip.
Tips y errores comunes
- Para que el habla quede labializada, pon la línea entre comillas en el prompt: "…el presentador mira a cámara y dice 'Café en 30 segundos.'". Sin la línea entre comillas, Seedance solo produce audio ambiente — la boca se mueve pero no hay habla clara.
- Los logos de marca van en post, no en el prompt. Pedirle al modelo que renderice un wordmark da texto borroso y a menudo dispara el filtro de seguridad. Compón los logos sobre el video terminado como capa.
- Los avatares deben ser de linaje Seedream para video. Generar un avatar con otro modelo de imagen y luego intentar usarlo como referencia de Seedance romperá la consistencia.
- La continuidad viene de los prompts, no del encadenamiento. Empareja la pose y la mirada del presentador al final de un beat con el inicio del siguiente; un cross-dissolve suave de 0.5 segundos en los cortes hace el resto.
Ver también
- Precios — cómo funcionan los créditos en general
- ¿Qué Pueden Hacer los AI Agents? — otras capacidades
- Specialist Skills — extender un agente con herramientas personalizadas