Planos

Como escrever prompts para Kling 3.0 (multi-shot + character lock)

Kling 3.0 tem syntax única pra multi-shot e o melhor character lock entre os top models. Guia completo com sintaxe explicada e exemplos vencedores.

Como escrever prompts para Kling 3.0 (multi-shot + character lock)

Kling 3.0 da Kuaishou é único entre os top models de vídeo IA em 2026: aceita syntax explícita de multi-shot e tem o melhor sistema de character lock do mercado via start/end frame ou reference image. Esse guia mostra como usar essas duas features que outros modelos não têm — em inglês, com termos que o modelo conhece.

A estrutura básica que funciona

Anatomia de um prompt Kling 3

  1. 1. Sujeito + ambiente principal

    'A young woman with red braided hair in a rain-soaked Tokyo alley at night'.

  2. 2. Ação principal

    'walking confidently, occasionally glancing back over her shoulder'.

  3. 3. Câmera e composição

    'tracking shot from behind, medium-close shot, shallow depth of field, 35mm lens'.

  4. 4. Look e iluminação

    'neon reflections on wet asphalt, cyan-magenta color grading, atmospheric haze'.

  5. 5. Estilo e referência

    'cinematic, Blade Runner 2049 aesthetic, photorealistic'.

A syntax multi-shot que só Kling tem

Para cenas com mais de uma tomada conectada, use a sintaxe explícita de shots:

[shot 1] Wide establishing shot of the Tokyo alley, rain pouring, neon signs flickering, the woman appearing at the far end.

[shot 2] Medium tracking shot from behind, following her steps through puddles, jacket dripping.

[shot 3] Close-up of her face turning toward camera, raindrops on her cheeks, determined expression.

Character lock via start/end frame

Para garantir que o personagem da cena seja exatamente quem você quer (ex: você, um cliente, ou um personagem reutilizado em vários vídeos), Kling oferece 3 mecanismos:

  • start-frame — primeira frame fixada (imagem de referência). Útil pra: animar uma foto, dar continuidade a uma cena anterior.

  • end-frame — última frame fixada. Útil pra: definir como a cena termina antes do próximo shot.

  • reference image — imagem usada como guia de aparência do personagem (sem fixar frame). Mais flexível, melhor pra: clone de identidade em vários vídeos independentes.

Experimente Kling 3 com sua imagem →

Movimentos de câmera que Kling reconhece

Mesmo vocabulário dos outros top models, mas Kling rende melhor em alguns específicos:

  • tracking shot (segue o sujeito mantendo distância) — Kling brilha aqui

  • orbit / 360° rotation — Kling 4K rende altíssimo nesse

  • handheld — movimento orgânico tipo câmera na mão

  • dolly-in / dolly-out — aproxima/afasta linear

  • tilt / pan — rotação nos eixos

  • crane shot — movimento vertical amplo

Duração e resoluções por variante

FeatureCaranguejo.artVariantes Kling 3
kling-3-0Padrão, 3-15s, 720p/1080p, multi-shot suportado
kling-3-0-4k4K nativo, 3-10s, qualidade premium pra entrega final
kling-o3Última geração, melhor coerência temporal
kling-o3-4kÚltima geração em 4K, top do top

Exemplo completo testado

Ver planos →

Erros comuns que destroem o resultado

✅ Prós

  • Sintaxe multi-shot quando precisa de 2+ cenas conectadas
  • Reference image quando o personagem precisa ser consistente em vários vídeos
  • Vocabulário cinematográfico em inglês
  • Descrição específica de luz e mood

❌ Contras

  • Tentar reusar multi-shot pra fazer 3 vídeos diferentes (não funciona — Kling renderiza COMO se fosse uma cena contínua)
  • Prompts vagos com lista de adjetivos sem estrutura
  • Pedir mais que 15s na variante padrão (kling-3-0 trunca em 15s)
  • Misturar start-frame com reference image (escolha um ou outro, nunca os dois)

Quando usar Kling vs alternativas

Kling 3 ganha quando:

  • Você precisa de transição entre múltiplas cenas (multi-shot syntax)

  • Quer character lock via reference image (avatar/clone consistente)

  • Precisa de 10-15s contínuos (limite mais alto que VEO 3)

  • Quer 4K direto sem upscale (kling-3-0-4k, kling-o3-4k)

Use outro modelo quando:

  • Precisa de áudio sincronizado → VEO 3 (Kling não gera áudio)

  • Quer realismo de luz natural extrema → VEO 3 (Kling tem look levemente estilizado)

  • Precisa de vídeo mais longo de 15s → encadeie no Flow

Veja o 3-way comparison Sora 2 vs VEO 3 vs Kling 3 →

Perguntas frequentes

Multi-shot funciona com qualquer variante Kling?
Sim, kling-3-0, kling-3-0-4k, kling-o3 e kling-o3-4k todos suportam a sintaxe [shot 1][shot 2]…[shot N]. Recomendado 2-4 shots por geração — acima disso a coerência cai.
Reference image precisa de quantas fotos?
1 imagem é suficiente pra Kling extrair traços do personagem. Mas se quiser identity lock mais forte (consistência em múltiplos vídeos), gere 3-4 versões do personagem em poses diferentes no Nano Banana Pro primeiro e use a melhor como reference.
Kling tem áudio?
Não. Kling 3 gera vídeo silencioso. Se precisa de áudio sincronizado na geração, use VEO 3 (único top model com áudio nativo).
Qual a diferença entre kling-3-0 e kling-o3?
kling-o3 é a geração mais recente (lançada em 2026), com melhor coerência temporal em movimento rápido e renderização superior de detalhes de tecido e cabelo. kling-3-0 ainda é excelente e mais econômico em créditos.
Posso usar Kling pra animar foto antiga?
Pode, mas Seedance 2 Pro rende melhor especificamente nesse caso de uso (image-to-video com movimento facial sutil). Veja nosso post sobre como animar foto antiga com Seedance pra o passo-a-passo.

Experimente o Caranguejo.art agora

Os melhores modelos de IA em um só lugar, a partir de $4.99/mês.

Ver planosComeçar a criar

Posts relacionados

Sora 2 vs VEO 3 vs Kling 3 — qual modelo de vídeo escolher em 2026
Comparativo·comparativos

Sora 2 vs VEO 3 vs Kling 3 — qual modelo de vídeo escolher em 2026

Comparativo 3-way dos modelos de vídeo top em 2026. Sora 2, VEO 3 e Kling 3 cada um com diferencial técnico real. Veja qual escolher por caso de uso.

28 de mai. de 2026 3 min
Como escrever prompts para FLUX 2 Pro (typography + editorial)
Guia de prompt·prompts

Como escrever prompts para FLUX 2 Pro (typography + editorial)

FLUX 2 Pro é o único top model com typography premium nativa. Guia mostra como renderizar texto integrado a imagens — logos, posters, headlines.

28 de mai. de 2026 2 min
Como escrever prompts para VEO 3 (vídeo com áudio nativo)
Guia de prompt·prompts

Como escrever prompts para VEO 3 (vídeo com áudio nativo)

VEO 3 é o único modelo top em 2026 que gera vídeo + áudio sincronizado nativo. Guia completo com termos de sound design, exemplos prontos e a estrutura que rende.

28 de mai. de 2026 3 min