Kling 3.0 da Kuaishou é único entre os top models de vídeo IA em 2026: aceita syntax explícita de multi-shot e tem o melhor sistema de character lock do mercado via start/end frame ou reference image. Esse guia mostra como usar essas duas features que outros modelos não têm — em inglês, com termos que o modelo conhece.
A estrutura básica que funciona
Anatomia de um prompt Kling 3
1. Sujeito + ambiente principal
'A young woman with red braided hair in a rain-soaked Tokyo alley at night'.
2. Ação principal
'walking confidently, occasionally glancing back over her shoulder'.
3. Câmera e composição
'tracking shot from behind, medium-close shot, shallow depth of field, 35mm lens'.
4. Look e iluminação
'neon reflections on wet asphalt, cyan-magenta color grading, atmospheric haze'.
5. Estilo e referência
'cinematic, Blade Runner 2049 aesthetic, photorealistic'.
A syntax multi-shot que só Kling tem
Para cenas com mais de uma tomada conectada, use a sintaxe explícita de shots:
[shot 1] Wide establishing shot of the Tokyo alley, rain pouring, neon signs flickering, the woman appearing at the far end.
[shot 2] Medium tracking shot from behind, following her steps through puddles, jacket dripping.
[shot 3] Close-up of her face turning toward camera, raindrops on her cheeks, determined expression.Character lock via start/end frame
Para garantir que o personagem da cena seja exatamente quem você quer (ex: você, um cliente, ou um personagem reutilizado em vários vídeos), Kling oferece 3 mecanismos:
start-frame — primeira frame fixada (imagem de referência). Útil pra: animar uma foto, dar continuidade a uma cena anterior.
end-frame — última frame fixada. Útil pra: definir como a cena termina antes do próximo shot.
reference image — imagem usada como guia de aparência do personagem (sem fixar frame). Mais flexível, melhor pra: clone de identidade em vários vídeos independentes.
Movimentos de câmera que Kling reconhece
Mesmo vocabulário dos outros top models, mas Kling rende melhor em alguns específicos:
tracking shot (segue o sujeito mantendo distância) — Kling brilha aqui
orbit / 360° rotation — Kling 4K rende altíssimo nesse
handheld — movimento orgânico tipo câmera na mão
dolly-in / dolly-out — aproxima/afasta linear
tilt / pan — rotação nos eixos
crane shot — movimento vertical amplo
Duração e resoluções por variante
| Feature | Caranguejo.art | Variantes Kling 3 |
|---|---|---|
| kling-3-0 | Padrão, 3-15s, 720p/1080p, multi-shot suportado | — |
| kling-3-0-4k | 4K nativo, 3-10s, qualidade premium pra entrega final | — |
| kling-o3 | Última geração, melhor coerência temporal | — |
| kling-o3-4k | Última geração em 4K, top do top | — |
Exemplo completo testado
Ver planos →Erros comuns que destroem o resultado
✅ Prós
- Sintaxe multi-shot quando precisa de 2+ cenas conectadas
- Reference image quando o personagem precisa ser consistente em vários vídeos
- Vocabulário cinematográfico em inglês
- Descrição específica de luz e mood
❌ Contras
- Tentar reusar multi-shot pra fazer 3 vídeos diferentes (não funciona — Kling renderiza COMO se fosse uma cena contínua)
- Prompts vagos com lista de adjetivos sem estrutura
- Pedir mais que 15s na variante padrão (kling-3-0 trunca em 15s)
- Misturar start-frame com reference image (escolha um ou outro, nunca os dois)
Quando usar Kling vs alternativas
Kling 3 ganha quando:
Você precisa de transição entre múltiplas cenas (multi-shot syntax)
Quer character lock via reference image (avatar/clone consistente)
Precisa de 10-15s contínuos (limite mais alto que VEO 3)
Quer 4K direto sem upscale (kling-3-0-4k, kling-o3-4k)
Use outro modelo quando:
Precisa de áudio sincronizado → VEO 3 (Kling não gera áudio)
Quer realismo de luz natural extrema → VEO 3 (Kling tem look levemente estilizado)
Precisa de vídeo mais longo de 15s → encadeie no Flow
Perguntas frequentes
- Multi-shot funciona com qualquer variante Kling?
- Sim, kling-3-0, kling-3-0-4k, kling-o3 e kling-o3-4k todos suportam a sintaxe [shot 1][shot 2]…[shot N]. Recomendado 2-4 shots por geração — acima disso a coerência cai.
- Reference image precisa de quantas fotos?
- 1 imagem é suficiente pra Kling extrair traços do personagem. Mas se quiser identity lock mais forte (consistência em múltiplos vídeos), gere 3-4 versões do personagem em poses diferentes no Nano Banana Pro primeiro e use a melhor como reference.
- Kling tem áudio?
- Não. Kling 3 gera vídeo silencioso. Se precisa de áudio sincronizado na geração, use VEO 3 (único top model com áudio nativo).
- Qual a diferença entre kling-3-0 e kling-o3?
- kling-o3 é a geração mais recente (lançada em 2026), com melhor coerência temporal em movimento rápido e renderização superior de detalhes de tecido e cabelo. kling-3-0 ainda é excelente e mais econômico em créditos.
- Posso usar Kling pra animar foto antiga?
- Pode, mas Seedance 2 Pro rende melhor especificamente nesse caso de uso (image-to-video com movimento facial sutil). Veja nosso post sobre como animar foto antiga com Seedance pra o passo-a-passo.



