ENGENHARIA DE PROMPT
Para se tornar um engenheiro de prompt (Prompt Engineer), você precisa de uma combinação de habilidades técnicas, de linguagem natural, e de pensamento estratégico para criar prompts eficientes para modelos de IA. Vou detalhar passo a passo o que estudar, dividido em níveis e áreas:
Módulo 1 — Fundamentos de IA e Modelos de Linguagem
Você precisa entender como os modelos de IA funcionam, principalmente modelos de linguagem (LLMs), como GPTs:
LLMs são modelos de inteligência artificial treinados para entender e gerar linguagem.
Eles aprendem padrões da língua analisando enormes quantidades de texto — livros, artigos, sites, pesquisas e conversas.
Eles não “pensam”, não têm opinião e não têm memória como humanos.
Eles calculam qual é a próxima palavra mais provável em uma frase, de acordo com o contexto.
📌 Como funciona (na essência)
-
O modelo lê bilhões de frases durante o treinamento.
-
Ele aprende padrões de como as palavras se relacionam.
-
Quando você faz uma pergunta, ele usa esses padrões para prever uma resposta coerente.
-
Ele não busca informação em tempo real — ele gera linguagem, baseado em padrões que aprendeu.
Ele prevê palavras, não ideias.
🏗️ Estrutura básica
Um LLM é construído com uma arquitetura chamada Transformer, que usa:
-
Atenção → mede o que é mais importante na frase
-
Probabilidade → calcula o que vem depois
-
Embeddings → transforma palavras em números
Resumindo:
O modelo transforma linguagem em matemática, processa, e volta para linguagem.
🤖 Exemplos práticos de LLMs hoje
| Modelo | Empresa |
|---|---|
| GPT-5 (eu) | OpenAI |
| Gemini | |
| Claude | Anthropic |
| LLaMA | Meta |
| Mistral | Mistral AI |
🧩 Por que eles parecem “inteligentes”?
Porque:
-
Eles conseguem responder perguntas
-
Gerar textos longos e coerentes
-
Criar explicações adaptadas ao contexto
-
Imitar estilos de escrita
-
Fazer raciocínio guiado quando solicitados corretamente
Mas isso é padrão linguístico, não consciência.
⚠️ Por que eles alucinam?
Porque:
-
Eles não sabem o que é verdadeiro, só o que é linguisticamente provável.
-
Se faltar contexto ou referência → ele preenche com imaginação.
-
Se o prompt for contraditório ou vago → ele tenta agradar todas as partes → paradoxo → inventa.
Exemplo de pedido paradoxo:
“Explique com precisão algo que você não sabe.”
Resultado → alucinação.
🧠 Papel do Engenheiro de Prompt
Seu trabalho não é “perguntar”, é:
-
Definir contexto
-
Definir critérios de verdade
-
Remover ambiguidades
-
Guiar o raciocínio passo a passo
Quando você faz isso → o modelo para de inventar.
💎 Resumo simples para guardar
LLMs não pensam.
LLMs não lembram.
LLMs não entendem o mundo.
Eles:
Detectam padrões e geram linguagem probabilisticamente.
Se você dá contexto claro, critério e prioridade, o resultado é preciso.
Se você dá vago, ambíguo ou paradoxal, o resultado alucina.
1) Entrada → Tudo vira números
Quando você digita uma frase, o modelo não lê palavras, ele converte cada palavra em vetores numéricos (chamados embeddings).
Exemplo simplificado:
“Catedral de Brasília” → [0.13, -1.2, 4.8, ...]
Por que isso importa?
→ Porque números têm relações matemáticas, e o modelo pode medir semelhança, distância, relevância.
2) Processamento → O modelo usa a Arquitetura Transformer
O Transformer tem um mecanismo chamado Attention (atenção).
Ele responde à pergunta:
Quais palavras desta frase são mais importantes para entender o que vem a seguir?
Por exemplo:
“Iluminar a Catedral sem tirar sua essência espiritual.”
O modelo não lê isso linearmente.
Ele calcula algo assim:
| Palavra | O modelo presta atenção em… |
|---|---|
| Iluminar | “Catedral”, “essência”, “espiritual” |
| Catedral | “iluminar”, “sem tirar”, “essência” |
| Essência | “espiritual”, “Catedral” |
| Espiritual | “essência”, “Catedral” |
Ele forma mapas de relevância.
3) Contexto → Ele não “lembra”, ele mantém estado
O modelo não tem memória emocional ou identidade.
Mas ele consegue continuar um raciocínio enquanto as mensagens estão dentro da janela de contexto.
Pense assim:
Ele não lembra de ontem, mas lembra do que você acabou de dizer agora.
Se a janela de contexto do modelo é, por exemplo, 200 mil tokens, isso significa:
→ Ele consegue manter um livro inteiro aberto na cabeça, enquanto conversa.
Mas quando essa janela enche:
-
Informações antigas são resumidas
-
Ou descartadas
Por isso:
Se o contexto não estiver bem estruturado, o modelo se perde e começa a inventar (alucinar).
4) A predição da próxima palavra
A IA não decide, ela prediz.
Ela calcula:
Qual palavra tem maior probabilidade de continuar este texto, mantendo coerência com o estilo e o contexto fornecido?
Exemplo:
Prompt:
“No light design monumental da Catedral, o objetivo é”
O modelo avalia milhares de possibilidades…
e escolhe algo como:
“reforçar sua forma, ritmo estrutural e presença simbólica na paisagem.”
Isso não é memória, é estatística contextualizada.
5) Onde acontecem as alucinações
Alucinações aparecem quando:
| Erro do prompt | Efeito no modelo |
|---|---|
| Falta de contexto | Ele inventa para preencher lacunas |
| Pedido paradoxal | Ele mistura instruções e perde coerência |
| Nenhum critério de precisão | Ele prioriza somente fluidez do texto |
Resumindo:
Alucinação não é erro do modelo. É falta de restrição.
✅ Resumo em uma frase
LLMs convertem texto em números, medem relações entre palavras, mantêm contexto enquanto a janela está ativa e predizem a próxima palavra com base em probabilidade, não compreensão.
Módulo 2 — Fundamentos da Engenharia de Prompt
Mindset Correto: Você não conversa com uma pessoa. Você programa um modelo linguístico através de linguagem.
1. JSON não é Prompt. JSON é Arquitetura
Neste nível, o aluno precisa entender uma verdade técnica:
Prompt é instável.
Arquitetura é previsível.
Quando você usa JSON corretamente:
-
Você cria contratos de resposta
-
Você reduz variação
-
Você torna o output reutilizável
-
Você transforma IA em componente de sistema
📌 Mentalidade do módulo:
Não escreva prompts.
Desenhe sistemas de instrução.
A IA não sabe coisas da forma que nós sabemos.
Ela não lembra, não sente, não decide.
Ela funciona assim:
-
Ela prevê qual é a próxima palavra mais provável baseada em padrões.
-
Ela não valida a realidade — apenas segue coerência linguística.
-
Se faltar referência, contexto ou restrição → ela inventa.
Por isso:
Quanto mais vago o prompt, mais a IA completa com imaginação — e é aí que nascem as alucinações.
| Causa | Por que acontece | Como evitar |
|---|---|---|
| Falta de contexto | IA preenche lacunas inventando | Sempre forneça dados, referências e exemplos |
| Pedido paradoxal | Você pede duas coisas que se contradizem | Use instruções claras e não ambíguas |
| Ausência de critério de validação | A IA não sabe o que é considerado correto | Diga como avaliar a resposta |
O Paradoxo que Gera Alucinações
Quando você pede algo contraditório, tipo:
“Crie algo totalmente original, mas igual ao estilo exato do fulano, mas não copie.”
A IA não consegue resolver isso porque:
-
Original e igual são opostos.
-
A IA tenta agradar todas as instruções.
-
Quando as instruções se chocam → ela inventa para “fechar o sentido”.
Resultado:
Alucinação.
Texto bonito, mas sem precisão.
Como resolver:
Dê prioridade explícita:
✅ “Prioridade 1: manter o estilo X.
Prioridade 2: produzir variações originais.
Caso haja conflito, siga a prioridade 1.”
A IA agora sabe qual ordem seguir → não precisa inventar para agradar.
1. Por que começar pelo JSON (e não pela “conversa”)
Antes de qualquer conceito filosófico, o aluno precisa entender a forma correta de controlar um modelo.
JSON não é formato.
JSON é disciplina mental.
Quando você usa JSON:
-
Você elimina ambiguidade
-
Força estrutura
-
Reduz alucinação
-
Controla saída
-
Aproxima o prompt de uma API cognitiva
📌 Regra central do módulo:
Se você não consegue expressar seu pedido em JSON, você ainda não sabe o que quer da IA.
2. O JSON como linguagem de programação disfarçada
Modelos linguísticos respondem melhor a estruturas do que a frases soltas.
Exemplo RUIM (conversacional):
“Me ajude a criar um texto sobre marketing digital”
Exemplo PROFISSIONAL (JSON):
{
"papel": "especialista em marketing digital",
"objetivo": "criar um texto educativo",
"publico": "empreendedores iniciantes",
"tom": "didático e direto",
"formato": "artigo",
"limites": [
"sem jargões técnicos",
"sem promessas irreais"
]
}
👉 Aqui você não conversa.
Você define parâmetros de execução.
3. Mindset Correto: Você não conversa, você configura
A partir do JSON, fica claro:
Você não está falando com uma pessoa.
Você está configurando um modelo estatístico.
-
IA não entende intenção
-
IA não “capta clima”
-
IA não interpreta ironia
-
IA responde a estrutura + probabilidade
📌 Conclusão didática:
Quem escreve frases espera sorte.
Quem escreve estruturas controla resultado.
4. O que é Engenharia de Prompt (agora com definição correta)
❌ Visão errada:
-
“Escrever bem”
-
“Fazer pedidos educados”
-
“Conversar como humano”
✅ Definição técnica correta:
Engenharia de Prompt é o processo de modelar o comportamento de um modelo linguístico por meio de contexto estruturado, restrições explícitas e formatos determinísticos.
O JSON é o primeiro nível dessa engenharia.
5. Como a IA “pensa” (por que JSON funciona)
A IA:
-
Não raciocina
-
Não entende verdade
-
Não valida fatos
-
Prediz tokens
Quando você usa JSON:
-
Reduz o espaço de probabilidade
-
Direciona a próxima palavra
-
Evita deriva semântica
-
Limita criatividade indesejada
📌 Frase-chave do módulo:
Estrutura reduz liberdade.
Menos liberdade = menos alucinação.
6. As 3 causas de alucinação (vistas sob a ótica do JSON)
1️⃣ Campos ausentes
Causa: Falta de contexto explícito.
Correção com JSON:
{
"assuma": "apenas dados comprovados",
"se_nao_souber": "declare explicitamente"
}
2️⃣ Campos impossíveis
Causa: Pedido fora da realidade.
Correção:
{
"fonte": "dados públicos disponíveis",
"validacao": "não inventar informações"
}
3️⃣ Campos abertos demais
Causa: Liberdade excessiva.
Correção:
{
"criatividade": "moderada",
"escopo": "restrito ao tema solicitado"
}
📌 Resumo técnico:
Alucinação é erro de especificação, não falha da IA.
7. Estrutura Mental Correta: descreva o RESULTADO
Com JSON, isso fica inevitável:
❌ Errado:
“Explique passo a passo como pensar”
✅ Correto:
{
"entregavel": "análise final",
"conteudo": ["ponto A", "ponto B", "ponto C"],
"formato": "lista estruturada",
"sem": "mostrar raciocínio intermediário"
}
📌 Você define o output, não o processo interno.
8. Framework Base do Prompt Engineer (orientado a JSON)
Todo prompt profissional responde a:
{
"quem_voce_e": "",
"o_que_entregar": "",
"para_quem": "",
"formato": "",
"restricoes": []
}
👉 Se um desses campos faltar, o risco de erro sobe.
Encerramento do Módulo 2
Engenharia de Prompt começa quando a conversa termina
e a especificação começa.
JSON não é opcional.
É o alicerce do controle.
Módulo 3 — Arquitetura Avançada de Prompts com JSON
Se o Módulo 2 ensinou a pensar em estrutura, o Módulo 3 ensina a PROJETAR comportamento.
A maioria das pessoas acha que “prompt” é só pedir algo para a IA.
Errado.
Engenharia de Prompt é a habilidade de controlar a forma como a IA gera respostas.
Você aprende a:
-
Definir papéis
-
Definir estruturas
-
Definir critérios de qualidade
-
Definir passos de produção
Ou seja:
Você controla o processo de geração, não só o resultado final.
É mais parecido com dar instruções para um estagiário muito habilidoso, mas sem bom senso, do que conversar com alguém que “entende” o mundo.
Prompt simples (frágil):
“Crie um texto sobre IA para Instagram”
Prompt arquitetado (robusto):
{
"sistema": {
"papel": "especialista em inteligência artificial aplicada",
"nivel": "senior"
},
"objetivo": {
"tarefa": "criar conteúdo educativo",
"tema": "uso prático de IA no dia a dia"
},
"publico": {
"perfil": "iniciantes",
"plataforma": "Instagram"
},
"saida": {
"formato": "carrossel",
"slides": 7,
"cta": true
},
"restricoes": [
"linguagem simples",
"sem termos técnicos complexos",
"sem promessas irreais"
]
}
👉 Isso não é um pedido.
👉 Isso é uma configuração de execução.
Um prompt profissional não é um bloco único.
Ele é dividido em camadas.
Camada 1 — Sistema
Define quem o modelo é.
"sistema": {
"papel": "engenheiro de prompt",
"especialidade": "conteúdo técnico estruturado"
}Define o que será entregue.
"objetivo": {
"resultado": "guia prático",
"tema": "engenharia de prompt com JSON"
}Define nível cognitivo do output.
"publico": {
"nivel": "intermediário",
"area": "tecnologia e marketing"
}Define como a resposta nasce.
"saida": {
"formato": "lista estruturada",
"extensao": "media",
"usar_exemplos": true
}Define o que NÃO pode acontecer.
"restricoes": [
"não inventar dados",
"não extrapolar o tema",
"não usar linguagem motivacional"
]
📌 Arquitetura = soma das camadas
Determinístico
Usado para:
-
Documentação
-
Código
-
Jurídico
-
Processos
"controle": {
"criatividade": "baixa",
"variacao": "minima",
"objetividade": "alta"
}
Criativo Controlado
Usado para:
-
Marketing
-
Conteúdo
-
Roteiros
"controle": {
"criatividade": "moderada",
"variacao": "controlada",
"metaforas": "permitidas"
}
📌 Criatividade só é boa quando tem limites.
Neste nível, você antecipa o erro.
"seguranca": {
"se_nao_souber": "responder explicitamente que não há dados",
"validar_fatos": true,
"nao_assumir": true
}
👉 Você ensina o modelo a não completar lacunas.
Template Universal
{
"sistema": {},
"objetivo": {},
"publico": {},
"saida": {},
"controle": {},
"restricoes": []
}
📌 Esse template:
-
Serve para texto
-
Serve para vídeo
-
Serve para imagem
-
Serve para agentes
Quando você domina JSON:
-
Seu prompt vira ativo
-
Seu prompt vira template
-
Seu prompt vira produto vendável
O mercado não paga por perguntas.
O mercado paga por arquitetura previsível.
🎯 Desafio:
Crie um prompt em JSON para:
-
Criar um vídeo curto
-
Educativo
-
Para redes sociais
-
Com CTA
-
Sem alucinação
📌 Regra:
Se não estiver totalmente estruturado, está errado.
Quem domina JSON não depende da sorte do modelo.
Controla o comportamento dele.
Neste ponto do curso, o aluno:
✅ Não conversa mais
✅ Não improvisa
✅ Não aceita respostas genéricas
Ele projeta resultados.
ESTUDO DE CASO
1️⃣ Comece pelo objetivo (clareza total)
Tudo começa com clareza de intenção.
Antes de pedir qualquer coisa ao ChatGPT, responda mentalmente:
O que eu quero que a IA crie exatamente?
Exemplo prático:
-
Uma imagem
-
Com texto fixo
-
Seguindo o design de outra imagem
-
Para feed ou story
No JSON, isso vira:
"objective": "Criar uma arte estática combinando texto, fundo e identidade visual..."
👉 Gatilho mental da clareza: quanto mais claro o objetivo, menos erro a IA comete.
2️⃣ Trave o texto (controle absoluto)
Se você não quer que o texto seja alterado, isso precisa estar explícito.
Por isso usamos:
"requirement": "Usar o texto exatamente como aparece..."
E logo depois:
"text_content": "O Plano 7D chegou para transformar..."
👉 Gatilho do controle: quando você trava o texto, elimina variações, erros e “criatividade indesejada”.
3️⃣ Separe DESIGN de TEXTO (regra de ouro)
Um erro comum é misturar tudo num bloco só.
Aqui, fazemos diferente:
-
Texto →
text_source -
Visual →
visual_design -
Layout →
layout
Isso organiza o raciocínio da IA.
👉 Gatilho da autoridade: prompts organizados geram resultados profissionais.
4️⃣ Use imagens como referência (sem confusão)
Sempre diga claramente:
-
Qual imagem é o texto
-
Qual imagem é o design
Exemplo:
"reference_image": "imagem_2"
E detalhe o que exatamente copiar:
-
Paleta de cores
-
Tipografia
-
Atmosfera
👉 Gatilho da precisão: a IA não “imagina”, ela replica.
5️⃣ Tipografia não se pede — se impõe
Se você quer manter a tipografia, nunca diga apenas “use a mesma fonte”.
Você deve dizer:
-
estilo
-
peso
-
cor
-
hierarquia
Exemplo:
"do_not_modify_typography_style": true
👉 Gatilho da consistência visual: isso mantém identidade de marca.
6️⃣ Crie regras de proibição (isso é poder)
A parte mais ignorada — e a mais importante:
"constraints": {
"do_not_change_text": true,
"do_not_invent_elements": true
}
Isso diz para a IA:
“Você NÃO está no modo criativo. Você está no modo execução.”
👉 Gatilho da autoridade técnica.
7️⃣ Finalize com qualidade e formato
Nunca deixe a IA decidir sozinha o formato final.
"format": "1080x1920",
"usage": "Feed ou Story"
👉 Gatilho da conversão: já nasce pronto para publicar.
Resumo rápido (para nunca errar)
Sempre pense no JSON como:
-
O que quero
-
O texto que não pode mudar
-
O visual que deve ser seguido
-
As regras do que é proibido
-
O formato final
Se quiser, no próximo passo eu posso:
-
Transformar isso num modelo reutilizável
-
Criar uma versão ainda mais curta
-
Adaptar para Gemini, Midjourney ou Veo
-
Ajustar o texto para mais emoção ou mais institucional
Você já está usando prompt como profissional. Agora é só lapidar.
{
“task”: “image_composition”,
“language”: “pt-BR”,
“instructions”: {
“objective”: “Criar uma arte estática combinando texto, fundo e identidade visual de duas imagens de referência distintas.”,
“text_source”: {
“reference_image”: “imagem_1”,
“requirement”: “Usar o texto exatamente como aparece na imagem 1, sem qualquer alteração de palavras, pontuação, quebras de linha ou emojis.”,
“text_content”: “O Plano 7D chegou para transformar suas interações e potencializar suas mensagens!\n\nMas atenção: essa é uma oportunidade que não vai durar para sempre! ⏳”
},
“visual_design”: {
“reference_image”: “imagem_2”,
“background”: “Recriar o fundo com o mesmo estilo visual da imagem 2, incluindo textura, profundidade, granulação suave e atmosfera institucional/profissional.”,
“color_palette”: “Aplicar exatamente a paleta de cores predominante da imagem 2, priorizando tons esverdeados, neutros sofisticados e contrastes suaves.”,
“typography”: {
“font_style”: “Manter o mesmo estilo tipográfico da imagem 2 (serifada institucional para títulos e elegante para textos de apoio).”,
“font_weight”: “Reproduzir pesos, espaçamentos e hierarquia visual conforme a imagem 2.”,
“font_color”: “Utilizar exclusivamente as cores tipográficas presentes na imagem 2, respeitando contraste e legibilidade.”
}
},
“layout”: {
“alignment”: “Centralizado, com espaçamento equilibrado e leitura fluida.”,
“visual_hierarchy”: “Título com maior destaque, texto secundário com menor peso, mantendo a sofisticação visual da imagem 2.”,
“no_distortion”: true
},
“constraints”: {
“do_not_change_text”: true,
“do_not_invent_elements”: true,
“do_not_modify_typography_style”: true,
“do_not_alter_color_scheme”: true
},
“output_quality”: {
“resolution”: “alta”,
“format”: “1080×1920”,
“usage”: “Feed ou Story”
}
}
}
RESULTADO
Módulo 4 — Engenharia de Prompt Multimodal
Se o Módulo 2 ensinou a pensar em estrutura, o Módulo 3 ensina a PROJETAR comportamento.
A maioria das pessoas acha que “prompt” é só pedir algo para a IA.
Errado.
Engenharia de Prompt é a habilidade de controlar a forma como a IA gera respostas.
Você aprende a:
-
Definir papéis
-
Definir estruturas
-
Definir critérios de qualidade
-
Definir passos de produção
Ou seja:
Você controla o processo de geração, não só o resultado final.
É mais parecido com dar instruções para um estagiário muito habilidoso, mas sem bom senso, do que conversar com alguém que “entende” o mundo.
A IA não sabe coisas da forma que nós sabemos.
Ela não lembra, não sente, não decide.
Ela funciona assim:
-
Ela prevê qual é a próxima palavra mais provável baseada em padrões.
-
Ela não valida a realidade — apenas segue coerência linguística.
-
Se faltar referência, contexto ou restrição → ela inventa.
Por isso:
Quanto mais vago o prompt, mais a IA completa com imaginação — e é aí que nascem as alucinações.
| Causa | Por que acontece | Como evitar |
|---|---|---|
| Falta de contexto | IA preenche lacunas inventando | Sempre forneça dados, referências e exemplos |
| Pedido paradoxal | Você pede duas coisas que se contradizem | Use instruções claras e não ambíguas |
| Ausência de critério de validação | A IA não sabe o que é considerado correto | Diga como avaliar a resposta |
O Paradoxo que Gera Alucinações
Quando você pede algo contraditório, tipo:
“Crie algo totalmente original, mas igual ao estilo exato do fulano, mas não copie.”
A IA não consegue resolver isso porque:
-
Original e igual são opostos.
-
A IA tenta agradar todas as instruções.
-
Quando as instruções se chocam → ela inventa para “fechar o sentido”.
Resultado:
Alucinação.
Texto bonito, mas sem precisão.
Como resolver:
Dê prioridade explícita:
✅ “Prioridade 1: manter o estilo X.
Prioridade 2: produzir variações originais.
Caso haja conflito, siga a prioridade 1.”
A IA agora sabe qual ordem seguir → não precisa inventar para agradar.
Errado:
“Faça um texto bonito sobre arquitetura.”
Certo:
Papel: Copywriter especialista em arquitetura monumental
Objetivo: descrever a potência simbólica da Catedral
Formato: texto de 200 palavras
Estilo: linguagem poética + precisão técnica
Critério de qualidade: evitar termos vagos, incluir especificações visuais reais
Tom: sublime, reverente, arquitetônico
Quando você descreve o resultado:
-
A IA entrega algo coerente
-
Sem inventar termos
-
Sem florear exageradamente
-
Sem perder precisão
✅ Objetivo deste módulo
Você passa a ser capaz de:
-
Dar ordens claras para a IA
-
Controlar estilo, formato e profundidade
-
Evitar contradições que geram alucinações
-
Conseguir resultados que você pode confiar e usar profissionalmente
Em resumo:
Você troca a postura “IA, faz aí” por “IA, faça assim, com estes critérios, neste formato, seguindo esta prioridade.”
Esse é o mindset de um Engenheiro de Prompt de verdade.
