Como se tornar um cientista de dados mais eficiente com técnicas rápidas de Engenharia de Prompt

Com prompts bem estruturados, você acelera tarefas, melhora a qualidade das análises e ainda ganha tempo para focar no que realmente importa

Publicado em 03/07/2025 às 7:58

Notícia

É o fato ou acontecimento de interesse jornalístico. Pode ser uma informação nova ou recente. Também diz respeito a uma novidade de uma situação já conhecida.

Artigo

Texto predominantemente opinativo. Expressa a visão do autor, mas não necessariamente a opinião do jornal. Pode ser escrito por jornalistas ou especialistas de áreas diversas.

Investigativa

Reportagem que traz à tona fatos ou episódios desconhecidos, com forte teor de denúncia. Exige técnicas e recursos específicos.

Content Commerce

Conteúdo editorial que oferece ao leitor ambiente de compras.

Análise

É a interpretação da notícia, levando em consideração informações que vão além dos fatos narrados. Faz uso de dados, traz desdobramentos e projeções de cenário, assim como contextos passados.

Editorial

Texto analítico que traduz a posição oficial do veículo em relação aos fatos abordados.

Patrocinada

É a matéria institucional, que aborda assunto de interesse da empresa que patrocina a reportagem.

Checagem de fatos

Conteúdo que faz a verificação da veracidade e da autencidade de uma informação ou fato divulgado.

Contexto

É a matéria que traz subsídios, dados históricos e informações relevantes para ajudar a entender um fato ou notícia.

Especial

Reportagem de fôlego, que aborda, de forma aprofundada, vários aspectos e desdobramentos de um determinado assunto. Traz dados, estatísticas, contexto histórico, além de histórias de personagens que são afetados ou têm relação direta com o tema abordado.

Entrevista

Abordagem sobre determinado assunto, em que o tema é apresentado em formato de perguntas e respostas. Outra forma de publicar a entrevista é por meio de tópicos, com a resposta do entrevistado reproduzida entre aspas.

Crítica

Texto com análise detalhada e de caráter opinativo a respeito de produtos, serviços e produções artísticas, nas mais diversas áreas, como literatura, música, cinema e artes visuais.

Imagem ilustrativa de computadores utilizados para trabalho - **Pexels**

Clique aqui e escute a matéria

A engenharia de prompt não é apenas mais uma moda passageira do mundo tech. Trata-se de uma competência cada vez mais valorizada, especialmente entre cientistas de dados que querem usar a IA como aliada para acelerar projetos, organizar fluxos de trabalho e tomar decisões melhores.

Abaixo, confira uma série em três partes, com algumas abordagens de engenharia de prompt, focadas nas etapas iniciais do ciclo de vida de um projeto de ciência de dados: planejamento, limpeza e análise exploratória (EDA).

Por que aprender engenharia de prompt é um diferencial?

Confesso: no começo, também achava que engenharia de prompt era só "saber escrever perguntas para o ChatGPT". Mas depois de muitos testes, descobri que essa prática é muito mais poderosa. Saber se comunicar com grandes modelos de linguagem (LLMs) como o GPT-4 ou Claude é, hoje, uma vantagem competitiva real.

Essas ferramentas já estão integradas aos notebooks, IDEs, dashboards e até nas revisões de código. E a cada semana, estão ficando melhores.

Dominar a arte de criar prompts claros, específicos e orientados ao contexto é como ter um assistente sênior disponível 24h por dia, pronto para gerar código, organizar ideias, revisar seus dados e propor soluções, tudo com base nas suas intenções.

Ciclo de Vida da Ciência de Dados com LLMs

A jornada de um projeto típico de ciência de dados inclui:

Definição do problema e brainstorming de soluções;
Coleta e limpeza de dados;
Análise exploratória;
Engenharia de atributos e modelagem;
Validação e avaliação;
Comunicação dos resultados.

Agora imagine atravessar todas essas etapas com um copiloto inteligente ao seu lado, que escreve trechos de código, sugere abordagens e aponta riscos que você talvez não tenha notado. Isso é o poder da engenharia de prompt aplicada.

Vamos conversar no ZAP?

Receba notícias na palma da sua mão. Entre agora mesmo no nosso canal exclusivo do WhatsApp

ENTRE NO CANAL DO WHATSAPP

Engenharia de Prompt na Prática — Parte 1: Planejamento, Limpeza e EDA

1. Planejamento e Brainstorming: dê adeus ao bloqueio criativo

Precisa estruturar um projeto, mas não sabe por onde começar? Experimente este tipo de prompt:

“Você é um cientista de dados sênior. Tenho um dataset de consumo de energia com 12.000 linhas (dados horários por 18 meses), incluindo temperatura, kWh, região e dia da semana.

Objetivo: prever o consumo futuro. Proponha um plano passo a passo, com etapas de pré-processamento, tratamento de sazonalidade, engenharia de atributos, modelagem e sugestões para visualização em dashboards.”

Você receberá um plano robusto com insights estratégicos, sugestões de validação e até perguntas para desafiar suposições do projeto. Modelos como o GPT-4 (o3-pro) ou o Claude 3 se destacam nesse tipo de tarefa.

Dica de ouro: Use a estratégia Esclarecer – Confirmar – Concluir. Primeiro, peça ao modelo para entender melhor os dados e o problema. Depois, confirme a abordagem mais adequada. Só então, solicite o plano completo.

2. Limpeza de Dados e Pré-Processamento: automatize as partes chatas

Limpar dados é essencial, mas também é repetitivo. Por isso, use prompts bem definidos como este:

“Tenho um DataFrame df com as colunas age, income e city.

Quero:

Remover linhas com city nulo;

Preencher valores ausentes em age com a mediana;

Tratar outliers de income com o método do IQR.

Escreva o código em Python com comentários explicativos.”

O LLM entregará o código com clareza, incluindo validações e boas práticas. Você pode adaptar esse modelo para qualquer tarefa de pré-processamento.

3. EDA (Análise Exploratória de Dados): faça perguntas que geram respostas inteligentes

Prompts genéricos como “analise este dataset” raramente trazem resultados úteis. Em vez disso, direcione com intenção. Exemplo:

“Tenho um dataset de e-commerce com customer_id, product, date, amount.

Quero entender:

Comportamento de compra por perfil;

Produtos comprados em conjunto;

Variações sazonais nas vendas.
Sugira colunas relevantes, visualizações e trechos de código para análise.”

Além disso, você pode copiar as estatísticas descritivas dos dados e perguntar:

“Com base nessas estatísticas, quais anomalias ou padrões devo investigar mais a fundo?”

Isso ajuda o modelo a gerar análises guiadas, contextualizadas e com maior valor analítico.

Padronização com consistência

Você precisa que o modelo gere saídas padronizadas (por exemplo, para documentação de variáveis)? Mostre o formato desejado com exemplos e depois peça:

“Original: ‘purchase_amt’
Padronizado: ‘Valor total da compra em USD.’
Agora, padronize:
‘cust_tenure’
‘item_ct’”

Esse modelo de prompt com poucos exemplos (few-shot learning) aumenta a consistência e reduz erros em tarefas repetitivas.

Erros comuns ao usar LLMs para ciência de dados

Ser genérico demais: quanto mais vago o prompt, mais genérica a resposta.
Confiar cegamente no código gerado: sempre revise e teste.
Expor dados reais: evite colar dados sensíveis; descreva as colunas ou use dados fictícios se estiver em ambiente público.