← Voltar ao Painel

IA & LLMs

LLMs, prompts, embeddings, RAG e pipelines de machine learning.

📖 Lições

2.1 — O que é um LLM?⬜ Pendente · 15 min

Large Language Models

Modelos de linguagem treinados em vastos corpora de texto. Utilizam arquitetura Transformer para processamento sequencial.

Capacidades Principais

  • Geração de texto natural
  • Resposta a perguntas
  • Tradução automática
  • Resumo de documentos
  • Classificação de texto

2.2 — Prompt Engineering⬜ Pendente · 20 min

Práticas Essenciais

O prompt é a interface principal com o modelo. Boas práticas incluem:

  • Contexto claro: definir o papel do modelo
  • Exemplos: few-shot prompting
  • Estrutura: dividir tarefas complexas
  • Restrições: limitar formato de saída

2.3 — Embeddings⬜ Pendente · 15 min

Vetores de Significado

Embeddings convertem texto em vetores numéricos que capturam significado semântico.

  • Textos similares → vetores próximos no espaço vetorial
  • Usados para busca semântica e similaridade
  • Modelos comuns: text-embedding-ada-002, bge-m3

2.4 — RAG (Retrieval-Augmented Generation)⬜ Pendente · 20 min

Combinação de Busca e Geração

RAG enriquece prompts com dados externos recuperados de uma base de conhecimento:

  1. Embedding da query do utilizador
  2. Busca no vetor store (ex: FAISS, Chroma)
  3. Concatenação dos resultados ao prompt
  4. Geração de resposta com contexto

2.5 — Fine-tuning⬜ Pendente · 20 min

Adaptar Modelos ao Domínio

Fine-tuning ajusta pesos de um modelo pré-treinado para uma tarefa específica:

  • LoRA: Low-Rank Adaptation — eficiente em VRAM
  • DPO: Direct Preference Optimization
  • GRPO: Group Relative Policy Optimization

2.6 — Agentes de IA⬜ Pendente · 20 min

Modelos com Ações

Agentes de IA combinam raciocínio com execução:

  • Planificar: decompor tarefas
  • Executar: chamar ferramentas/APIs
  • Avaliar: verificar resultados
  • Iterar: corrigir com base no feedback

❓ Quiz de Avaliação

O que é RAG em IA?

A
Um tipo de rede neural recorrente
B
Um método de fine-tuning com LoRA
C
Retrieval-Augmented Generation — combina recuperação de documentos com geração de texto
D
Um framework para deploy de modelos GPU