Infocepo Lab — IA & LLMs

← Voltar ao Painel

IA & LLMs

LLMs, prompts, embeddings, RAG e pipelines de machine learning.

📖 Lições

2.1 — O que é um LLM?⬜ Pendente · 15 min

Large Language Models

Modelos de linguagem treinados em vastos corpora de texto. Utilizam arquitetura Transformer para processamento sequencial.

Capacidades Principais

Geração de texto natural
Resposta a perguntas
Tradução automática
Resumo de documentos
Classificação de texto

2.2 — Prompt Engineering⬜ Pendente · 20 min

Práticas Essenciais

O prompt é a interface principal com o modelo. Boas práticas incluem:

Contexto claro: definir o papel do modelo
Exemplos: few-shot prompting
Estrutura: dividir tarefas complexas
Restrições: limitar formato de saída

2.3 — Embeddings⬜ Pendente · 15 min

Vetores de Significado

Embeddings convertem texto em vetores numéricos que capturam significado semântico.

Textos similares → vetores próximos no espaço vetorial
Usados para busca semântica e similaridade
Modelos comuns: text-embedding-ada-002, bge-m3

2.4 — RAG (Retrieval-Augmented Generation)⬜ Pendente · 20 min

Combinação de Busca e Geração

RAG enriquece prompts com dados externos recuperados de uma base de conhecimento:

Embedding da query do utilizador
Busca no vetor store (ex: FAISS, Chroma)
Concatenação dos resultados ao prompt
Geração de resposta com contexto

2.5 — Fine-tuning⬜ Pendente · 20 min

Adaptar Modelos ao Domínio

Fine-tuning ajusta pesos de um modelo pré-treinado para uma tarefa específica:

LoRA: Low-Rank Adaptation — eficiente em VRAM
DPO: Direct Preference Optimization
GRPO: Group Relative Policy Optimization

2.6 — Agentes de IA⬜ Pendente · 20 min

Modelos com Ações

Agentes de IA combinam raciocínio com execução:

Planificar: decompor tarefas
Executar: chamar ferramentas/APIs
Avaliar: verificar resultados
Iterar: corrigir com base no feedback

❓ Quiz de Avaliação

O que é RAG em IA?

A

Um tipo de rede neural recorrente

B

Um método de fine-tuning com LoRA

C

Retrieval-Augmented Generation — combina recuperação de documentos com geração de texto

D

Um framework para deploy de modelos GPU