Pular para o conteúdo principal
A aba Settings nas Configurações da Base de Conhecimento permite configurar como seus documentos são processados e divididos em chunks. Essas configurações controlam como o conteúdo é dividido em chunks, o que afeta como o agente de IA recupera e utiliza informações da sua base de conhecimento.

Visão Geral

A aba Settings inclui:
  • Chunking Strategy - Como os documentos são divididos em chunks
  • Chunk Configuration - Configurações de tamanho e sobreposição para chunks
  • Chunk Enhancement Settings - Aprimoramento opcional de chunks com IA

Acessando as Configurações

  1. Navegue até Knowledge Base na barra lateral
  2. Vá para a seção KB Data
  3. Clique no ícone Settings (ícone de engrenagem)
  4. Selecione a aba Settings

Estratégia de Chunking

A estratégia de chunking determina como os documentos são divididos em chunks menores e processáveis para incorporação e recuperação.

Sentence Chunking

Divide o texto em chunks com base nos limites das frases, garantindo que cada chunk contenha frases completas. Ideal Para:
  • Documentos de linguagem natural
  • Preservar o contexto das frases
  • Conteúdo de uso geral
Configuração:
  • Usa tokenizador de frases para limites de linguagem natural
  • Garante que os chunks contenham frases completas
  • Mantém legibilidade e contexto

Semantic Chunking

Divide o texto em chunks semanticamente significativos, que podem não se alinhar com os limites das frases. Ideal Para:
  • Documentos complexos
  • Preservar contexto semântico
  • Necessidades avançadas de recuperação
Configuração:
  • Determina automaticamente os limites dos chunks
  • Preserva o significado semântico
  • Pode não se alinhar com os limites das frases

Configuração de Chunk

A configuração de chunk aparece quando você seleciona Sentence Chunking. Isso permite ajustar como os documentos são divididos.

Tamanho do Chunk

O tamanho máximo de cada chunk em tokens/caracteres. Padrão: 64 Recomendação: 64-512 tokens para a maioria dos casos de uso Considerações:
  • Chunks maiores preservam mais contexto, mas podem ser menos precisos para recuperação
  • Chunks menores são mais precisos, mas podem perder contexto
  • Equilíbrio entre preservação de contexto e precisão de recuperação
Como Configurar:
  1. Selecione Sentence Chunking como sua estratégia de chunking
  2. Insira o tamanho desejado do chunk no campo Chunk Size
  3. O valor deve ser pelo menos 1

Sobreposição de Chunks

O número de tokens/caracteres sobrepostos entre chunks adjacentes. Isso ajuda a manter o contexto entre os limites dos chunks. Padrão: 6 Recomendação: 10-20% do tamanho do chunk definido Considerações:
  • A sobreposição garante que informações importantes não sejam divididas entre os limites dos chunks
  • Sobreposição excessiva desperdiça armazenamento e processamento
  • Sobreposição insuficiente pode perder contexto entre os chunks
Como Configurar:
  1. Selecione Sentence Chunking como sua estratégia de chunking
  2. Insira a sobreposição desejada no campo Chunk Overlap
  3. O valor deve ser não negativo e menor que o tamanho do chunk
Exemplo:
  • Se o tamanho do chunk for 64, a sobreposição recomendada é de 6-13 tokens
  • Se o tamanho do chunk for 512, a sobreposição recomendada é de 51-102 tokens

Configurações de Aprimoramento de Chunk

O aprimoramento de chunk usa IA para aprimorar chunks com contexto adicional e metadados para melhor recuperação.

Enriquecimento de Chunk

Habilite o enriquecimento de chunks para aprimorar chunks com contexto adicional para melhor recuperação. Benefícios:
  • Maior precisão de pesquisa
  • Melhor compreensão do contexto
  • Qualidade de recuperação aprimorada
Como Habilitar:
  1. Ative o interruptor Chunk Enrichment para habilitar
  2. Selecione um LLM Model para enriquecimento (obrigatório quando habilitado)
  3. Salve as configurações
Considerações:
  • Aumenta o tempo de processamento
  • Requer seleção de modelo LLM
  • Adiciona custo computacional
  • Melhora a qualidade da pesquisa

Seleção de Modelo LLM

Quando o enriquecimento de chunks está habilitado, você deve selecionar um modelo LLM para enriquecimento de chunks e análise de conteúdo. Modelos Disponíveis:
  • Todos os modelos predefinidos (GPT-4o, Claude, Gemini, etc.)
  • Modelos personalizados configurados no seu projeto
Como Selecionar:
  1. Habilite Chunk Enrichment
  2. Clique no menu suspenso LLM Model
  3. Selecione o modelo desejado na lista
  4. Salve as configurações
Dicas de Seleção de Modelo:
  • Use modelos com fortes capacidades de raciocínio para melhor enriquecimento
  • Considere as trocas entre tempo de processamento e qualidade
  • Teste diferentes modelos para encontrar o melhor para o seu conteúdo

Salvando e Aplicando Configurações

Salvar Configurações

Salva sua configuração, mas aplica apenas a novos documentos sincronizados ou adicionados a partir de agora. Passos:
  1. Configure suas configurações
  2. Clique em Save Settings
  3. As configurações são salvas no banco de dados
  4. Novos documentos usarão essas configurações
As configurações salvas se aplicam apenas a novos documentos. Documentos existentes continuam usando sua configuração original de chunking.

Aplicar a Todos os Documentos

Reindexa todos os documentos existentes na sua base de conhecimento com as configurações atuais. Passos:
  1. Configure e salve suas configurações
  2. Clique em Apply to All Documents
  3. Confirme a ação no modal
  4. Acompanhe o progresso conforme os documentos são re-sincronizados
O Que Acontece:
  • Todos os documentos são re-sincronizados com novas configurações
  • Os chunks são regenerados com nova configuração
  • Os embeddings são atualizados
  • O processo é executado em segundo plano
Acompanhamento de Progresso:
  • Atualizações em tempo real sobre o status de sincronização dos documentos
  • Status de sucesso/falha para cada documento
  • Indicador de total de arquivos processados
Aplicar configurações a todos os documentos pode levar tempo significativo dependendo do número de documentos. Este processo não pode ser cancelado uma vez iniciado.

Melhores Práticas

Seleção da Estratégia de Chunking

  1. Comece com Sentence Chunking - Ideal para a maioria dos casos de uso
  2. Use Semantic Chunking - Para documentos complexos ou técnicos
  3. Teste Ambas - Compare a qualidade de recuperação para o seu conteúdo

Configuração do Tamanho do Chunk

  1. Comece com o Padrão (64) - Boa linha de base para a maioria dos conteúdos
  2. Aumente para Conteúdo Rico em Contexto - Documentos que requerem mais contexto
  3. Reduza para Recuperação Precisa - Quando correspondências exatas são importantes
  4. Teste Diferentes Tamanhos - Encontre o tamanho ideal para o seu caso de uso

Configuração da Sobreposição de Chunks

  1. Use 10-20% do Tamanho do Chunk - Faixa recomendada
  2. Aumente para Informações Críticas - Quando o contexto é essencial
  3. Reduza para Eficiência de Armazenamento - Quando o armazenamento é uma preocupação
  4. Equilibre Contexto vs. Eficiência - Encontre o ponto ideal

Enriquecimento de Chunks

  1. Habilite para Conteúdo Complexo - Quando o chunking simples não é suficiente
  2. Selecione o Modelo Apropriado - Use modelos com forte raciocínio
  3. Monitore o Desempenho - Observe aumentos no tempo de processamento
  4. Teste as Melhorias de Qualidade - Verifique a qualidade de recuperação aprimorada

Solução de Problemas

Configurações Não Aplicadas

Problema: Configurações salvas, mas os documentos não estão usando a nova configuração Soluções:
  1. Clique em Apply to All Documents para reindexar documentos existentes
  2. Verifique se as configurações foram salvas corretamente
  3. Verifique se os novos documentos estão usando as configurações
  4. Aguarde a sincronização em segundo plano ser concluída

Qualidade de Recuperação Ruim

Problema: Agente de IA não encontrando informações relevantes Soluções:
  1. Ajuste o tamanho do chunk (tente chunks maiores para mais contexto)
  2. Aumente a sobreposição de chunks
  3. Habilite o enriquecimento de chunks
  4. Teste diferentes estratégias de chunking

Problemas de Tempo de Processamento

Problema: Documentos demorando muito para processar Soluções:
  1. Reduza o tamanho do chunk
  2. Desabilite o enriquecimento de chunks
  3. Use modelos LLM mais rápidos para enriquecimento
  4. Verifique o tamanho e a complexidade do documento

Recursos Relacionados

  • Connectors - Integre fontes de dados externas
  • Crawlers - Busque automaticamente conteúdo da web
  • Sync & Schedule - Gerencie agendamentos de sincronização
  • Templates - Crie modelos de resposta

Connectors

Saiba sobre como conectar fontes de dados externas

Crawlers

Saiba sobre crawlers da web

Sync & Schedule

Saiba sobre agendamento de sincronização