Visão Geral
A aba Settings inclui:- Chunking Strategy - Como os documentos são divididos em chunks
- Chunk Configuration - Configurações de tamanho e sobreposição para chunks
- Chunk Enhancement Settings - Aprimoramento opcional de chunks com IA
Acessando as Configurações
- Navegue até Knowledge Base na barra lateral
- Vá para a seção KB Data
- Clique no ícone Settings (ícone de engrenagem)
- Selecione a aba Settings
Estratégia de Chunking
A estratégia de chunking determina como os documentos são divididos em chunks menores e processáveis para incorporação e recuperação.Sentence Chunking
Divide o texto em chunks com base nos limites das frases, garantindo que cada chunk contenha frases completas. Ideal Para:- Documentos de linguagem natural
- Preservar o contexto das frases
- Conteúdo de uso geral
- Usa tokenizador de frases para limites de linguagem natural
- Garante que os chunks contenham frases completas
- Mantém legibilidade e contexto
Semantic Chunking
Divide o texto em chunks semanticamente significativos, que podem não se alinhar com os limites das frases. Ideal Para:- Documentos complexos
- Preservar contexto semântico
- Necessidades avançadas de recuperação
- Determina automaticamente os limites dos chunks
- Preserva o significado semântico
- Pode não se alinhar com os limites das frases
Configuração de Chunk
A configuração de chunk aparece quando você seleciona Sentence Chunking. Isso permite ajustar como os documentos são divididos.Tamanho do Chunk
O tamanho máximo de cada chunk em tokens/caracteres. Padrão: 64 Recomendação: 64-512 tokens para a maioria dos casos de uso Considerações:- Chunks maiores preservam mais contexto, mas podem ser menos precisos para recuperação
- Chunks menores são mais precisos, mas podem perder contexto
- Equilíbrio entre preservação de contexto e precisão de recuperação
- Selecione Sentence Chunking como sua estratégia de chunking
- Insira o tamanho desejado do chunk no campo Chunk Size
- O valor deve ser pelo menos 1
Sobreposição de Chunks
O número de tokens/caracteres sobrepostos entre chunks adjacentes. Isso ajuda a manter o contexto entre os limites dos chunks. Padrão: 6 Recomendação: 10-20% do tamanho do chunk definido Considerações:- A sobreposição garante que informações importantes não sejam divididas entre os limites dos chunks
- Sobreposição excessiva desperdiça armazenamento e processamento
- Sobreposição insuficiente pode perder contexto entre os chunks
- Selecione Sentence Chunking como sua estratégia de chunking
- Insira a sobreposição desejada no campo Chunk Overlap
- O valor deve ser não negativo e menor que o tamanho do chunk
- Se o tamanho do chunk for 64, a sobreposição recomendada é de 6-13 tokens
- Se o tamanho do chunk for 512, a sobreposição recomendada é de 51-102 tokens
Configurações de Aprimoramento de Chunk
O aprimoramento de chunk usa IA para aprimorar chunks com contexto adicional e metadados para melhor recuperação.Enriquecimento de Chunk
Habilite o enriquecimento de chunks para aprimorar chunks com contexto adicional para melhor recuperação. Benefícios:- Maior precisão de pesquisa
- Melhor compreensão do contexto
- Qualidade de recuperação aprimorada
- Ative o interruptor Chunk Enrichment para habilitar
- Selecione um LLM Model para enriquecimento (obrigatório quando habilitado)
- Salve as configurações
- Aumenta o tempo de processamento
- Requer seleção de modelo LLM
- Adiciona custo computacional
- Melhora a qualidade da pesquisa
Seleção de Modelo LLM
Quando o enriquecimento de chunks está habilitado, você deve selecionar um modelo LLM para enriquecimento de chunks e análise de conteúdo. Modelos Disponíveis:- Todos os modelos predefinidos (GPT-4o, Claude, Gemini, etc.)
- Modelos personalizados configurados no seu projeto
- Habilite Chunk Enrichment
- Clique no menu suspenso LLM Model
- Selecione o modelo desejado na lista
- Salve as configurações
- Use modelos com fortes capacidades de raciocínio para melhor enriquecimento
- Considere as trocas entre tempo de processamento e qualidade
- Teste diferentes modelos para encontrar o melhor para o seu conteúdo
Salvando e Aplicando Configurações
Salvar Configurações
Salva sua configuração, mas aplica apenas a novos documentos sincronizados ou adicionados a partir de agora. Passos:- Configure suas configurações
- Clique em Save Settings
- As configurações são salvas no banco de dados
- Novos documentos usarão essas configurações
Aplicar a Todos os Documentos
Reindexa todos os documentos existentes na sua base de conhecimento com as configurações atuais. Passos:- Configure e salve suas configurações
- Clique em Apply to All Documents
- Confirme a ação no modal
- Acompanhe o progresso conforme os documentos são re-sincronizados
- Todos os documentos são re-sincronizados com novas configurações
- Os chunks são regenerados com nova configuração
- Os embeddings são atualizados
- O processo é executado em segundo plano
- Atualizações em tempo real sobre o status de sincronização dos documentos
- Status de sucesso/falha para cada documento
- Indicador de total de arquivos processados
Melhores Práticas
Seleção da Estratégia de Chunking
- Comece com Sentence Chunking - Ideal para a maioria dos casos de uso
- Use Semantic Chunking - Para documentos complexos ou técnicos
- Teste Ambas - Compare a qualidade de recuperação para o seu conteúdo
Configuração do Tamanho do Chunk
- Comece com o Padrão (64) - Boa linha de base para a maioria dos conteúdos
- Aumente para Conteúdo Rico em Contexto - Documentos que requerem mais contexto
- Reduza para Recuperação Precisa - Quando correspondências exatas são importantes
- Teste Diferentes Tamanhos - Encontre o tamanho ideal para o seu caso de uso
Configuração da Sobreposição de Chunks
- Use 10-20% do Tamanho do Chunk - Faixa recomendada
- Aumente para Informações Críticas - Quando o contexto é essencial
- Reduza para Eficiência de Armazenamento - Quando o armazenamento é uma preocupação
- Equilibre Contexto vs. Eficiência - Encontre o ponto ideal
Enriquecimento de Chunks
- Habilite para Conteúdo Complexo - Quando o chunking simples não é suficiente
- Selecione o Modelo Apropriado - Use modelos com forte raciocínio
- Monitore o Desempenho - Observe aumentos no tempo de processamento
- Teste as Melhorias de Qualidade - Verifique a qualidade de recuperação aprimorada
Solução de Problemas
Configurações Não Aplicadas
Problema: Configurações salvas, mas os documentos não estão usando a nova configuração Soluções:- Clique em Apply to All Documents para reindexar documentos existentes
- Verifique se as configurações foram salvas corretamente
- Verifique se os novos documentos estão usando as configurações
- Aguarde a sincronização em segundo plano ser concluída
Qualidade de Recuperação Ruim
Problema: Agente de IA não encontrando informações relevantes Soluções:- Ajuste o tamanho do chunk (tente chunks maiores para mais contexto)
- Aumente a sobreposição de chunks
- Habilite o enriquecimento de chunks
- Teste diferentes estratégias de chunking
Problemas de Tempo de Processamento
Problema: Documentos demorando muito para processar Soluções:- Reduza o tamanho do chunk
- Desabilite o enriquecimento de chunks
- Use modelos LLM mais rápidos para enriquecimento
- Verifique o tamanho e a complexidade do documento
Recursos Relacionados
- Connectors - Integre fontes de dados externas
- Crawlers - Busque automaticamente conteúdo da web
- Sync & Schedule - Gerencie agendamentos de sincronização
- Templates - Crie modelos de resposta
Connectors
Saiba sobre como conectar fontes de dados externas
Crawlers
Saiba sobre crawlers da web
Sync & Schedule
Saiba sobre agendamento de sincronização