Configurações

A aba Settings nas Configurações da Base de Conhecimento permite configurar como seus documentos são processados e divididos em chunks. Essas configurações controlam como o conteúdo é dividido em chunks, o que afeta como o agente de IA recupera e utiliza informações da sua base de conhecimento.

Visão Geral

A aba Settings inclui:

Chunking Strategy - Como os documentos são divididos em chunks
Chunk Configuration - Configurações de tamanho e sobreposição para chunks
Chunk Enhancement Settings - Aprimoramento opcional de chunks com IA

Acessando as Configurações

Navegue até Knowledge Base na barra lateral
Vá para a seção KB Data
Clique no ícone Settings (ícone de engrenagem)
Selecione a aba Settings

Estratégia de Chunking

A estratégia de chunking determina como os documentos são divididos em chunks menores e processáveis para incorporação e recuperação.

Sentence Chunking

Divide o texto em chunks com base nos limites das frases, garantindo que cada chunk contenha frases completas. Ideal Para:

Documentos de linguagem natural
Preservar o contexto das frases
Conteúdo de uso geral

Configuração:

Usa tokenizador de frases para limites de linguagem natural
Garante que os chunks contenham frases completas
Mantém legibilidade e contexto

Semantic Chunking

Divide o texto em chunks semanticamente significativos, que podem não se alinhar com os limites das frases. Ideal Para:

Documentos complexos
Preservar contexto semântico
Necessidades avançadas de recuperação

Configuração:

Determina automaticamente os limites dos chunks
Preserva o significado semântico
Pode não se alinhar com os limites das frases

Configuração de Chunk

A configuração de chunk aparece quando você seleciona Sentence Chunking. Isso permite ajustar como os documentos são divididos.

Tamanho do Chunk

O tamanho máximo de cada chunk em tokens/caracteres. Padrão: 64 Recomendação: 64-512 tokens para a maioria dos casos de uso Considerações:

Chunks maiores preservam mais contexto, mas podem ser menos precisos para recuperação
Chunks menores são mais precisos, mas podem perder contexto
Equilíbrio entre preservação de contexto e precisão de recuperação

Como Configurar:

Selecione Sentence Chunking como sua estratégia de chunking
Insira o tamanho desejado do chunk no campo Chunk Size
O valor deve ser pelo menos 1

Sobreposição de Chunks

O número de tokens/caracteres sobrepostos entre chunks adjacentes. Isso ajuda a manter o contexto entre os limites dos chunks. Padrão: 6 Recomendação: 10-20% do tamanho do chunk definido Considerações:

A sobreposição garante que informações importantes não sejam divididas entre os limites dos chunks
Sobreposição excessiva desperdiça armazenamento e processamento
Sobreposição insuficiente pode perder contexto entre os chunks

Como Configurar:

Selecione Sentence Chunking como sua estratégia de chunking
Insira a sobreposição desejada no campo Chunk Overlap
O valor deve ser não negativo e menor que o tamanho do chunk

Exemplo:

Se o tamanho do chunk for 64, a sobreposição recomendada é de 6-13 tokens
Se o tamanho do chunk for 512, a sobreposição recomendada é de 51-102 tokens

Configurações de Aprimoramento de Chunk

O aprimoramento de chunk usa IA para aprimorar chunks com contexto adicional e metadados para melhor recuperação.

Enriquecimento de Chunk

Habilite o enriquecimento de chunks para aprimorar chunks com contexto adicional para melhor recuperação. Benefícios:

Maior precisão de pesquisa
Melhor compreensão do contexto
Qualidade de recuperação aprimorada

Como Habilitar:

Ative o interruptor Chunk Enrichment para habilitar
Selecione um LLM Model para enriquecimento (obrigatório quando habilitado)
Salve as configurações

Considerações:

Aumenta o tempo de processamento
Requer seleção de modelo LLM
Adiciona custo computacional
Melhora a qualidade da pesquisa

Seleção de Modelo LLM

Quando o enriquecimento de chunks está habilitado, você deve selecionar um modelo LLM para enriquecimento de chunks e análise de conteúdo. Modelos Disponíveis:

Todos os modelos predefinidos (GPT-4o, Claude, Gemini, etc.)
Modelos personalizados configurados no seu projeto

Como Selecionar:

Habilite Chunk Enrichment
Clique no menu suspenso LLM Model
Selecione o modelo desejado na lista
Salve as configurações

Dicas de Seleção de Modelo:

Use modelos com fortes capacidades de raciocínio para melhor enriquecimento
Considere as trocas entre tempo de processamento e qualidade
Teste diferentes modelos para encontrar o melhor para o seu conteúdo

Salvando e Aplicando Configurações

Salvar Configurações

Salva sua configuração, mas aplica apenas a novos documentos sincronizados ou adicionados a partir de agora. Passos:

Configure suas configurações
Clique em Save Settings
As configurações são salvas no banco de dados
Novos documentos usarão essas configurações

As configurações salvas se aplicam apenas a novos documentos. Documentos existentes continuam usando sua configuração original de chunking.

Aplicar a Todos os Documentos

Reindexa todos os documentos existentes na sua base de conhecimento com as configurações atuais. Passos:

Configure e salve suas configurações
Clique em Apply to All Documents
Confirme a ação no modal
Acompanhe o progresso conforme os documentos são re-sincronizados

O Que Acontece:

Todos os documentos são re-sincronizados com novas configurações
Os chunks são regenerados com nova configuração
Os embeddings são atualizados
O processo é executado em segundo plano

Acompanhamento de Progresso:

Atualizações em tempo real sobre o status de sincronização dos documentos
Status de sucesso/falha para cada documento
Indicador de total de arquivos processados

Aplicar configurações a todos os documentos pode levar tempo significativo dependendo do número de documentos. Este processo não pode ser cancelado uma vez iniciado.

Melhores Práticas

Seleção da Estratégia de Chunking

Comece com Sentence Chunking - Ideal para a maioria dos casos de uso
Use Semantic Chunking - Para documentos complexos ou técnicos
Teste Ambas - Compare a qualidade de recuperação para o seu conteúdo

Configuração do Tamanho do Chunk

Comece com o Padrão (64) - Boa linha de base para a maioria dos conteúdos
Aumente para Conteúdo Rico em Contexto - Documentos que requerem mais contexto
Reduza para Recuperação Precisa - Quando correspondências exatas são importantes
Teste Diferentes Tamanhos - Encontre o tamanho ideal para o seu caso de uso

Configuração da Sobreposição de Chunks

Use 10-20% do Tamanho do Chunk - Faixa recomendada
Aumente para Informações Críticas - Quando o contexto é essencial
Reduza para Eficiência de Armazenamento - Quando o armazenamento é uma preocupação
Equilibre Contexto vs. Eficiência - Encontre o ponto ideal

Enriquecimento de Chunks

Habilite para Conteúdo Complexo - Quando o chunking simples não é suficiente
Selecione o Modelo Apropriado - Use modelos com forte raciocínio
Monitore o Desempenho - Observe aumentos no tempo de processamento
Teste as Melhorias de Qualidade - Verifique a qualidade de recuperação aprimorada

Solução de Problemas

Configurações Não Aplicadas

Problema: Configurações salvas, mas os documentos não estão usando a nova configuração Soluções:

Clique em Apply to All Documents para reindexar documentos existentes
Verifique se as configurações foram salvas corretamente
Verifique se os novos documentos estão usando as configurações
Aguarde a sincronização em segundo plano ser concluída

Qualidade de Recuperação Ruim

Problema: Agente de IA não encontrando informações relevantes Soluções:

Ajuste o tamanho do chunk (tente chunks maiores para mais contexto)
Aumente a sobreposição de chunks
Habilite o enriquecimento de chunks
Teste diferentes estratégias de chunking

Problemas de Tempo de Processamento

Problema: Documentos demorando muito para processar Soluções:

Reduza o tamanho do chunk
Desabilite o enriquecimento de chunks
Use modelos LLM mais rápidos para enriquecimento
Verifique o tamanho e a complexidade do documento

Recursos Relacionados

Connectors - Integre fontes de dados externas
Crawlers - Busque automaticamente conteúdo da web
Sync & Schedule - Gerencie agendamentos de sincronização
Templates - Crie modelos de resposta

Connectors

Saiba sobre como conectar fontes de dados externas

Crawlers

Saiba sobre crawlers da web

Sync & Schedule

Saiba sobre agendamento de sincronização

Get Started!

Offerings

Chat

Agents

Knowledge Base

Workflows

Public Chatbot

Project Settings

My Account

Platform Admin

SDK

General Information

Visão Geral

Acessando as Configurações

Estratégia de Chunking

Sentence Chunking

Semantic Chunking

Configuração de Chunk

Tamanho do Chunk

Sobreposição de Chunks

Configurações de Aprimoramento de Chunk

Enriquecimento de Chunk

Seleção de Modelo LLM

Salvando e Aplicando Configurações

Salvar Configurações

Aplicar a Todos os Documentos

Melhores Práticas

Seleção da Estratégia de Chunking

Configuração do Tamanho do Chunk

Configuração da Sobreposição de Chunks

Enriquecimento de Chunks

Solução de Problemas

Configurações Não Aplicadas

Qualidade de Recuperação Ruim

Problemas de Tempo de Processamento

Recursos Relacionados

Connectors

Crawlers

Sync & Schedule

​Visão Geral

​Acessando as Configurações

​Estratégia de Chunking

​Sentence Chunking

​Semantic Chunking

​Configuração de Chunk

​Tamanho do Chunk

​Sobreposição de Chunks

​Configurações de Aprimoramento de Chunk

​Enriquecimento de Chunk

​Seleção de Modelo LLM

​Salvando e Aplicando Configurações

​Salvar Configurações

​Aplicar a Todos os Documentos

​Melhores Práticas

​Seleção da Estratégia de Chunking

​Configuração do Tamanho do Chunk

​Configuração da Sobreposição de Chunks

​Enriquecimento de Chunks

​Solução de Problemas

​Configurações Não Aplicadas

​Qualidade de Recuperação Ruim

​Problemas de Tempo de Processamento

​Recursos Relacionados

Connectors

Crawlers

Sync & Schedule

Visão Geral

Acessando as Configurações

Estratégia de Chunking

Sentence Chunking

Semantic Chunking

Configuração de Chunk

Tamanho do Chunk

Sobreposição de Chunks

Configurações de Aprimoramento de Chunk

Enriquecimento de Chunk

Seleção de Modelo LLM

Salvando e Aplicando Configurações

Salvar Configurações

Aplicar a Todos os Documentos

Melhores Práticas

Seleção da Estratégia de Chunking

Configuração do Tamanho do Chunk

Configuração da Sobreposição de Chunks

Enriquecimento de Chunks

Solução de Problemas

Configurações Não Aplicadas

Qualidade de Recuperação Ruim

Problemas de Tempo de Processamento

Recursos Relacionados