Pular para o conteúdo principal
A aba Sistema oferece controle completo sobre os modelos de IA que alimentam as automações e fluxos de trabalho do EKB. Este é o centro de configuração para configurar Grandes Modelos de Linguagem (LLMs), personalizar quais modelos estão disponíveis para os usuários e gerenciar seu comportamento no sistema. Esta aba é especialmente útil para organizações que usam uma mistura de modelos de diferentes provedores (OpenAI, Anthropic, Google, etc.) e desejam ajustar desempenho, custos e controle de acesso.
#System
  • Adicionar Novos Modelos LLM: Adicione rapidamente modelos de provedores como OpenAI (por exemplo, GPT-3.5, GPT-4), Anthropic (por exemplo, Claude 3 Opus, Claude 3 Haiku, Claude 3.5 Sonnet) e Google (por exemplo, Gemini, modelos PaLM se habilitados).
    • Para cada modelo, defina:
      • API Name: Como o sistema se refere ao modelo no código.
      • Display Name: Como os usuários o veem na interface.
      • API Type: Provedor (OpenAI, Anthropic, etc.).
      • API Version: Para controle de versão.
      • Cost: Valor personalizado para rastreamento interno ou lógica de faturamento.
  • Gerenciar Modelos Existentes: Todos os modelos são exibidos em uma tabela com detalhes:
    • API Name: Nome do backend usado em fluxos de trabalho e logs.
    • Display Name: Nome amigável visível aos usuários.
    • API Type: Provedor (por exemplo, openai, anthropic).
    • API Version: Identificador de versão.
    • Cost: Custo relativo para contabilidade ou rastreamento de uso de tokens.
    • Hidden: Se marcado, o modelo é oculto dos usuários finais, mas disponível para administradores/agents internos.
    • Default: Marcar como padrão para tarefas e fluxos gerais.
    • Default Extraction: Marcar como padrão para fluxos de trabalho de extração de informações.
    Ações:
    • Edit: Modificar a configuração do modelo (nome, visibilidade, etc.)
    • Delete: Remover o modelo da plataforma

Casos de Uso

  • Controlar Custos: Ocultar modelos caros dos usuários gerais, enquanto ainda os disponibiliza para fluxos de trabalho de alta prioridade.
  • Simplificar o Acesso: Definir um modelo como padrão para integração rápida, por exemplo, GPT-3.5 para perguntas e respostas gerais, Claude para resumo, etc.
  • Executar Experimentos: Adicionar múltiplas versões do mesmo modelo para testes A/B de desempenho ou comparar qualidade de saída.

Dicas para Administradores

  • Revise regularmente quais modelos estão habilitados e quem tem acesso a eles.
  • Use a configuração Hidden para restringir o acesso a modelos de alto custo ou experimentais.
  • Defina padrões apropriados para simplificar a experiência do usuário e garantir que os modelos corretos sejam usados para as tarefas corretas.
  • Monitore o uso de modelos e custos para otimizar sua infraestrutura de IA.