Saltar para o conteúdo

Documentação técnica

Como o Threada funciona, o que requer e como integrar.

Visão geral da arquitetura

  • Crawl — Obtém páginas do seu domínio seguindo sitemap e links internos
  • Render — Renderiza páginas com muito JavaScript antes da extração
  • Extract — Extrai conteúdo incluindo dados estruturados
  • Chunk — Divide o conteúdo em blocos semânticos
  • Embed — Converte blocos em embeddings vetoriais
  • Index — Armazena embeddings para recuperação
  • Retrieve — Recupera blocos relevantes por similaridade semântica
  • Generate — Sintetiza uma resposta a partir do conteúdo recuperado
  • Cite — Liga à página fonte quando há conteúdo relevante

Rastreamento

O que rastreamos

  • Páginas HTML do sitemap ou links internos
  • Dados estruturados (JSON-LD, schema.org)
  • Documentos enviados manualmente (PDF, HTML, DOCX)

Comportamento de rastreamento

  • Respeita robots.txt
  • User-Agent identificado
  • Rate-limited para evitar carga no servidor
  • Abranda em 429 ou 5xx

Renderização JavaScript — Páginas renderizadas com navegador headless antes da extração para SPAs e conteúdo dinâmico.

Reindexação

  • Monitorização do sitemap aciona reindexação automática
  • Reindexação manual disponível a qualquer momento
  • Reindexação programada configurável por plano

Recuperação

Pesquisa semântica As consultas são convertidas em embeddings e comparadas por similaridade semântica, não por palavras-chave.

Limiares de relevância Configuráveis. Limiares altos = menos respostas, mais confiantes. Limiares baixos = maior cobertura com mais clarificações.

Geração de respostas

O conteúdo recuperado é passado como contexto. As respostas são sintetizadas apenas a partir desse contexto.

Citações — Quando há conteúdo relevante, as respostas incluem um link para a página fonte. Em caso de incerteza, pode não haver citação.

Comportamento de limites

  • Reconhece o que não sabe
  • Faz perguntas de clarificação
  • Sugere tópicos relacionados

Integração do embed

Instalação Um único snippet. Carrega de forma assíncrona.

Compatibilidade

  • WordPress
  • Webflow
  • Shopify
  • Squarespace
  • Sites personalizados
  • SPAs (React, Vue, Angular)

Configuração via painel

  • Cores, logótipo, posição
  • Mensagem de boas-vindas, tom
  • Definições de idioma
  • Limiares de relevância

API pública

Acesso seguro à API, com escopo por tenant, para tickets e ações em todos os canais.

Autenticação e acesso

  • Envie a chave da API no cabeçalho `X-Api-Key`.
  • Crie e revogue chaves em Admin → API keys; use uma chave por integração.
  • As chaves são por tenant e seguem o menor privilégio via scopes.

Scopes

  • `support.read` — listar e recuperar tickets, mensagens e ações.
  • `support.write` — criar/atualizar tickets e anexar mensagens.
  • `support.actions` — executar ações e consultar status.

Endpoints principais

  • `/api/v1/public/tickets` — listar ou criar tickets.
  • `/api/v1/public/tickets/{ticket_id}` — obter ou atualizar detalhes do ticket.
  • `/api/v1/public/tickets/{ticket_id}/messages` — listar ou anexar mensagens.
  • `/api/v1/public/tickets/{ticket_id}/actions` — executar uma ação para um ticket.
  • `/api/v1/public/actions` — listar ou consultar o status de ações.

Formato de resposta

  • Respostas JSON; timestamps em RFC 3339.
  • Erros retornam `{ error: { type, message, code } }`.
  • Endpoints de lista aceitam `limit` e `page_token`.

Valores de canal

  • `web`, `email`, `sms`, `whatsapp`, `social`, `voice`, `custom`.
  • Use `channel_id` e `channel_thread_id` para mapear conversas externas.
  • Use `external_message_id` para deduplicar mensagens.

Configuração do Zapier

Conecte a Threada ao Zapier para automação sem código com superfície controlada.

Automação de saída (Threada → Zapier)

  • Crie um Zap com o gatilho “Catch Hook” do Webhooks by Zapier e copie a URL do hook.
  • Em Admin → Support → Integrations, adicione uma integração Zapier com a URL do webhook e um header secreto opcional.
  • Use uma ação de HTTP personalizado para enviar payloads; se nenhuma integração de HTTP personalizado for selecionada, o Zapier é usado por padrão.

Automação de entrada (Zapier → Threada)

  • Crie uma chave de API com scopes para o Zapier (menor privilégio).
  • Use Webhooks by Zapier para chamar os endpoints da API pública de tickets e ações.
  • Armazene a chave com segurança no Zapier e faça rotação em um cronograma.

Higiene empresarial

  • Separe chaves por ambiente (produção vs. sandbox).
  • Revogue chaves quando um Zap for desativado ou a propriedade mudar.
  • Prefira scopes somente leitura a menos que a automação precise escrever.

Segurança

Hospedagem: GCP, US-Central1 padrão. Encriptação: TLS 1.2+ em trânsito, AES-256 em repouso. Autenticação: SSO via OIDC/SAML (Enterprise). Conformidade: GDPR, retenção configurável, auditoria. Modelo de ameaças documentado cobrindo prompt injection, XSS, SSRF, exfiltração.

Tratamento de dados

Armazenado

  • Conteúdo indexado
  • Embeddings
  • Registos de chat
  • Analítica
  • Configuração

Não armazenado

  • Informações de pagamento (tratadas pelo processador)
  • Credenciais em texto simples

Retenção Configurável por tenant. Eliminação a pedido.

Treino O seu conteúdo não é usado para treinar modelos de IA.

FAQ

Páginas protegidas por palavra-passe?
Ainda não. Envie documentos para conteúdo privado.
Excluir páginas?
Sim. Via robots.txt ou configuração no painel.
Com que rapidez as atualizações?
A reindexação automática normalmente ocorre em 24 horas. A manual é imediata.
Site indisponível durante o rastreamento?
O crawler reduz a frequência e tenta novamente. O conteúdo anterior permanece disponível.
Ver conteúdo indexado?
Sim. O painel mostra páginas indexadas e estado.
Múltiplos idiomas?
Sim. Deteção automática ou idioma padrão por embed.
Porque às vezes não há citação?
As citações ligam a fontes. Ao reconhecer incerteza, não há fonte para citar.