Referência para Manutenção em OpenAI (Storage)
Esta seção detalha a estratégia de gestão de dados para manter a eficiência técnica e a saúde financeira da sua infraestrutura de RAG (Retrieval-Augmented Generation).
Estratégia de Monitoramento e Auditoria
Antes de realizar qualquer intervenção, é fundamental mapear o estado atual do armazenamento para evitar deleções acidentais ou redundâncias.
Monitoramento Macro (Visão da Conta)
Endpoint: GET /storage/vector_stores/all
Quando usar: No início de cada ciclo de auditoria ou para validar o sucesso de novos deploys de conteúdo.
Por que usar: Como a tarifação da OpenAI é diária, este endpoint permite identificar rapidamente Vector Stores (VS) que não deveriam estar ativas ou que estão acumulando volume de dados acima do previsto.
Fluxo Operacional: Utilize o campo
size_readablepara identificar quais Stores são responsáveis pelo maior consumo da sua cota.
Diagnóstico de Saúde (Arquivos por Store)
Endpoint: GET /storage/vector_stores/{vs_id}/all
Quando usar: Quando notar uma queda na qualidade das respostas da IA ou um aumento inesperado no tamanho de uma Store específica.
Por que usar: Permite visualizar o status individual de cada arquivo indexado. Arquivos com status
failedocupam espaço, mas não contribuem para a busca semântica, devendo ser removidos e reenviados.
Ciclo de Vida e Limpeza Automatizada
A exclusão simples de uma Vector Store no painel da OpenAI costuma deixar resíduos. O sistema Menthor implementa uma lógica de proteção de custos.
Deleção em Cascata (O «Cleanup Total»)
Endpoint: DELETE /storage/vector_stores/{vs_id}/delete
Quando usar: Sempre que um cliente for desativado, um projeto encerrado ou um
id_contextremovido.- Por que usar: Na infraestrutura padrão da OpenAI, deletar a Store não deleta os arquivos do storage global. Este endpoint garante que:
A Store seja removida.
Os arquivos vinculados sejam identificados.
Cada arquivo físico (user_data) seja permanentemente excluído para cessar a cobrança.
Otimização e Higienização de Storage
Processos de upload interrompidos ou deleções manuais incompletas geram «arquivos orfãos» (arquivos que custam dinheiro, mas não estão em nenhuma Store).
Detecção de Arquivos Órfãos
Endpoint: GET /storage/files_unassociated
Quando usar: Recomendado como uma rotina semanal de manutenção.
Por que usar: Este é o seu «scanner de desperdício». Ele cruza todos os arquivos da conta contra todas as Stores ativas e isola apenas o que está flutuando sem utilidade.
Exclusão em Lote (Bulk Purge)
Endpoint: POST /storage/bulk_delete_files
Quando usar: Logo após a identificação de órfãos ou para limpar backups de arquivos antigos de uma só vez.
- Fluxo de Uso Recomendado:
Identifique os órfãos via
/storage/files_unassociated.Revise a lista para garantir que nenhum arquivo é de uso compartilhado.
Envie a lista de IDs para este endpoint para realizar o purge massivo e imediato.
Aviso
A operação de Bulk Purge é irreversível. Certifique-se de que os arquivos realmente não possuem utilidade em outros projetos vinculados à mesma API Key.
Guia de Decisão Rápida
Objetivo |
Fluxo Sugerido |
|---|---|
Reduzir a conta da OpenAI |
Detectar Órfãos -> Bulk Purge. |
Encerrar um Contexto |
Deleção em Cascata (Cascading Delete). |
Investigar erro de busca |
Listar Arquivos por Store -> Verificar status individual. |
Inventário Mensal |
Listagem Global de Vector Stores. |