Ingesta Escalable y Contextualización Semántica
Workers distribuidos de Scrapy utilizando Playwright para portales con alta carga de JS. Hashing SHA-256 para la procedencia de los documentos.
Inferencia local mediante BGE-M3. Vectores densos de 1024 dimensiones almacenados en pgvector para búsqueda semántica.
Aislamiento estricto mediante Supabase RLS. Cada consulta se limita al tenant_id a nivel de base de datos.
Búsqueda Vectorial P99
Dimensión del Embedding
Integridad de Datos (SHA)
Verificación automatizada mediante Playwright y Vitest. Registro distribuido mediante alertas de Sentinel.