Ingeniería RADAR v3.0

Ingesta de Alta Concurrencia y Recuperación Nativa de Vectores

STACK: Python 3.11 | FastAPI | Next.js 15 | pgvector

Módulo: Sentinel

Scraping y Normalización

  • Scrapy + Playwright: scrapers de alta resiliencia para portales regulatorios dinámicos.
  • Asyncio: Procesamiento concurrente de múltiples fuentes PDF.
  • SHA-256: Seguimiento de procedencia inmutable para cada fuente de documento.

Módulo: Embedding-Svc

Mapeo Semántico Neuronal

  • Modelo: BGE-M3 (Multilingüe/Multitarea).
  • Dimensiones: vectores densos de 1024-dim.
  • Inferencia: Microservicio local optimizado para ejecución híbrida CPU/GPU.
  • Estrategia: Fragmentación (chunking) con solapamiento y detección de límites semánticos.

Módulo: Storage

pgvector y Contexto Relacional


CREATE TABLE knowledge_chunks (
  id uuid PRIMARY KEY,
  document_hash char(64) REFERENCES sources(hash),
  embedding vector(1024),
  metadata jsonb,
  tenant_id uuid NOT NULL
);
                    

Indexación IVFFlat para una latencia de recuperación P99 <200ms.

Módulo: AuthN/AuthZ

Aislamiento Estricto Multi-tenant

Aprovechamos Supabase RLS (Seguridad a Nivel de Fila) para un aislamiento de grado criptográfico entre entornos de inquilinos (tenants).


CREATE POLICY "tenant_isolation" ON knowledge_chunks
FOR ALL USING (tenant_id = auth.uid());
                    

Arquitectura Zero-trust que garantiza la prevención de fugas de datos.

Benchmarks de Rendimiento

<140ms

Recuperación de Contexto RAG

100%

Verificabilidad de Trazas de Auditoría

99.9%

Tiempo de Actividad del Sistema

Cero

Normas No Mapeadas