Brazo APRENDER · Mejora Continua

El sistema que aprende

Observa, analiza, detecta patrones y mejora automáticamente. Cada noche, mientras el sistema duerme, el brazo APRENDER convierte la experiencia del día en conocimiento estructurado.

Manual · Nocturno · 5 fases · Validación automática · Control humano siempre

Producción · V7.54

No es machine learning

Es curación inteligente. El sistema propone mejoras, las valida con tests automáticos sobre consultas reales y solo despliega lo que demuestra funcionar mejor que el comportamiento anterior. La IA propone. El humano decide.

2
Modos de aprendizaje
5
Fases ciclo nocturno
3AM
Hora del cron
100%
Reversible y auditable
01 · Modos

Dos formas de aprender

El aprendizaje manual es inmediato y dirigido por el usuario. El nocturno es autónomo y sistémico. Ambos pasan por validación antes de desplegarse.

Aprendizaje Manual
Inmediato · dirigido por usuario

El usuario le pide explícitamente al sistema que aprenda de interacciones específicas: "Quiero que aprendas cómo resolvimos estas tareas".

El brazo APRENDER revisa la conversación, compara respuestas, genera reglas y actualiza dominios y vistas según el feedback. El resultado es visible de inmediato en el siguiente turno.

Revisión de conversación
Analiza el hilo completo buscando patrones exitosos y correcciones.
Generación de reglas
Crea reglas concretas a partir de los patrones detectados.
Validación inmediata
Testea las reglas contra consultas históricas antes de activarlas.
Aprendizaje Nocturno
Autónomo · 3AM · sistemático

Cada noche, el sistema ejecuta un ciclo completo de auto-mejora orgánica. Analiza los registros del día completo, detecta patrones y genera propuestas de mejora sin intervención humana.

Consulta al LLM Central, utiliza todos los brazos internos disponibles, valida cada mejora con tests y solo despliega lo que funciona. El sistema amanece más inteligente que la noche anterior.

Activación programada
Cron a las 3:00 AM · Sin bloquear el sistema · Logs completos disponibles al despertar
02 · Ciclo nocturno

5 fases de mejora automática

Desde el análisis de logs hasta el despliegue selectivo. Solo las mejoras que superan la validación automática llegan a producción.

01
Análisis de logs
Revisa todas las interacciones del día. Identifica búsquedas que devolvieron pocos resultados o resultados irrelevantes, patrones de corrección del usuario y secuencias que terminaron sin resolución.
Fuente: logs completos del día · comparativa con baseline
02
Consulta al LLM Central
Para cada caso problemático identificado, pregunta al modelo central cómo podría mejorarse: nuevo dominio, ajuste de prioridad, vocabulario expandido, nueva vista o regla de enrutamiento.
Modelo: LLM Central · contexto: caso + historial · output: propuesta estructurada
03
Generación de propuestas
Crea modificaciones concretas en la base de datos: nuevos dominios, nuevas vistas, ajustes en el sistema de búsqueda, actualización de pesos. Cada propuesta incluye un diff explícito y su justificación.
Output: diff + motivo + métrica esperada · versionado automático
04
Validación automática
Ejecuta tests con consultas reales del historial. Si la mejora habría dado mejores resultados en casos anteriores, se aprueba. Si no mejora el baseline, se descarta automáticamente.
Tests: consultas históricas reales · umbral: mejora >5% sobre baseline
05
Despliegue selectivo
Solo se activan las mejoras que pasan validación. El resto se descarta silenciosamente o se marca para revisión humana si el score es borderline. Todo queda en el log de auditoría del cron.
Criterio: validación ✓ + sin conflictos · fallback: rollback automático

Principio de conservación: El ciclo nocturno nunca degrada el comportamiento existente. Si una propuesta no supera el baseline con margen positivo, se descarta. El sistema puede mejorar noche a noche, pero nunca puede empeorar por el cron.

03 · Control humano

La IA propone. Tú decides.

Todo aprendizaje pasa por un sistema de confirmaciones progresivas. El nivel de autonomía se gana con demostración consistente, no se asume desde el principio.

Sistema de confirmaciones progresivas
3 confirmaciones
El sistema sugiere, no ejecuta
Propone la mejora al usuario con explicación y espera aprobación explícita antes de aplicar cualquier cambio.
6 confirmaciones
Puede automatizar con supervisión
El patrón ha demostrado fiabilidad. El sistema puede aplicarlo automáticamente, pero notifica al usuario y mantiene rollback disponible.
Cualquier patrón
Desactivable con un comando SQL
Todo patrón aprendido puede desactivarse o revertirse en cualquier momento. El sistema es completamente transparente y reversible.
Nunca degrada

Ninguna mejora desplegada puede hacer que el sistema responda peor que antes. El baseline es el piso mínimo garantizado.

Todo auditable

Cada mejora aplicada queda registrada: qué cambió, cuándo, por qué y qué resultado tuvo. Log de auditoría completo disponible.

Todo reversible

Cualquier cambio aplicado por el cron puede revertirse con un comando. El estado anterior siempre está disponible como fallback.

Filosofía de diseño: El brazo APRENDER no tiene autonomía ciega. Cada propuesta es explícita, cada despliegue es trazable y cada patrón es reversible. La confianza en el sistema se gana ciclo a ciclo, no se presupone.

04 · Qué aprende

Cuatro dominios de conocimiento

El brazo APRENDER no aprende cualquier cosa — aprende donde el sistema tiene evidencia suficiente para validar que la mejora es real y estable.

Búsqueda semántica

Ajusta pesos, añade vocabulario y crea nuevas vistas para consultas que históricamente devuelven resultados pobres.

Enrutamiento

Mejora las reglas del Q4K para que la clasificación de consultas sea más precisa y el modelo asignado sea siempre el óptimo.

Dominios de contexto

Crea y amplía dominios temáticos que enriquecen el contexto del LLM con la información más relevante para cada tipo de tarea.

Patrones de usuario

Detecta secuencias de trabajo habituales, preferencias de formato y ritmos de uso para anticipar necesidades recurrentes.

Manual · Nocturno · Validado · Reversible

Mejora continua
sin intervención

El brazo APRENDER convierte cada día de uso en experiencia acumulada. El sistema aprende de sus aciertos y errores, mejorando automáticamente noche tras noche.