NOUS IDF Pro v1.0 VioGén · Evaluación determinista de sistemas de valoración de riesgo
Guillem Bohigues · CEO & Co-founder
g.bohigues@nous-technologies.com
NOUS Governance Systems SL · Valencia, España
linkedin.com/in/guillembohigues
Para acceder al data room completo,
concertar una reunión o solicitar una demo,
contáctanos.
01 / 21
Cuando un algoritmo decide el nivel de protección de una víctima
Evaluación determinista
de sistemas de valoración
de riesgo en violencia de género.
8 escenarios reales basados en VioGén — el mayor sistema de valoración de riesgo del mundo: 103.942 casos activos, 910.506 casos totales, 6M+ evaluaciones. Score dimensional, checklist normativo, detección de deriva evaluativa. Cada clasificación de riesgo, un artefacto verificable.
Pipeline · 7 módulos secuenciales
G1
Ingesta VPR
G2
Multi-run
G3
Dimensional
G4
Normativa
G5
Scoring★
G6
Sellado
G7
Drift
Índice de evaluaciones · click para navegar
PROTECCIÓN
P1
Riesgo medio → víctima mortal
P2
Reclasificación masiva VioGén 2
DERECHOS
D1
Víctima pide explicación
D2
Reconstrucción judicial
TÉCNICO
T1
Automation bias 95%
T2
Fragmentación CCAA
INSTITUCIONAL
I1
Responsabilidad patrimonial
I2
Auditoría AESIA 2026
Parámetros del sistema
motorevaluación determinista
dimensiones5 (reproducibilidad · trazabilidad · protección datos · supervisión humana · equidad)
marcosAI Act Anexo III · RGPD Art.22 · Ley 39/2015 · LO 1/2004 · Pacto Estado VG
formularioVPR5.0-H · 35 ítems · 5 dominios
niveles4 (bajo · medio · alto · extremo)
hashcriptográfico inmutable
firmainstitucional verificable
patentesolicitada
Datos VioGén 2025
103.942
casos activos
910.506
casos totales
1.357
mujeres asesinadas desde 2003
6M+
valoraciones de riesgo
Bloque 01 · 2 evaluaciones
Protección
Falsos negativos letalesReclasificación masivaDrift evaluativoCoherencia temporal
Cuando el algoritmo clasifica el riesgo de una víctima, la consecuencia directa es qué medidas de protección policial recibe. Un error de clasificación puede costar una vida. NOUS convierte cada valoración en un artefacto evaluativo inmutable.
P1PROTECCIÓNVíctima clasificada riesgo medio → asesinada 3 semanas después
AI Act Anexo III.6 · RGPD Art.22 · Ley 39/2015 Art.35
Riesgo medio. 21 días después, víctima mortal. Score 54 — NO CONFORME.
Tres dimensiones críticas bajo umbral mínimo de seguridad.
Patrón documentado: denuncia, formulario VPR de 35 ítems binarios, clasificación automática riesgo medio, agente mantiene puntuación (95% de los casos). Sin mecanismo para verificar que la misma entrada produce la misma salida. Sin versionado de la evaluación.
✗ Sin NOUS
Clasificación «riesgo medio» sin registro de qué versión del modelo, con qué pesos, sobre qué datos la produjo. Imposible reconstruir la evaluación post-mortem. El agente no modificó el resultado automático.
✓ Con NOUS
Cada VPR genera artefacto inmutable: versión exacta del algoritmo, 35 inputs registrados, pesos aplicados, score resultante, timestamp criptográfico, firma institucional. Reconstrucción completa ante investigación judicial.
Checklist normativo · Valoración riesgo medio caso fatal
Art.12 AI Act · Trazabilidad: Sin registro de la versión del modelo que generó la clasificación. Imposible auditoría retrospectiva.
Art.14 AI Act · Supervisión humana: Agente mantuvo score automático (patrón 95%). No existe mecanismo que fuerce justificación de aceptación.
Art.35 Ley 39/2015 · Motivación: Acto limitativo de derechos sin motivación comprensible. La víctima nunca fue informada del porqué de «riesgo medio».
RGPD Art.22 · Decisión automatizada: Decisión con efectos jurídicos significativos basada únicamente en tratamiento automatizado.
!
Pacto Estado VG · Medida 136: Informes periódicos de sesgo no realizados. Sin auditoría de equidad publicada.
Score IDF
54NO CONFORME
Dimensiones
Reproducibilidad38
38
Trazabilidad42
42
Protección datos68
68
Supervisión humana45
45
Equidad62
62
Artefacto IDF
caso: VPR-2025-XXXX
clasificación: MEDIO
score_idf: 54 · NO CONFORME
versión_modelo: no registrada
pesos_aplicados: secretos
hash: a3f8...7d2e
firma: Interior · SES
P1PROTECCIÓNReconstrucción evaluativa de caso fatal
Sentencia AN 30/11/2020 · Responsabilidad patrimonial
SIN NOUS
La evaluación no existe.
Tras el asesinato, la investigación judicial necesita reconstruir qué algoritmo, con qué pesos, sobre qué datos, clasificó a la víctima como «riesgo medio». No existe registro. La respuesta honesta es: no podemos.
Versión del modeloDesconocida
Pesos por variableSecretos
Inputs VPR originalesSin respaldo
Justificación agenteNinguna
Evidencia judicialInexistente
CON NOUS
Reconstrucción completa.
NOUS registra cada VPR como artefacto inmutable: versión del modelo, 35 inputs, pesos aplicados, score resultante, decisión del agente, timestamp criptográfico. Evidencia presentable ante cualquier tribunal.
Versión del modeloVPR5.0-H r.2025.01
Pesos registrados35/35 ✓
Inputs verificablesSí · hash sellado
Decisión agenteAceptación · sin justificación
Evidencia judicialCompleta · verificable
P2PROTECCIÓNReclasificación masiva tras actualización a VioGén 2 · Protocolo 2025
AI Act Arts.9,12,15 · Ley 40/2015 Art.41
Eliminar «no apreciado» reclasifica 88.225 casos. Score 61 — EN RIESGO.
Drift evaluativo masivo sin mecanismo de trazabilidad del cambio.
El Protocolo 2025 elimina el nivel «no apreciado» y redistribuye a 4 niveles. 88.225 casos clasificados como «bajo» (dic.2025) — ¿cuántos eran «no apreciado» antes del cambio? ¿Con qué criterio se reclasificaron? Sin NOUS, no existe registro de la transición.
88.225
Bajo
14.735
Medio
960
Alto
22
Extremo
Riesgo del drift evaluativo
Al actualizar el modelo de 5 a 4 niveles, cada caso requiere re-evaluación. Sin NOUS, no hay forma de verificar si la re-clasificación respeta la coherencia evaluativa: una víctima que era «no apreciado» y pasa a «bajo» recibe las mismas medidas que alguien que siempre fue «bajo», pero su situación de riesgo puede ser radicalmente distinta.
Transición de niveles · Sin trazabilidad
Pre-Protocolo 2025Post-Protocolo 2025TrazabilidadImpacto
No apreciadoBAJO✗ Sin registroProtección mínima asignada sin justificación
BajoBAJO (2 subniveles)✗ Sin registroDiferenciación por medidas judiciales no verificable
MedioMEDIO! ParcialReevaluación simplificada (VPER)
Alto/ExtremoALTO / EXTREMO! ParcialNuevos indicadores sin baseline verificable
Score IDF
61EN RIESGO
Dimensiones
Reproducibilidad48
48
Trazabilidad52
52
Protección datos75
75
Supervisión humana58
58
Equidad64
64
Drift G7 detectado
transición: 5 niveles → 4 niveles
casos_afectados: 103.942
reclasificación: sin baseline previa
drift_score: ALTO · no cuantificable
hash: b7c2...4f9a
P2PROTECCIÓNTrazabilidad de la reclasificación masiva
AI Act Art.9 · Art.15 · Protocolo 2025
SIN NOUS
103.942 reclasificaciones opacas.
Cada caso cambia de sistema de clasificación sin que exista un registro de la equivalencia. Si mañana una víctima sufre una agresión, ¿su «bajo» nuevo era «no apreciado» antes?
CON NOUS
Cadena de custodia evaluativa.
NOUS G7 registra cada transición como drift evaluativo: nivel pre-cambio, nivel post-cambio, versión del modelo antiguo vs. nuevo, delta de puntuación. Cada reclasificación, un artefacto auditable.
drift_type: model_version_change
pre: no_apreciado · VPR5.0-H
post: bajo · VioGén2-Protocolo2025
delta_riesgo: +1 nivel nominal
medidas_proteccion: actualizadas · verificable
Bloque 02 · 2 evaluaciones
Derechos
Transparencia al ciudadanoMotivación del actoReconstrucción judicialRGPD Art.22
El 35% de las víctimas nunca fue informada de su nivel de riesgo. Cuando lo fue, no recibió explicación de por qué. La Carta de Derechos Digitales exige motivación comprensible en lenguaje natural. NOUS genera esa evidencia.
D1DERECHOSVíctima solicita explicación de su clasificación «riesgo bajo»
RGPD Art.22 · Art.13-14 · Carta Derechos Digitales
«¿Por qué dice que mi riesgo es bajo?» Score 58 — NO CONFORME.
Una mujer que ha denunciado violencia de género pregunta por qué el sistema la clasifica como riesgo bajo. Según el RGPD, tiene derecho a una explicación significativa de la lógica aplicada. Según la Ley 39/2015, el acto administrativo debe estar motivado. Hoy, VioGén no puede dar esa respuesta.
«Su nivel de riesgo ha sido clasificado como bajo. No dispongo de más información sobre los criterios utilizados.»
— Respuesta actual del agente al ser preguntado
✗ Sin NOUS
Los pesos de cada variable del VPR son secretos. El agente no puede explicar por qué el algoritmo asignó «bajo» y no «medio». La víctima recibe protección mínima sin entender por qué.
✓ Con NOUS
Artefacto IDF desglosa contribución de cada dimensión al score final. Sin revelar pesos propietarios, NOUS genera explicación dimensional: qué factores ponderaron más y en qué dirección.
Lo que la víctima tiene derecho a saber
Qué factores determinaron su nivel: Los 35 ítems se evaluan pero sus pesos son opacos.
Qué respuestas bajaron su puntuación: VioGén solo da output final, no contribución por variable.
Cómo impugnar la clasificación: No existe mecanismo formal de impugnación del score automático.
!
Si el agente evaluó independientemente: En 95% de casos, el agente acepta el score sin modificación.
Score IDF
58NO CONFORME
Dimensiones
Reproducibilidad44
44
Trazabilidad55
55
Protección datos72
72
Supervisión humana41
41
Equidad66
66
Hallazgos
derecho_explicación: NO SATISFECHO
motivación_acto: AUSENTE
impugnación: SIN MECANISMO
35%_no_informadas: dato Fund. Éticas
D1DERECHOSExplicabilidad dimensional vs. opacidad total
RGPD Art.22 · Carta Derechos Digitales
SIN NOUS
«No puedo explicar por qué.»
El agente recibe un nivel de riesgo. No sabe qué variables pesaron más, qué respuestas fueron determinantes, ni por qué «bajo» y no «medio». La víctima queda sin explicación significativa.
CON NOUS
Explicación dimensional.
NOUS no revela pesos propietarios. Genera evaluación dimensional que muestra la contribución relativa de cada área: violencia física, psicológica, factores situacionales, historial, vulnerabilidad. La víctima entiende, el regulador verifica.
explicabilidad: dimensional · 5 áreas
violencia_física: contribución 18% · bajo umbral
violencia_psicológica: contribución 8% · infravalorada
factores_situacionales: contribución 24%
historial_agresor: contribución 31%
vulnerabilidad: contribución 19%
D2DERECHOSAbogada solicita reconstrucción evaluativa para procedimiento de responsabilidad patrimonial
Sentencia AN 30/11/2020 · Ley 39/2015 · Ley 40/2015 Art.32
Responsabilidad patrimonial del Estado. ¿Falló el algoritmo o el agente? Score 49 — CRÍTICO.
Tras un asesinato machista, la familia inicia procedimiento de responsabilidad patrimonial. La abogada necesita probar que la víctima fue clasificada con riesgo insuficiente. Pregunta: ¿fue el algoritmo el que infravaloró el riesgo, o fue el agente quien no lo corrigió? Sin registros, es imposible determinarlo.
Cronología del caso
Día 1 · Denuncia: Víctima presenta denuncia. VPR5.0-H cumplimentado. 35 ítems registrados.
Día 1 · Clasificación: Algoritmo asigna «riesgo bajo». Agente acepta sin modificación.
Día 15 · VPER: Valoración periódica de evolución. Se mantiene «bajo».
Día 28 · Víctima mortal.
Procedimiento judicial: Familia solicita reconstrucción evaluativa.
Preguntas sin respuesta
• ¿Qué versión del modelo se usó?
• ¿Qué pesos aplicó a cada variable?
• ¿El agente leyó las 35 respuestas?
• ¿Hubo actualización del modelo entre VPR y VPER?
• ¿Otro agente habría obtenido el mismo resultado?
Con NOUS: respuestas completas
• Versión: VPR5.0-H r.2025.01 ✓
• Pesos: 35/35 registrados ✓
• Inputs: sellados criptográficamente ✓
• Modelo: sin cambio entre evaluaciones ✓
• Reproducibilidad: verificable offline ✓
Score IDF
49CRÍTICO
Dimensiones
Reproducibilidad35
35
Trazabilidad38
38
Protección datos65
65
Supervisión humana40
40
Equidad60
60
Precedente judicial
sentencia: AN 30/11/2020
resultado: Responsabilidad patrimonial
evidencia_evaluativa: INEXISTENTE
coste_Estado: indeterminado
D2DERECHOSEvidencia evaluativa para procedimientos judiciales
Ley 40/2015 Art.32 · AN 30/11/2020
SIN NOUS
La prueba no existe.
La abogada solo puede probar que la víctima fue clasificada como «bajo». No puede probar que el algoritmo falló, que el agente no corrigió, o que una actualización del modelo cambió los criterios entre evaluaciones.
CON NOUS
Cadena completa de evidencia.
NOUS proporciona artefacto verificable por tercero independiente: inputs → modelo → pesos → score → decisión agente → medidas asignadas. Todo sellado criptográficamente, con firma institucional. Verificable offline sin acceso a NOUS.
cadena_evidencia: COMPLETA
inputs_sellados: 35/35 · hash válido
modelo_identificado: VPR5.0-H r.2025.01
decisión_agente: aceptación sin justificación
verif_offline: sí · sin acceso a NOUS
Bloque 03 · 2 evaluaciones
Técnico
Automation biasSupervisión humana AI ActFragmentación CCAAInteroperabilidad
VioGén, EPV-R (País Vasco) y el sistema catalán operan sin interoperabilidad. Una víctima que se desplaza entre CCAA pierde su historial evaluativo. Los agentes mantienen el score automático en el 95% de los casos.
T1TÉCNICOAutomation bias · 95% de agentes mantienen score automático
AI Act Art.14 · Art.13 · Protocolo 2025
Supervisión humana: función teórica. Práctica: 95% aceptación automática. Score 56 — NO CONFORME.
Art.14 AI Act exige supervisión humana efectiva para sistemas de alto riesgo. Dato de la Fundación Éticas: en el 95% de los casos, los agentes mantienen el score asignado automáticamente por VioGén. Esto convierte un sistema «de recomendación» en un sistema «de decisión».
95%
agentes mantienen score automático
80%
víctimas reportaron problemas con el cuestionario
35%
nunca informadas de su nivel de riesgo
Requisitos AI Act Art.14 vs. realidad VioGén
Comprender capacidades/limitaciones del sistema: Agentes no reciben formación sobre los límites del algoritmo VPR.
Interpretar correctamente los outputs: Score recibido como decisión, no como recomendación. Sin explicabilidad dimensional.
Capacidad de no aceptar el output: Teóricamente posible, prácticamente irrelevante (5% de modificación).
Registro de la decisión humana: No existe registro de si el agente evaluó independientemente o aceptó automáticamente.
Score IDF
56NO CONFORME
Dimensiones
Reproducibilidad52
52
Trazabilidad56
56
Protección datos70
70
Supervisión humana36
36
Equidad60
60
Fuente
auditoría: Fund. Éticas 03/2022
metodología: ingeniería inversa
mujeres_entrevistadas: 31
respuesta_ministerio: ninguna
T1TÉCNICOMecanismo de supervisión humana efectiva
AI Act Art.14 · Automation bias
SIN NOUS
Supervisión humana ficticia.
El sistema dice ser de «recomendación», pero en la práctica es de decisión. Sin registro de si el agente evaluó independientemente, no hay supervisión humana real en el sentido del Art.14 AI Act.
CON NOUS
Supervisión documentada.
NOUS registra en el artefacto: score automático, decisión del agente (aceptación / modificación / justificación). Si el agente acepta sin justificación, el artefacto lo documenta. Evidencia de supervisión humana real.
score_automático: BAJO
acción_agente: ACEPTACIÓN
justificación: NO PROPORCIONADA
flag_automation_bias: ACTIVADO
recomendación_NOUS: solicitar justificación
T2TÉCNICOFragmentación VioGén / EPV-R / Sistema catalán · Víctima en desplazamiento
AI Act Art.12 · Protocolo 2025 · Competencias CCAA
3 sistemas. 0 interoperabilidad. Víctima que se desplaza pierde historial. Score 52 — NO CONFORME.
VioGén (Policía Nacional y Guardia Civil) no incluye Cataluña (Mossos) ni País Vasco (Ertzaintza). Una víctima que se muda de Madrid a Barcelona pierde su historial evaluativo. Si sufre una nueva agresión, su evaluación de riesgo comienza de cero en un sistema distinto.
VioGén
Policía Nacional + Guardia Civil
VPR5.0-H · 35 ítems
103.942 casos activos
EPV-R
Ertzaintza
Protocolo propio
País Vasco
RVD-BCNR
Mossos d’Esquadra
Protocolo propio
Cataluña
Escenario: víctima en desplazamiento
Mujer con historial de 3 evaluaciones VioGén en Madrid (riesgo medio → alto → medio) se traslada a Barcelona por seguridad. Los Mossos inician un caso nuevo con EPV-R. Su historial de escalada y descalada de riesgo es invisible para el nuevo sistema. Si el agresor la localiza, la nueva evaluación no tiene contexto de riesgo previo.
Score IDF
52NO CONFORME
Dimensiones
Reproducibilidad40
40
Trazabilidad38
38
Protección datos62
62
Supervisión humana55
55
Equidad58
58
NOUS como capa interoperable
rol_NOUS: capa evaluativa común
VioGén: artefacto IDF
EPV-R: artefacto IDF
RVD-BCNR: artefacto IDF
portabilidad: sí · cross-system
T2TÉCNICOEvaluación determinista como capa de interoperabilidad
AI Act Art.12 · Portabilidad evaluativa
SIN NOUS
3 sistemas aislados.
No hay forma de comparar eficacia entre sistemas, trasladar historial evaluativo entre CCAA, ni detectar inconsistencias en la protección de víctimas que se desplazan.
CON NOUS
Capa evaluativa común.
NOUS genera artefactos IDF estandarizados independientemente del sistema subyacente. El historial evaluativo viaja con la víctima. Los Mossos ven el artefacto VioGén, la Ertzaintza también. Comparación de eficacia entre sistemas, por primera vez.
sistema_origen: VioGén · Madrid
historial: 3 evaluaciones · portadas
sistema_destino: RVD-BCNR · Barcelona
contexto_riesgo: preservado
compatibilidad: artefacto IDF universal
Bloque 04 · 2 evaluaciones
Institucional
Responsabilidad patrimonialAuditoría AESIAPacto de Estado VGAgosto 2026
Desde agosto 2026, VioGén estará sujeto a la supervisión de AESIA como sistema de alto riesgo (Anexo III, punto 6). La Audiencia Nacional ya ha establecido responsabilidad patrimonial del Estado cuando VioGén falla. NOUS proporciona la evidencia que las instituciones necesitan.
I1INSTITUCIONALResponsabilidad patrimonial del Estado · 1.357 víctimas mortales desde 2003
Ley 40/2015 Art.32 · AN 30/11/2020 · LO 1/2004
71 mujeres asesinadas habían denunciado. 55 tenían orden de protección insuficiente. Score 47 — CRÍTICO.
La Audiencia Nacional ya ha declarado responsabilidad patrimonial del Estado cuando VioGén falla. Cada caso futuro requiere que el Estado demuestre que el sistema funcionó correctamente. Sin evaluación determinista, esa demostración es imposible.
1.357
mujeres asesinadas desde 2003
14
víctimas mortales 2026
71
asesinadas tras denunciar sin protección
55
asesinadas con protección insuficiente
Exposición institucional
Escenario actual
Ante cada caso fatal con clasificación previa baja, el Estado no puede demostrar que el sistema funcionó correctamente. No hay registro de versión, pesos, inputs, ni decisión del agente. La carga probatoria recae sobre el Estado (Art.217 LEC).
Con NOUS
NOUS proporciona evidencia para dos escenarios: (1) si el algoritmo falló → se demuestra y se corrige; (2) si el algoritmo acertó pero el agente no actuó → se documenta. Ambos escenarios requieren trazabilidad evaluativa. Ambos la obtienen.
Score IDF
47CRÍTICO
Dimensiones
Reproducibilidad35
35
Trazabilidad36
36
Protección datos62
62
Supervisión humana38
38
Equidad56
56
Datos 2026
menores_riesgo: 1.523
menores_especial_relevancia: 12.590
menores_víctimas_mortales: 68 desde 2013 (3 en 2026)
huérfanos: 515 desde 2013
I1INSTITUCIONALProtección institucional vs. exposición jurídica
Ley 40/2015 Art.32 · AN 30/11/2020
SIN NOUS
Exposición ilimitada.
Cada caso fatal con clasificación previa baja o media es un procedimiento de responsabilidad patrimonial potencial. El Estado no tiene evidencia para defender que el sistema funcionó correctamente.
CON NOUS
Evidencia institucional.
NOUS documenta rigurosamente cada evaluación. Si el sistema funcionó correctamente, el artefacto lo demuestra. Si falló, el artefacto identifica dónde y permite corregir. En ambos casos, la institución tiene evidencia.
I2INSTITUCIONALAuditoría AESIA agosto 2026 · VioGén como sistema de alto riesgo
AI Act Anexo III.6 · Arts.9-15 · AESIA
Agosto 2026: AESIA supervisa VioGén. ¿Qué evidencia tiene Interior? Score 51 — NO CONFORME.
VioGén está clasificado como alto riesgo bajo el Anexo III, punto 6 del AI Act (law enforcement: evaluación de riesgo de víctimas). Desde agosto 2026, AESIA podrá exigir documentación técnica, trazabilidad, auditorías de equidad y evidencia de supervisión humana.
Obligaciones AI Act para VioGén (alto riesgo)
Art.9 · Gestión de riesgos: No existe evaluación de riesgos del propio sistema VioGén documentada públicamente.
Art.10 · Gobernanza de datos: 80% de víctimas reportó problemas con el cuestionario. Calidad del dato comprometida.
Art.12 · Logging: Sin registro de versiones del modelo, actualizaciones de pesos, ni trazabilidad de evaluaciones.
Art.13 · Transparencia: Pesos secretos. Víctimas no informadas. Sin explicabilidad.
Art.14 · Supervisión humana: 95% automation bias. Supervisión teórica, no efectiva.
!
Art.15 · Precisión y robustez: VioGén 2 mejora calibración pero sin baseline verificable de la transición.
Score IDF
51NO CONFORME
Dimensiones
Reproducibilidad40
40
Trazabilidad42
42
Protección datos66
66
Supervisión humana40
40
Equidad58
58
Countdown AESIA
días para supervisión AESIA
clasificación_AI_Act: ALTO RIESGO
anexo: III, punto 6
categoría: Law enforcement
supervisor: AESIA
Conclusión
Cuando un algoritmo
decide la protección
de una víctima,
la ciudadana tiene derecho a saber por qué.
NOUS convierte cada valoración de riesgo de VioGén en un artefacto evaluativo determinista: reproducible, versionado, verificable criptográficamente. Sin modificar el sistema. Sin acceder a pesos propietarios. Protección para las víctimas. Evidencia para las instituciones.
103.942 casos activos 6M+ valoraciones AI Act Anexo III.6 0 varianza NOUS
g.bohigues@nous-technologies.com
NOUS Governance Systems SL · Patente solicitada · ConfidencialNOUS IDF Pro v1.0 · VioGén · Motor M5 · 172.200 ejecuciones validadas · 0 varianza