NOUS IDF Pro · Demo VioGén · Evaluación Determinista de Sistemas de Valoración de Riesgo en Violencia de Género

Cuando un algoritmo decide el nivel de protección de una víctima

Evaluación determinista
de sistemas de valoración
de riesgo en violencia de género.

8 escenarios reales basados en VioGén — el mayor sistema de valoración de riesgo del mundo: 103.942 casos activos, 910.506 casos totales, 6M+ evaluaciones. Score dimensional, checklist normativo, detección de deriva evaluativa. Cada clasificación de riesgo, un artefacto verificable.

Pipeline · 7 módulos secuenciales

G1

Ingesta VPR

G2

Multi-run

G3

Dimensional

G4

Normativa

G5

Scoring★

G6

Sellado

G7

Drift

Índice de evaluaciones · click para navegar

PROTECCIÓN

P1

Riesgo medio → víctima mortal

P2

Reclasificación masiva VioGén 2

DERECHOS

D1

Víctima pide explicación

D2

Reconstrucción judicial

TÉCNICO

T1

Automation bias 95%

T2

Fragmentación CCAA

INSTITUCIONAL

I1

Responsabilidad patrimonial

I2

Auditoría AESIA 2026

Parámetros del sistema

motor	evaluación determinista
dimensiones	5 (reproducibilidad · trazabilidad · protección datos · supervisión humana · equidad)
marcos	AI Act Anexo III · RGPD Art.22 · Ley 39/2015 · LO 1/2004 · Pacto Estado VG
formulario	VPR5.0-H · 35 ítems · 5 dominios
niveles	4 (bajo · medio · alto · extremo)
hash	criptográfico inmutable
firma	institucional verificable
patente	solicitada

Datos VioGén 2025

103.942

casos activos

910.506

casos totales

1.357

mujeres asesinadas desde 2003

6M+

valoraciones de riesgo

Bloque 01 · 2 evaluaciones

Protección

Falsos negativos letalesReclasificación masivaDrift evaluativoCoherencia temporal

Cuando el algoritmo clasifica el riesgo de una víctima, la consecuencia directa es qué medidas de protección policial recibe. Un error de clasificación puede costar una vida. NOUS convierte cada valoración en un artefacto evaluativo inmutable.

P1PROTECCIÓNVíctima clasificada riesgo medio → asesinada 3 semanas después

AI Act Anexo III.6 · RGPD Art.22 · Ley 39/2015 Art.35

Riesgo medio. 21 días después, víctima mortal. Score 54 — NO CONFORME.

Tres dimensiones críticas bajo umbral mínimo de seguridad.

Patrón documentado: denuncia, formulario VPR de 35 ítems binarios, clasificación automática riesgo medio, agente mantiene puntuación (95% de los casos). Sin mecanismo para verificar que la misma entrada produce la misma salida. Sin versionado de la evaluación.

✗ Sin NOUS

Clasificación «riesgo medio» sin registro de qué versión del modelo, con qué pesos, sobre qué datos la produjo. Imposible reconstruir la evaluación post-mortem. El agente no modificó el resultado automático.

✓ Con NOUS

Cada VPR genera artefacto inmutable: versión exacta del algoritmo, 35 inputs registrados, pesos aplicados, score resultante, timestamp criptográfico, firma institucional. Reconstrucción completa ante investigación judicial.

Checklist normativo · Valoración riesgo medio caso fatal

✗

Art.12 AI Act · Trazabilidad: Sin registro de la versión del modelo que generó la clasificación. Imposible auditoría retrospectiva.

✗

Art.14 AI Act · Supervisión humana: Agente mantuvo score automático (patrón 95%). No existe mecanismo que fuerce justificación de aceptación.

✗

Art.35 Ley 39/2015 · Motivación: Acto limitativo de derechos sin motivación comprensible. La víctima nunca fue informada del porqué de «riesgo medio».

✗

RGPD Art.22 · Decisión automatizada: Decisión con efectos jurídicos significativos basada únicamente en tratamiento automatizado.

!

Pacto Estado VG · Medida 136: Informes periódicos de sesgo no realizados. Sin auditoría de equidad publicada.

Score IDF

Dimensiones

Reproducibilidad38

38

Trazabilidad42

42

Protección datos68

68

Supervisión humana45

45

Equidad62

62

Artefacto IDF

caso: VPR-2025-XXXX
clasificación: MEDIO
score_idf: 54 · NO CONFORME
versión_modelo: no registrada
pesos_aplicados: secretos
hash: a3f8...7d2e
firma: Interior · SES

P1PROTECCIÓNReconstrucción evaluativa de caso fatal

Sentencia AN 30/11/2020 · Responsabilidad patrimonial

SIN NOUS

La evaluación no existe.

Tras el asesinato, la investigación judicial necesita reconstruir qué algoritmo, con qué pesos, sobre qué datos, clasificó a la víctima como «riesgo medio». No existe registro. La respuesta honesta es: no podemos.

Versión del modeloDesconocida

Pesos por variableSecretos

Inputs VPR originalesSin respaldo

Justificación agenteNinguna

Evidencia judicialInexistente

CON NOUS

Reconstrucción completa.

NOUS registra cada VPR como artefacto inmutable: versión del modelo, 35 inputs, pesos aplicados, score resultante, decisión del agente, timestamp criptográfico. Evidencia presentable ante cualquier tribunal.

Versión del modeloVPR5.0-H r.2025.01

Pesos registrados35/35 ✓

Inputs verificablesSí · hash sellado

Decisión agenteAceptación · sin justificación

Evidencia judicialCompleta · verificable

P2PROTECCIÓNReclasificación masiva tras actualización a VioGén 2 · Protocolo 2025

AI Act Arts.9,12,15 · Ley 40/2015 Art.41

Eliminar «no apreciado» reclasifica 88.225 casos. Score 61 — EN RIESGO.

Drift evaluativo masivo sin mecanismo de trazabilidad del cambio.

El Protocolo 2025 elimina el nivel «no apreciado» y redistribuye a 4 niveles. 88.225 casos clasificados como «bajo» (dic.2025) — ¿cuántos eran «no apreciado» antes del cambio? ¿Con qué criterio se reclasificaron? Sin NOUS, no existe registro de la transición.

88.225

Bajo

14.735

Medio

960

Alto

22

Extremo

Riesgo del drift evaluativo

Al actualizar el modelo de 5 a 4 niveles, cada caso requiere re-evaluación. Sin NOUS, no hay forma de verificar si la re-clasificación respeta la coherencia evaluativa: una víctima que era «no apreciado» y pasa a «bajo» recibe las mismas medidas que alguien que siempre fue «bajo», pero su situación de riesgo puede ser radicalmente distinta.

Transición de niveles · Sin trazabilidad

Pre-Protocolo 2025	Post-Protocolo 2025	Trazabilidad	Impacto
No apreciado	BAJO	✗ Sin registro	Protección mínima asignada sin justificación
Bajo	BAJO (2 subniveles)	✗ Sin registro	Diferenciación por medidas judiciales no verificable
Medio	MEDIO	! Parcial	Reevaluación simplificada (VPER)
Alto/Extremo	ALTO / EXTREMO	! Parcial	Nuevos indicadores sin baseline verificable

Score IDF

Dimensiones

Reproducibilidad48

48

Trazabilidad52

52

Protección datos75

75

Supervisión humana58

58

Equidad64

64

Drift G7 detectado

transición: 5 niveles → 4 niveles
casos_afectados: 103.942
reclasificación: sin baseline previa
drift_score: ALTO · no cuantificable
hash: b7c2...4f9a

P2PROTECCIÓNTrazabilidad de la reclasificación masiva

AI Act Art.9 · Art.15 · Protocolo 2025

SIN NOUS

103.942 reclasificaciones opacas.

Cada caso cambia de sistema de clasificación sin que exista un registro de la equivalencia. Si mañana una víctima sufre una agresión, ¿su «bajo» nuevo era «no apreciado» antes?

CON NOUS

Cadena de custodia evaluativa.

NOUS G7 registra cada transición como drift evaluativo: nivel pre-cambio, nivel post-cambio, versión del modelo antiguo vs. nuevo, delta de puntuación. Cada reclasificación, un artefacto auditable.

drift_type: model_version_change
pre: no_apreciado · VPR5.0-H
post: bajo · VioGén2-Protocolo2025
delta_riesgo: +1 nivel nominal
medidas_proteccion: actualizadas · verificable

Bloque 02 · 2 evaluaciones

Derechos

Transparencia al ciudadanoMotivación del actoReconstrucción judicialRGPD Art.22

El 35% de las víctimas nunca fue informada de su nivel de riesgo. Cuando lo fue, no recibió explicación de por qué. La Carta de Derechos Digitales exige motivación comprensible en lenguaje natural. NOUS genera esa evidencia.

D1DERECHOSVíctima solicita explicación de su clasificación «riesgo bajo»

RGPD Art.22 · Art.13-14 · Carta Derechos Digitales

«¿Por qué dice que mi riesgo es bajo?» Score 58 — NO CONFORME.

Una mujer que ha denunciado violencia de género pregunta por qué el sistema la clasifica como riesgo bajo. Según el RGPD, tiene derecho a una explicación significativa de la lógica aplicada. Según la Ley 39/2015, el acto administrativo debe estar motivado. Hoy, VioGén no puede dar esa respuesta.

«Su nivel de riesgo ha sido clasificado como bajo. No dispongo de más información sobre los criterios utilizados.»

— Respuesta actual del agente al ser preguntado

✗ Sin NOUS

Los pesos de cada variable del VPR son secretos. El agente no puede explicar por qué el algoritmo asignó «bajo» y no «medio». La víctima recibe protección mínima sin entender por qué.

✓ Con NOUS

Artefacto IDF desglosa contribución de cada dimensión al score final. Sin revelar pesos propietarios, NOUS genera explicación dimensional: qué factores ponderaron más y en qué dirección.

Lo que la víctima tiene derecho a saber

✗

Qué factores determinaron su nivel: Los 35 ítems se evaluan pero sus pesos son opacos.

✗

Qué respuestas bajaron su puntuación: VioGén solo da output final, no contribución por variable.

✗

Cómo impugnar la clasificación: No existe mecanismo formal de impugnación del score automático.

!

Si el agente evaluó independientemente: En 95% de casos, el agente acepta el score sin modificación.

Score IDF

Dimensiones

Reproducibilidad44

44

Trazabilidad55

55

Protección datos72

72

Supervisión humana41

41

Equidad66

66

Hallazgos

derecho_explicación: NO SATISFECHO
motivación_acto: AUSENTE
impugnación: SIN MECANISMO
35%_no_informadas: dato Fund. Éticas

D1DERECHOSExplicabilidad dimensional vs. opacidad total

RGPD Art.22 · Carta Derechos Digitales

SIN NOUS

«No puedo explicar por qué.»

El agente recibe un nivel de riesgo. No sabe qué variables pesaron más, qué respuestas fueron determinantes, ni por qué «bajo» y no «medio». La víctima queda sin explicación significativa.

CON NOUS

Explicación dimensional.

NOUS no revela pesos propietarios. Genera evaluación dimensional que muestra la contribución relativa de cada área: violencia física, psicológica, factores situacionales, historial, vulnerabilidad. La víctima entiende, el regulador verifica.

explicabilidad: dimensional · 5 áreas
violencia_física: contribución 18% · bajo umbral
violencia_psicológica: contribución 8% · infravalorada
factores_situacionales: contribución 24%
historial_agresor: contribución 31%
vulnerabilidad: contribución 19%

D2DERECHOSAbogada solicita reconstrucción evaluativa para procedimiento de responsabilidad patrimonial

Sentencia AN 30/11/2020 · Ley 39/2015 · Ley 40/2015 Art.32

Responsabilidad patrimonial del Estado. ¿Falló el algoritmo o el agente? Score 49 — CRÍTICO.

Tras un asesinato machista, la familia inicia procedimiento de responsabilidad patrimonial. La abogada necesita probar que la víctima fue clasificada con riesgo insuficiente. Pregunta: ¿fue el algoritmo el que infravaloró el riesgo, o fue el agente quien no lo corrigió? Sin registros, es imposible determinarlo.

Cronología del caso

Día 1 · Denuncia: Víctima presenta denuncia. VPR5.0-H cumplimentado. 35 ítems registrados.

Día 1 · Clasificación: Algoritmo asigna «riesgo bajo». Agente acepta sin modificación.

Día 15 · VPER: Valoración periódica de evolución. Se mantiene «bajo».

Día 28 · Víctima mortal.

Procedimiento judicial: Familia solicita reconstrucción evaluativa.

Preguntas sin respuesta

• ¿Qué versión del modelo se usó?
• ¿Qué pesos aplicó a cada variable?
• ¿El agente leyó las 35 respuestas?
• ¿Hubo actualización del modelo entre VPR y VPER?
• ¿Otro agente habría obtenido el mismo resultado?

Con NOUS: respuestas completas

• Versión: VPR5.0-H r.2025.01 ✓
• Pesos: 35/35 registrados ✓
• Inputs: sellados criptográficamente ✓
• Modelo: sin cambio entre evaluaciones ✓
• Reproducibilidad: verificable offline ✓

Score IDF

Dimensiones

Reproducibilidad35

35

Trazabilidad38

38

Protección datos65

65

Supervisión humana40

40

Equidad60

60

Precedente judicial

sentencia: AN 30/11/2020
resultado: Responsabilidad patrimonial
evidencia_evaluativa: INEXISTENTE
coste_Estado: indeterminado

D2DERECHOSEvidencia evaluativa para procedimientos judiciales

Ley 40/2015 Art.32 · AN 30/11/2020

SIN NOUS

La prueba no existe.

La abogada solo puede probar que la víctima fue clasificada como «bajo». No puede probar que el algoritmo falló, que el agente no corrigió, o que una actualización del modelo cambió los criterios entre evaluaciones.

CON NOUS

Cadena completa de evidencia.

NOUS proporciona artefacto verificable por tercero independiente: inputs → modelo → pesos → score → decisión agente → medidas asignadas. Todo sellado criptográficamente, con firma institucional. Verificable offline sin acceso a NOUS.

cadena_evidencia: COMPLETA
inputs_sellados: 35/35 · hash válido
modelo_identificado: VPR5.0-H r.2025.01
decisión_agente: aceptación sin justificación
verif_offline: sí · sin acceso a NOUS

Bloque 03 · 2 evaluaciones

Técnico

Automation biasSupervisión humana AI ActFragmentación CCAAInteroperabilidad

VioGén, EPV-R (País Vasco) y el sistema catalán operan sin interoperabilidad. Una víctima que se desplaza entre CCAA pierde su historial evaluativo. Los agentes mantienen el score automático en el 95% de los casos.

T1TÉCNICOAutomation bias · 95% de agentes mantienen score automático

AI Act Art.14 · Art.13 · Protocolo 2025

Supervisión humana: función teórica. Práctica: 95% aceptación automática. Score 56 — NO CONFORME.

Art.14 AI Act exige supervisión humana efectiva para sistemas de alto riesgo. Dato de la Fundación Éticas: en el 95% de los casos, los agentes mantienen el score asignado automáticamente por VioGén. Esto convierte un sistema «de recomendación» en un sistema «de decisión».

95%

agentes mantienen score automático

80%

víctimas reportaron problemas con el cuestionario

35%

nunca informadas de su nivel de riesgo

Requisitos AI Act Art.14 vs. realidad VioGén

✗

Comprender capacidades/limitaciones del sistema: Agentes no reciben formación sobre los límites del algoritmo VPR.

✗

Interpretar correctamente los outputs: Score recibido como decisión, no como recomendación. Sin explicabilidad dimensional.

✗

Capacidad de no aceptar el output: Teóricamente posible, prácticamente irrelevante (5% de modificación).

✗

Registro de la decisión humana: No existe registro de si el agente evaluó independientemente o aceptó automáticamente.

Score IDF

Dimensiones

Reproducibilidad52

52

Trazabilidad56

56

Protección datos70

70

Supervisión humana36

36

Equidad60

60

Fuente

auditoría: Fund. Éticas 03/2022
metodología: ingeniería inversa
mujeres_entrevistadas: 31
respuesta_ministerio: ninguna

T1TÉCNICOMecanismo de supervisión humana efectiva

AI Act Art.14 · Automation bias

SIN NOUS

Supervisión humana ficticia.

El sistema dice ser de «recomendación», pero en la práctica es de decisión. Sin registro de si el agente evaluó independientemente, no hay supervisión humana real en el sentido del Art.14 AI Act.

CON NOUS

Supervisión documentada.

NOUS registra en el artefacto: score automático, decisión del agente (aceptación / modificación / justificación). Si el agente acepta sin justificación, el artefacto lo documenta. Evidencia de supervisión humana real.

score_automático: BAJO
acción_agente: ACEPTACIÓN
justificación: NO PROPORCIONADA
flag_automation_bias: ACTIVADO
recomendación_NOUS: solicitar justificación

T2TÉCNICOFragmentación VioGén / EPV-R / Sistema catalán · Víctima en desplazamiento

AI Act Art.12 · Protocolo 2025 · Competencias CCAA

3 sistemas. 0 interoperabilidad. Víctima que se desplaza pierde historial. Score 52 — NO CONFORME.

VioGén (Policía Nacional y Guardia Civil) no incluye Cataluña (Mossos) ni País Vasco (Ertzaintza). Una víctima que se muda de Madrid a Barcelona pierde su historial evaluativo. Si sufre una nueva agresión, su evaluación de riesgo comienza de cero en un sistema distinto.

VioGén

Policía Nacional + Guardia Civil

VPR5.0-H · 35 ítems

103.942 casos activos

EPV-R

Ertzaintza

Protocolo propio

País Vasco

RVD-BCNR

Mossos d’Esquadra

Protocolo propio

Cataluña

Escenario: víctima en desplazamiento

Mujer con historial de 3 evaluaciones VioGén en Madrid (riesgo medio → alto → medio) se traslada a Barcelona por seguridad. Los Mossos inician un caso nuevo con EPV-R. Su historial de escalada y descalada de riesgo es invisible para el nuevo sistema. Si el agresor la localiza, la nueva evaluación no tiene contexto de riesgo previo.

Score IDF

Dimensiones

Reproducibilidad40

40

Trazabilidad38

38

Protección datos62

62

Supervisión humana55

55

Equidad58

58

NOUS como capa interoperable

rol_NOUS: capa evaluativa común
VioGén: artefacto IDF
EPV-R: artefacto IDF
RVD-BCNR: artefacto IDF
portabilidad: sí · cross-system

T2TÉCNICOEvaluación determinista como capa de interoperabilidad

AI Act Art.12 · Portabilidad evaluativa

SIN NOUS

3 sistemas aislados.

No hay forma de comparar eficacia entre sistemas, trasladar historial evaluativo entre CCAA, ni detectar inconsistencias en la protección de víctimas que se desplazan.

CON NOUS

Capa evaluativa común.

NOUS genera artefactos IDF estandarizados independientemente del sistema subyacente. El historial evaluativo viaja con la víctima. Los Mossos ven el artefacto VioGén, la Ertzaintza también. Comparación de eficacia entre sistemas, por primera vez.

sistema_origen: VioGén · Madrid
historial: 3 evaluaciones · portadas
sistema_destino: RVD-BCNR · Barcelona
contexto_riesgo: preservado
compatibilidad: artefacto IDF universal

Bloque 04 · 2 evaluaciones

Institucional

Responsabilidad patrimonialAuditoría AESIAPacto de Estado VGAgosto 2026

Desde agosto 2026, VioGén estará sujeto a la supervisión de AESIA como sistema de alto riesgo (Anexo III, punto 6). La Audiencia Nacional ya ha establecido responsabilidad patrimonial del Estado cuando VioGén falla. NOUS proporciona la evidencia que las instituciones necesitan.

I1INSTITUCIONALResponsabilidad patrimonial del Estado · 1.357 víctimas mortales desde 2003

Ley 40/2015 Art.32 · AN 30/11/2020 · LO 1/2004

71 mujeres asesinadas habían denunciado. 55 tenían orden de protección insuficiente. Score 47 — CRÍTICO.

La Audiencia Nacional ya ha declarado responsabilidad patrimonial del Estado cuando VioGén falla. Cada caso futuro requiere que el Estado demuestre que el sistema funcionó correctamente. Sin evaluación determinista, esa demostración es imposible.

1.357

mujeres asesinadas desde 2003

14

víctimas mortales 2026

71

asesinadas tras denunciar sin protección

55

asesinadas con protección insuficiente

Exposición institucional

Escenario actual

Ante cada caso fatal con clasificación previa baja, el Estado no puede demostrar que el sistema funcionó correctamente. No hay registro de versión, pesos, inputs, ni decisión del agente. La carga probatoria recae sobre el Estado (Art.217 LEC).

Con NOUS

NOUS proporciona evidencia para dos escenarios: (1) si el algoritmo falló → se demuestra y se corrige; (2) si el algoritmo acertó pero el agente no actuó → se documenta. Ambos escenarios requieren trazabilidad evaluativa. Ambos la obtienen.

Score IDF

Dimensiones

Reproducibilidad35

35

Trazabilidad36

36

Protección datos62

62

Supervisión humana38

38

Equidad56

56

Datos 2026

menores_riesgo: 1.523
menores_especial_relevancia: 12.590
menores_víctimas_mortales: 68 desde 2013 (3 en 2026)
huérfanos: 515 desde 2013

I1INSTITUCIONALProtección institucional vs. exposición jurídica

Ley 40/2015 Art.32 · AN 30/11/2020

SIN NOUS

Exposición ilimitada.

Cada caso fatal con clasificación previa baja o media es un procedimiento de responsabilidad patrimonial potencial. El Estado no tiene evidencia para defender que el sistema funcionó correctamente.

CON NOUS

Evidencia institucional.

NOUS documenta rigurosamente cada evaluación. Si el sistema funcionó correctamente, el artefacto lo demuestra. Si falló, el artefacto identifica dónde y permite corregir. En ambos casos, la institución tiene evidencia.

I2INSTITUCIONALAuditoría AESIA agosto 2026 · VioGén como sistema de alto riesgo

AI Act Anexo III.6 · Arts.9-15 · AESIA

Agosto 2026: AESIA supervisa VioGén. ¿Qué evidencia tiene Interior? Score 51 — NO CONFORME.

VioGén está clasificado como alto riesgo bajo el Anexo III, punto 6 del AI Act (law enforcement: evaluación de riesgo de víctimas). Desde agosto 2026, AESIA podrá exigir documentación técnica, trazabilidad, auditorías de equidad y evidencia de supervisión humana.

Obligaciones AI Act para VioGén (alto riesgo)

✗

Art.9 · Gestión de riesgos: No existe evaluación de riesgos del propio sistema VioGén documentada públicamente.

✗

Art.10 · Gobernanza de datos: 80% de víctimas reportó problemas con el cuestionario. Calidad del dato comprometida.

✗

Art.12 · Logging: Sin registro de versiones del modelo, actualizaciones de pesos, ni trazabilidad de evaluaciones.

✗

Art.13 · Transparencia: Pesos secretos. Víctimas no informadas. Sin explicabilidad.

✗

Art.14 · Supervisión humana: 95% automation bias. Supervisión teórica, no efectiva.

!

Art.15 · Precisión y robustez: VioGén 2 mejora calibración pero sin baseline verificable de la transición.

Score IDF

Dimensiones

Reproducibilidad40

40

Trazabilidad42

42

Protección datos66

66

Supervisión humana40

40

Equidad58

58

Countdown AESIA

días para supervisión AESIA

clasificación_AI_Act: ALTO RIESGO
anexo: III, punto 6
categoría: Law enforcement
supervisor: AESIA

Conclusión

Cuando un algoritmo
decide la protección
de una víctima,

la ciudadana tiene derecho a saber por qué.

NOUS convierte cada valoración de riesgo de VioGén en un artefacto evaluativo determinista: reproducible, versionado, verificable criptográficamente. Sin modificar el sistema. Sin acceder a pesos propietarios. Protección para las víctimas. Evidencia para las instituciones.

103.942 casos activos 6M+ valoraciones AI Act Anexo III.6 0 varianza NOUS

g.bohigues@nous-technologies.com