Qué mide Quirzo
Quirzo compara la huella estilística de un texto en español contra el historial de un autor de control, extrayendo cientos de marcadores forenses agrupados en 3 familias. La distancia entre ambas huellas se traduce en un Ratio de Verosimilitud (LR).
3 familias de marcadores
930
características
3
familias
- C
N-gramas de caracteres
Secuencias de 3 y 4 caracteres (incluyendo espacios y signos) que el autor encadena sin pensarlo. Capturan tics ortográficos, morfología y ritmo a un nivel subconsciente. Son el grueso de la huella estilométrica.
700 características - F
Palabras funcionales
Preposiciones, conjunciones, artículos, pronombres y conectores. Son la firma clásica de la estilometría forense: el autor las usa de forma involuntaria y su frecuencia es independiente del tema del que escriba.
130 características - S
Estructura sintáctica (POS)
Secuencias de categorías gramaticales (sustantivo-adjetivo, verbo-preposición…) que revelan cómo construye las frases el autor. Capturan el ritmo sintáctico, no el vocabulario concreto.
100 características