Articoli

ALCUNE APPLICAZIONI DELLA LINGUISTICA FORENSE IN PERIZIA GRAFICA. Relazione al Convegno Nazionale dell'Istituto di Grafologia Forense Mesagne (BS), 7-9 Settembre 2012

1. E’ prassi comune che il perito grafico presti attenzione, nella comparazione fra scritture, a dati propriamente extra-grafici come l’ortografia e la punteggiatura.

L’analisi di questi dati, che qui interessano per la loro natura linguistica, si ritrova in Osborn (1929), per il quale bisogna ricorrere non soltanto all’esame dei segni grafici, ma anche alla composizione, alla grammatica, all’ortografia, alle forme idiomatiche, alla sillabazione, alla punteggiatura, all’uso delle maiuscole. Ritroviamo un’attenzione a questi elementi linguistici, soprattutto all’ortografia e alla grammatica, in tutta la trattatistica peritale anglosassone, da Harrison (1958) a Conway (1959), da Hilton (1982) a più recentemente Ellen (2003), e non solo.

In Italia Ottolenghi (1924) attribuisce “quasi valore di contrassegni particolari a certi errori di ortografia” (corsivo nel testo). Sivieri (1950) invece chiede che si presti anche attenzione agli errori di sintassi.

Manca però in genere, anche nella manualistica, la piena consapevolezza che si tratta di strumenti linguistici: questo comporta che tale ricorso avviene non di rado in modo empirico, non sistematico e alcune volte errato (un pericolo evidenziato da Huber e Headricks 1999); anche perché si finisce col dare eccessivo peso a ciò che viene enfatizzato dall’insegnamento scolastico, al rispetto o meno della norma linguistica, il che non è detto che ci conduca sempre sulla via giusta.

In aiuto del perito grafico può allora venire la cosiddetta linguistica forense, che fra le sue diverse e varie funzioni ha anche quella, in particolare, di identificare l’autore di uno scritto in base alle evidenze linguistiche del testo, considerando dal proprio particolare punto di vista anche quelle caratteristiche sopra elencate che usualmente vengono tenute in considerazione nella perizia su scritture. La linguistica forense è utile soprattutto nel caso di testi non manoscritti, redatti al pc, anche di sms o email (De Vel 2001); ma anche nella perizia su scritture a mano essa può fornire strumenti di supporto al perito grafico, coadiuvandolo, orientandolo o convalidando le sue conclusioni (questa sua funzione è riconosciuta anche nel manuale di perizie grafiche di Ellen).

Vogliamo allora qui assai brevemente tracciare un quadro generale dello stato dell’arte della linguistica forense, per poi puntualizzare alcuni spunti che la disciplina può offrire al perito grafico.

 

2. “Linguistica forense” è un calco dell’inglese forensic linguistics, che trova in inglese diverse accezioni di significato: in senso ampio, come ogni possibile applicazione dello studio scientifico del linguaggio in ambito giuridico-giudiziario e corrisponde più da vicino all’italiano linguistica giudiziaria; oppure in accezione più ristretta come l’uso delle tecniche linguistiche nella risoluzione di casi giudiziari.

Nei suoi impieghi investigativi e peritali, la linguistica forense contribuisce a:

- identificare l’autore di uno scritto anonimo o la cui paternità sia incerta o contestata (come può essere un testamento o una lettera anonima);

-   ricavare da un testo, redatto con finalità criminali e di autore sconosciuto, informazioni che risultino utili nel contesto delle indagini;

-  stabilire la veridicità o la spontaneità di una confessione o di una testimonianza;

-  stabilire se un testo è frutto di plagio;

-  identificare il parlatore (fonetica forense, nelle intercettazioni telefoniche e ambientali).

Di questi vari usi, il primo come si è detto è quello che qui ci interessa nelle sue applicazioni alla perizia grafica, e trova origine nel caso Evans, la cui confessione fu dimostrata falsa sulla base di prove linguistiche (Svartvik 1968), diventando oggetto di interesse mediatico con l’identificazione dell’Unabomber Theodor Kaczynski da parte dell’agente dell’FBI J. R. Fitzgerald (che la racconta in prima persona in Campbell e Denevi 2004).

L’attribuzione dell’autore di un testo sulla base di elementi linguistici e stilistici risale invero all’antichità, e vi fecero ricorso ad esempio tanto Galeno che San Girolamo, ma è con l’Umanesimo che la critica testuale assume carattere sistematico, adottando “il confronto sistematico della lingua, del contenuto e delle idee, esplicite ed implicite, del documento in esame” (Grafton 1996). Alcuni esempi, anche recenti, di analisi testuale applicati all’identificazione dell’autore di un testo hanno un sapore investigativo; ma è stato però osservato, che tale approccio difficilmente possiederebbe i requisiti di una prova scientifica da portare in tribunale: dure critiche sono state perciò mosse (per esempio da McMenamin 1993 e Chaski 1998) a Donald Foster (2000), che ha applicato le tecniche della critica letteraria alla risoluzione di casi investigativi. Lo sforzo della linguistica forense è allora quello di uniformare i suoi principi a una teoria del linguaggio e i suoi metodi a criteri di verificabilità e falsificabilità stabilendo al contempo il grado di attendibilità dei risultati.

Per quanto riguarda il primo punto, come principio base della linguistica forense sta secondo Coulthard (2004) l’assunto che ognuno di noi possiede un idioletto, un suo universo linguistico individuale che lo distingue da tutti gli altri, che si manifesta con caratteristiche distintive e idiosincratiche. Su questo presupposto, Coultthard ha potuto dimostrare che in alcuni noti casi il linguaggio delle confessioni non poteva appartenere a chi si diceva le avesse rilasciate; in particolare nel caso di Derek Bentley, che si era autoaccusato di omicidio, o dei cosiddetti Birmingham Six, presunti autori di una serie di attentati terroristici dell’IRA, il registro adoperato era tipico dei verbali di polizia. McMenamin (1993) preferisce invece fare riferimento ad un concetto di “stile” del linguaggio scritto come parte del comportamento umano che riflette le variazioni individuali del linguaggio, sia in quanto risposta cosciente alle esigenze del contesto, sia in quanto scelte inconsce e abituali acquisite nel lungo termine attraverso le esperienze di scrittura. Un’idea analoga è in Hanlein (1999) che parla di “impronte digitali stilistiche”; Pennebaker preferisce pensare a “impronte digitali linguistiche” e McMenamin a un “DNA linguistico” (il che però pare eccessivo a Olsson 2004).

 Le nozioni di idioletto e di stile sono dibattute e non del tutto pacifiche (si veda ad es. Barthes 1964, ed. it. 1983); Per superare le obiezioni che sono state poste nei confronti di questi concetti, Chaski (2001) ha indirizzato la ricerca verso metodi sperimentali per verificare su base statistica quali siano le variabili linguistiche di valore idiosincratico. Questo studio ha i suoi limiti ma apre comunque una via seguita dalle successive ricerche, che si rivela proficua a patto, come vuole McMenamin (2001), di essere integrate con le centinaia di studi precedenti e di tenere soprattutto in conto un’adeguata problematizzazione dei fattori di variabilità del linguaggio (su cui anche le argomentate critiche di Grant e Baker 2001).

Ma quali sono gli indicatori linguistici di autorità ai quali può fare ricorso il perito grafico?

Richiedono conoscenze specialistiche le tecniche stilometriche, che si basano sull’idea che le caratteristiche di stile che rimangono invariate in uno stesso autore ma differiscono da un autore all’altro siano misurabili e suscettibili di trattamento statistico, come la lunghezza delle parole e delle frasi, la frequenza dei grafemi, dei bigrammi e dei trigrammi, ecc. (sono stati sperimentati pure sistemi automatici di riconoscimento da Matthews e Merriam, Holmes e Forsyth, Stamatatos et al., de Vel). Altri metodi, che oltre ad essere suscettibili di trattamento statistico hanno anche un aspetto qualitativo, richiedono anch’esse conoscenze specialistiche, come nel caso dell’analisi della sintassi, che pure sarebbe di grande utilità perché ha un elevato potere discriminante (Baayen, Halteren e Tweedie 1996; Chaski 1997 e 2001 con una percentuale di successo nell’identificazione dell’autore di uno scritto dal 90 al 99,2%). Competenze assai particolari richiede pure l’analisi della complessità della frase (Stravkirk), o la classificazione in categorie semantiche.

Vediamo allora gli strumenti più facilmente maneggiabili dal perito, al quale egli come si è detto già in parte fa ricorso, e quale contributo può dare la linguistica forense per un loro più corretto uso.

 

3. Prendiamo in esame i seguenti dati:

Punteggiatura

La punteggiatura assume di frequente valore idiosincratico: molti di noi possiedono del resto delle particolari preferenze, se non dei vezzi, nella punteggiatura, come l’uso frequente dei punti esclamativi o dei puntini di sospensione, come sanno per esperienza gli insegnanti che, per quanti sforzi facciano, ritrovano sempre gli stessi errori di punteggiatura nei temi dei loro alunni; e ciò perché l’italiano consente una certa varietà nell’uso della punteggiatura: si osservino ad esempio le possibili quattro varianti che seguono di una stessa proposizione (l’ultima si può considerare poco corretta, ma la sua costruzione non è certo inusuale):

Ero convinto di trovarlo ma invece non c’era

Ero convinto di trovarlo, ma invece non c’era

Ero convinto di trovarlo ma, invece, non c’era

Ero convinto di trovarlo ma invece, non c’era

Contribuisce a questo il fatto che la punteggiatura indica confini sia logici che intonativi, senza che i due piani coincidano necessariamente o che siano sempre chiaramente distinguibili in modo netto, consentendo in questo una certa libertà espressiva.

Quali sono le caratteristiche della punteggiatura che assumono valore identificativo?

McMenamin (2002) ha esaminato 80 procedimenti giudiziari di contestata paternità di uno scritto, enucleando le particolarità della punteggiatura che hanno contribuito a risolvere il caso. I dati non sono sempre confrontabili con gli usi dell’italiano ma possiamo comunque ricavare utili indicazioni su come si può “personalizzare” la punteggiatura. Abbiamo quindi come fattori discriminanti: sostituzione di punti, punti e virgola, lineette con altri segni di interpunzione, fra cui il punto interrogativo e la parentesi in luogo rispettivamente del punto fermo e della virgola; punteggiatura assente, anche del tutto; mancanza del punto fermo alla fine della frase; punto e virgola associato alla lineetta (quest’ultima può seguire i numeri in cifre); punti seguiti da altro segno di punteggiatura; punti esclamativi e interrogativi ripetuti e anche in alcuni casi eccessivamente spaziati; lineette doppie e triple e usate come separatrici di parole composte; virgolette di apertura usate al posto di quelle di chiusura; parentesi a racchiudere in modo incongruo singole parole o gruppi di esse, presentandosi anche ripetute o quadre; virgole sovrabbondanti.

Diversamente Chaski (2001) ha misurato il numero di volte in cui i diversi segni di interpunzione comparivano nei diversi autori sottoposti ad esame, trovando anche una notevole variazione dei dati per quanto riguardava il punto, la virgola, la lineetta, consentendo l’identificazione dell’autore di tredici testi su quattordici, con una percentuale di successo quindi del 92,8% e di errore del 7,1%.

Chaski ha utilizzato anche un’altra promettente tecnica, di cui si dà conto solo a titolo informativo perché richiede anche questa particolari competenze linguistiche. Si tratta di individuare la funzione sintattica assunta dalla punteggiatura, che può stare a indicare i confini di una frase, di una proposizione, di un sintagma, di una parola (ad esempio se quest’ultima è racchiusa tra parentesi) o avere una funzione appositiva. In ogni caso l’autrice suggerisce di utilizzare insieme i diversi metodi di analisi della punteggiatura.

Errori di ortografia e grammatica

McMenamin riprende il trattato di perizie grafiche di Osborn nell’indicare come errori quelli di ortografia, l’errato uso delle maiuscole, quelli grammaticali e in particolare errori di persona, numero, caso, pronome, tempo verbale, soggetto, modo, forma possessiva.

Fra i vari autori, possiamo ancora citare Koppel e Schler (2003) che indicano in particolare l’ortografia errata; la ripetizione oppure l’omissione di parole; il numero e il tempo sbagliati; gli errori nelle doppie; le parole invertite, inserite, abbreviate; le lettere tutte maiuscole. Olsson (2204) pone l’accento sulla confusione delle categorie grammaticali.

Da citare anche Hubbard (1996) in quanto egli ha evidenziato la necessità di evitare ogni vaghezza a cui porre rimedio identificando la tipologia di errore: se ne ha un esempio nel caso State v. Bran del 1990, relativo a un polacco che scriveva in inglese, nella quale occasione Hubbard classificò gli errori per lessico, ordine delle parole, concordanza, ortografia (a sua volta distinguendo nome, aggettivo, interiezione, ecc.), punteggiatura.

Si pongono però alcuni problemi.

Bisogna innanzitutto distinguere gli “errori di produzione” o di performance (i lapsus occasionali, le sviste che chi scrive è poi in grado di riconoscere come sbagli) dagli errori “di apprendimento” o di competence che invece riguardano una inadeguata conoscenza delle regole di formazione della lingua (Corder 1973; Ellis 1979). Solo i secondi hanno valore identificativo, ma il perito grafico raramente li distingue.

In secondo luogo non si devono confondere gli errori idiosincratici con le varianti rispetto alla norma linguistica che sono patrimonio di una comunità di parlanti, come il dialetto: è un frequente errore contro cui mette in guardia Coulthard (1993), e prima ancora lo stesso Ottolenghi. Ci è capitato ad esempio di esaminare, come consulenti di parte, un testamento la cui autenticità era stata contestata in cui erano ricorrenti alcuni errori di ortografia che si trovavano anche nella scrittura di colui che era stato accusato di averlo falsificato. Per il CTU ciò costituiva una prova di identità, sennonché proprio nello stesso periodo, in un altro caso riguardante un testamento di diversa persona della stessa zona geografica, ritrovavamo esattamente gli stessi errori: chiaramente, si trattava della trascrizione della pronuncia fonetica propria del luogo, e la ricorrenza degli errori di ortografia non aveva valore segnaletico.

Altra questione: gli errori di ortografia in uno stesso individuo non è detto che siano costanti: egli può scrivere la stessa parola, sbagliando, in diverse maniere (Chaski 2001). L’eventualità si presentò anche nel caso dell’Unabomber, suscitando accese discussioni tra i periti: fra l’altro fu avanzata la tesi che l’Unabomber avesse solo in un secondo momento appreso la corretta ortografia di alcune parole.

Ricchezza di vocabolario

Se ne sono occupati diversi autori, come Holmes, Baayen, Johnson, Williams, Tweedie e Bayen, Chaski.

Il vocabolario dipende dal soggetto del testo e dalla sua lunghezza (Ledger). Oltre al rilievo degli hapax, ovvero dei termini che compaiono una sola volta, si può quantificare la frequenza delle parole dividendo il numero delle ricorrenze per il totale delle parole (type-token ratio), utilizzando lo stesso sistema per i termini che compaiono associati tra di loro.

Può essere utile nel caso di lettere anonime seriali.

Indice di leggibilità

Su cui Holmes 1994; Ellis e Dick 1996.

E’ una formula matematica che predice la difficoltà di un testo. Il più noto è l’indice di Flesch, ma per il perito è più utile il GULPEASE, perché mette i risultati in relazione al grado di scolarizzazione del soggetto. Il GULPEASE è già preinstallato su Word e restituisce automaticamente il calcolo.

Un classico esempio dell’uso di tale indice è in Gudjonsson e Haward (1983): la confessione di ragazzo che si era autoaccusato di un omicidio per poi ritrattare aveva un indice di Flesch molto superiore a quello compatibile con il suo quoziente di intelligenza: la confessione non era autentica.

Si può utilizzare ad esempio per stabilire l’attribuzione di lettere a patto che siano d’analogo contenuto.

 

  1. Ecco infine alcune avvertenze d’uso.

In generale:

-  gli elementi idiosincratici del linguaggio, se hanno valore discriminante in una tipologia di testo, non è detto che lo abbiano in un altro (caratteristiche idiosincratiche di lessico e fraseologia subiscono l’interferenza del contenuto: Clement e Sharp 2003): ad esempio una missiva anonima fin ad un certo punto si può comparare con una lettera familiare. Le scritture a confronto devono essere perciò attinenti ad uno stesso contesto oltre che in numero sufficientemente esemplificativo del range di variabilità (McMenamin)

-  gli elementi idiosincratici non sono generalmente validi e non hanno la stessa affidabilità per tutti i soggetti; le varianti individuali vanno infatti riportate alle competenze linguistiche dei singoli e non ad un’ibrida e universale prestazione linguistica (Grant e Baker 2001)

-  un maggiore successo nell’identificazione si ha dalla combinazione dei diversi parametri (Vincent ed Hamilton 2001): in un pionieristico studio, riguardante l’attribuzione dell’incompiuto romanzo The O’Ruddy di Stephen Crane, B. O’Donnell (1966) utilizzò l’analisi multivariata di diciotto parametri (sintattici, lessicali, grammaticali e ortografici) che da soli non sarebbero stati sufficientemente significativi

-  anche però considerando la necessità di più indicatori, e le critiche avanzate per esempio da Chaski su base statistica all’effettivo valore identificativo di molti di quelli sopra indicati, è indubbio che la loro analisi qualitativa funziona, in determinati contesti, come “pistola fumante” dell’identificazione. I citati Koppel e Schler fanno come esempio il caso di omissione ricorrente della “i” all’interno delle parole, o della “n” alla fine di esse, o della sistematica sostituzione della “s” con la “z”. Harrison (1958) cita alcuni casi relativi a lettere anonime. A noi è capitato un caso in cui il presunto autore di uno scritto sostituiva sempre le “t” con le “d”: appurato che non si trattava di un’influenza dialettale, il dato si rivelò decisivo, trattandosi probabilmente di una forma di disgrafia.

In particolare per quanto riguarda la perizia grafica:

-  nel rilasciare il saggio grafico, la pronuncia del perito che detta influenzerà l’ortografia (specialmente in chi ha bassa scolarizzazione), e la punteggiatura ne seguirà l’intonazione: egli quindi deve assumere un tono neutro (Ellen 1999). A noi è capitato di un CTU che si interrompeva proprio dove, nel testo incriminato, vi erano virgole incongrue, che venivano a questo punto apposte anche dal soggetto sottoposto a saggio: chiaramente gli errori di punteggiatura di quest’ultimo dipendevano dalla lettura del CTU (che però non riconobbe il proprio errore)

-  le parole o le frasi che contengono errori di ortografia e grammatica vanno ripetute nel dettato per verificare le loro variazioni (Harrison 1958): tali errori infatti, come si è detto, possono essere semplici sviste o prevedere varianti.

 

In conclusione:

Quando un perito grafico confronta ortografia o errori di grammatica, come è d’uso, deve prestare molta attenzione a non commettere errori di valutazione, e in questo può venire d’aiuto la conoscenza dei principii di base della linguistica forense.

D’altra parte questa disciplina si può rivelare utile per tanti altri versi, ma è poco praticata in Italia, e la bibliografia è molto limitata (citiamo almeno per quanto l’analisi del contenuto in ambito forense Cabras 1996). Non sono però pochi i periti grafici che provengono da facoltà di lettere e hanno alle spalle studi linguistici, i quali possono lavorare nella direzione di un’integrazione della perizia grafica con la linguistica forense.

 

Riferimenti bibliografici

 

Baayen R. H., van Halteren H., Tweedie F. J., 1996, Outside the Cave of Shadows: Using syntactic annotation to enhance authorship attribution, Literary and Linguistic Computing, 11 (3)

Barthes R., 1983, Elementi di semiologia, Torino, Einaudi

Cabras C., 1996, Analisi del contenuto e stilometria: un metodo per l’analisi documentale, in Psicologia della prova, Milano, Giuffrè Editore

Campbell J. H., Denevi D. (eds.), Profiles, New York, Prometheus Book

Chaski C., 1997, "Who Wrote It? Steps Toward A Science of Authorship Identification, National Institute of Justice Journal, September

Chaski C., 1998, Daubert-inspired assessment of current techniques for language-based author identification, ILE Technical Report 1098

Chaski C., 2001, Empirical Evaluations of Language-Based Author Identification Techniques, The International Journal of Speech Language and the Law, 8:1

Clement R., Sharp D., 2003, Ngram and Bayesian classification of documents far topic and authorship, Literary and linguistic computing

Chaski, C., 2005, Who’s At The Keyboard? Authorship Attribution in Digital Evidence Investigations, Spring, Volume 4, Issue 1

Conway, J., 1959., Evidential Documents, Springfield, Charles C. Thomas

Corder S. P., 1973, Introducing Applied Linguistics, Harmondsworth, Penguin Books; ed. it: 1983, Introduzione alla linguistica applicata, Bologna, Il Mulino

Coulthard 1993, On beginning the study of forensic texts: Corpus concordance collocation, in Honey M. (ed.), Data, description, discourse: papers on the English language in honour of John McH. Sinclair, London, Harper Collins Coulthard M., 2004, Author Identification, Idiolect, and Linguistic Uniqueness, Applied Linguistics, 25 (4)

De Vel O., 2001, Mining e-mail content for author identification forensics, Newsletter ACM SIGMOD Record, 30 (4)

Ellen, D, 2003, Scientific Examination of Documents, Boca Raton, CRC Press

Ellis, A.W. , 1979, Slips of the pen, Visible Language, 13

Ellis B. G., Dick S. J., 1996, ‘Who was “Shadow”? The computer knows: applying grammar-program statistics in content analyses to solve mysteries about authorship’, Journalism and Mass Communication Quarterly, 73(4)

Foster D., 2000, Author Unknown: On the trail of Anonymous, New York, Henry Holt & Co.

Grafton A., 1990, Forgers and Critics, ed. it. Falsari e critici, Torino, Einaudi, 1996

Grant T., Baker K., 2001, Identifying reliable, valid markers of authorship: a response to Chaski, International Journal of Speech Language and the Law, 8 (1)

Gudjonsson G. H., Haward L. R., 1983, Psychological analysis of confession statement, Journal of Forensic Science Society, 23

Hanlein H., 1999, Studies in Authorship Recognition. A Corpus-based Approach, Frankfurt am Main, Peter Lang Publishing

Harrison W. R., 1958, Suspect Document, New York, Praeger

Hilton O., 1982, Scientific Examination of Questioned Documents, Boca Raton, CRC Press

Holmes, D. I., 1994, Authorship attribution, Computers and the Humanities, 28

Hubbard E. H, 1994, Errors in Court: a Forensic Application of Error Analysis, Supplement of the South African Journal of Linguistics, 20

Huber R. A., Headrick A. M., 1999, Handwriting Identification: Facts and Fundamentals, Boca Raton, CRC Press

Koppel M., Schler J., 2003, Exploiting Stylistics Idyosincratysies for Autorship Attribution, Proceedings of IJCAI'03 Workshop on Computational Approaches to Style Analysis and Synthesis, Acapulco, Mexico

McMenamin G. R., 1993, Forensic stylistics, Amsterdam, Elsevier

McMenamin G. R., 2001, Style markers in autorship studies, The International Journal of Speech Language and the Law, 8 (2)

O’Donnell B., 1966, Stephen Crane’s “The O’Ruddy”. A Problem in Autorship Discrimination, The Computer and Literary Style, 2

Olsson J., 2004, Forensic Linguistics, London-New York, Continuum

Osborn A., 1929, Questioned Documents, 2nd ed. Chicago: Nelson-Hall Co. Ostrum

Ottolenghi S., La perizia di scrittura e la identificazione grafica, Roma, 1924

Sivieri O, 1950, L’indagine grafica, CEDAM, Padova

Vincent S. St., Hamilton T., 2001, Author Identification with Simple Statistical Methods, Department of Computer Science, Swarthmore College

Svartvik J., 1968, The Evans Statements: A Case for Forensic Linguistics, Göteborg, University of Gothenburg Press.

Copyright 2012 Criminalistica - Pietro Pastena . design by Salvatore Incandela