La “stilometria” per combattere i troll

Mattarella

Appare chiaro anche ai non addetti ai lavori che non sarà semplicissimo investigare sui troll utilizzati per la nota “campagna Twitter” contro il Presidente Sergio Mattarella.

Abbiamo cercato di capirne di più confrontandoci con Andrea Melegari di Expert System Spa, una società italiana, leader mondiale nella sviluppo di cognitive computing e parte di CY4Gate Srl , joint venture creata con Elettronica Spa e specializzata nel dominio cyber.

Quanto sarà difficile scoprire chi c’è dietro i troll usati per attaccare il Presidente Mattarella?

Certamente sarà conplesso. L’attribuzione di un cyber attack (di questo di fatto si è trattato) infatti rappresenta da sempre un punto cruciale nella guerra cibernetica.Chi effettua un attacco alle reti informatiche spesso possiede capacità tecniche di primissimo livello e, difficilmente, lascia tracce che possano far risalire alla sua identità. Dunque, in mancanza di un colpevole certo, chi si deve perseguire?

Allora cosa è possibile fare?

Partiamo allora da un elemento certo del cyber attacco al Presidente Mattarella: il contenuto testuale di oltre 16mila tweet. Dall’analisi testuale di questi tweet, seppur di soli 140 caratteri ciascuno, potrebbero emergere informazioni interessanti per identificare le caratteristiche dell’autore del cyber attack.

Si tratta di una tecnica di indagine nuova? 

No. Già in passato, l’analisi linguistica è stata di ausilio alle forze di polizia e alle agenzie di intelligence. Theodore John Kaczynski, il terrorista americano noto come Unabomber, è stato rintracciato grazie al fratello David che trovò dei riscontri concreti tra il manifesto pubblicato da Unabomber e dei documenti di famiglia appartenenti al fratello e ritrovati in casa. I volantini di rivendicazione della Brigate Rosse, i pizzini inviati dai capomafia sono altri esempi concreti di come l’analisi semantica dei testi posaa supportare efficacemente il lavoro degli investigatori.

Come è possibile?

Tecnicamente parliamo di stilometria, ovvero della misurazione degli indicatori stilistici. Ciascuno di noi quando scrive (così come quando parla) adotta alcuni automatismi, come gli intercalari, le parole preferite, le abitudini stilistiche ecc.. Attualmente esistono algoritmi di intelligenza artificiale in grado di determinare con precisione la Stilometria di migliaia di testi.

Quali informazioni utili possono essere desunte?

Età, sesso, titolo di studio, idioletti (caratteristiche linguistiche tipiche di un singolo individuo), indice di leggibilità (che indica quanto un testo è facile da leggere e comprendere) sono alcuni elementi che si possono dedurre dall’analisi di un testo. E che possono aiutare a tratteggiare il profilo dell’autore di un testo (umano o cibernetico)

Il passo successivo?

Una volta generate le “impronte biometriche degli scriventi dei tweet” serve cercare delle corrispondenze tra gli archivi e nel mare magnum della Rete.  Impresa sfidante ma sostenibile grazie all’impiego della tecnologia di intelligenza artificiale a supporto degli ottimi analisti delle nostre forze di polizia e della nostra intelligence.

Quali sono le reali chance di successo?

Non si tratta certamente di un’attività semplice ed immediata, ma chissà che chi è stato tanto attento ad anonimizzare il proprio accesso a Twitter non abbia invece lasciato qualche traccia stilometrica in giro… Magari in un vecchio testo pubblicato in rete. Opportuno indagare.

Foto Ansa

 

Login

Benvenuto! Accedi al tuo account

Ricordami Hai perso la password?

Lost Password