Copisti Digitali e Filologi Computazionali
Federico Boschetti
Roma 2018
Istituto di Linguistica Computazionale “A. Zampolli”
Copisti Digitali e Filologi Computazionali
Federico Boschetti
Roma 2018
Istituto di Linguistica Computazionale “A. Zampolli”
Federico Boschetti (
federico.boschetti@ilc.cnr.it
)
Copisti Digitali e Filologi Computazionali
©
CNR Edizioni, 2018P.le Aldo Moro 700185 Romawww.edizioni.cnr.itISBN 978 88 8080 297 6 (edizione digitale)ISBN 978 88 8080 296 9 (edizione a stampa)
Sommario
1 Introduzione 1
1.1 Filologia collaborativa e cooperativa . . . . . . . . . . . . . . . . . 11.2 Copisti digitali e filologi computazionali . . . . . . . . . . . . . . . 4
2 L’acquisizione del testo digitale 11
2.1 Stato dell’arte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122.2 Metodi per migliorare l’OCR . . . . . . . . . . . . . . . . . . . . . 142.3 Risultati sperimentali . . . . . . . . . . . . . . . . . . . . . . . . . 212.4 Il processo di correzione manuale . . . . . . . . . . . . . . . . . . 242.5 Rimappatura del testo sull’immagine della pagina . . . . . . . . . 24
3 Analisi di apparati e repertori 31
3.1 Le linee guida della Text Encoding Initiative . . . . . . . . . . . . 363.2 Marcatura dei repertori di congetture . . . . . . . . . . . . . . . . 403.3 Elaborazione dei documenti marcati . . . . . . . . . . . . . . . . . 44
4 Trattamento automatico di apparati e repertori 51
4.1 Stato dell’arte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 514.2 Edizioni critiche di riferimento e repertori di congetture . . . . . . 534.3 Formalizzazione della struttura di apparati e congetture . . . . . . 554.4 Metodi di allineamento . . . . . . . . . . . . . . . . . . . . . . . . 59
5 Analisi sintattica 63
5.1 La linguistica dei
corpora
. . . . . . . . . . . . . . . . . . . . . . . 745.2 Dall’interesse linguistico all’interesse filologico . . . . . . . . . . . 895.3 Ancient Greek Dependency Treebank . . . . . . . . . . . . . . . . 90iii