Penso sia un peccato che tale topic sia rimasto lettera morta..
Per gli/le admin/mod/utenti..può essere utile archiviare tutte le notizie carattere ufologico?
E' un 'lavoraccio' immane però...solo con un lavoro coordinato tra più soggetti si potrà sperare di ottenere qualcosa di valido in qualche eone..e sempre che abbia senso farlo.
Notare per esempio il risultato per una medesima pagina (LaStampa - 15.12.1978 - numero 291 - pagina 9 ), ma con due query differenti:
Quando gli Ufo danno spettacolohttp://www.archiviolastampa.it/component/option,com_lastampa/task,search/action,viewer/Itemid,3/page,0009/articleid,1090_01_1978_0291_0010_15769770/Passa in cielo un disco volante e nei paesi si spengono le luci http://www.archiviolastampa.it/component/option,com_lastampa/task,search/action,viewer/Itemid,3/page,0009/articleid,1090_01_1978_0291_0010_22843541/Il salvataggio in pdf permette di salvare tutta la pagina, mentre quello testuale permette di salvare l'articolo specifico all'interno di una pagina, ma il riconoscimento OCR potrebbe non essere perfetto e inoltre essendo in formato txt, il testo necessita di una riformattazione per essere pubblicato decentemente e ancor più grave durante l'esportazione txt, può accadere che pezzi di articoli differenti nella stessa pagina o in quella adiacente possano accavallarsi.
In definitiva la versione pdf è quella più rapida ma x contro il contenuto è salvato come immagine perdendo quindi tutte le informazioni sulla formattazione del testo.