Lo strumento principale per la ricerca di documenti su Internet è il motore di ricerca, che permette di ritrovare dei documenti mediante la formulazione di parole chiave. Un servizio alternativo offerto da alcuni motori di ricerca è la ricerca tematica, in cui l’utente è libero di “sfogliare” i documenti riguardanti un argomento, mentre il sistema propone approfondimenti ulteriori su argomenti specialistici. L’approfondimento culturale è possibile grazie alla strutturazione delle classi di documenti in una ontologia. In questo lavoro si indaga l’uso di una ontologia in processi di classificazione automatica di documenti web (pagine HTML). In particolare, si illustra l’estensione di tecniche di estrazione di attributi, di metodi di apprendimento automatico e di classificazione al caso di basi documentali ontologiche. I risultati sperimentali condotti mediante il sistema WebClassII su parte dell’ontologia di Yahoo mostrano l’importanza della struttura ontologica al fine di migliorare le prestazioni del processo di classificazione automatica.
Classificazione Automatica di Documenti Web in Ontologie
MALERBA, Donato;
2002-01-01
Abstract
Lo strumento principale per la ricerca di documenti su Internet è il motore di ricerca, che permette di ritrovare dei documenti mediante la formulazione di parole chiave. Un servizio alternativo offerto da alcuni motori di ricerca è la ricerca tematica, in cui l’utente è libero di “sfogliare” i documenti riguardanti un argomento, mentre il sistema propone approfondimenti ulteriori su argomenti specialistici. L’approfondimento culturale è possibile grazie alla strutturazione delle classi di documenti in una ontologia. In questo lavoro si indaga l’uso di una ontologia in processi di classificazione automatica di documenti web (pagine HTML). In particolare, si illustra l’estensione di tecniche di estrazione di attributi, di metodi di apprendimento automatico e di classificazione al caso di basi documentali ontologiche. I risultati sperimentali condotti mediante il sistema WebClassII su parte dell’ontologia di Yahoo mostrano l’importanza della struttura ontologica al fine di migliorare le prestazioni del processo di classificazione automatica.I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.