Lo strumento principale per la ricerca di documenti su Internet è il motore di ricerca, che permette di ritrovare dei documenti mediante la formulazione di parole chiave. Un servizio alternativo offerto da alcuni motori di ricerca è la ricerca tematica, in cui l’utente è libero di “sfogliare” i documenti riguardanti un argomento, mentre il sistema propone approfondimenti ulteriori su argomenti specialistici. L’approfondimento culturale è possibile grazie alla strutturazione delle classi di documenti in una ontologia. In questo lavoro si indaga l’uso di una ontologia in processi di classificazione automatica di documenti web (pagine HTML). In particolare, si illustra l’estensione di tecniche di estrazione di attributi, di metodi di apprendimento automatico e di classificazione al caso di basi documentali ontologiche. I risultati sperimentali condotti mediante il sistema WebClassII su parte dell’ontologia di Yahoo mostrano l’importanza della struttura ontologica al fine di migliorare le prestazioni del processo di classificazione automatica.

Classificazione Automatica di Documenti Web in Ontologie

MALERBA, Donato;
2002-01-01

Abstract

Lo strumento principale per la ricerca di documenti su Internet è il motore di ricerca, che permette di ritrovare dei documenti mediante la formulazione di parole chiave. Un servizio alternativo offerto da alcuni motori di ricerca è la ricerca tematica, in cui l’utente è libero di “sfogliare” i documenti riguardanti un argomento, mentre il sistema propone approfondimenti ulteriori su argomenti specialistici. L’approfondimento culturale è possibile grazie alla strutturazione delle classi di documenti in una ontologia. In questo lavoro si indaga l’uso di una ontologia in processi di classificazione automatica di documenti web (pagine HTML). In particolare, si illustra l’estensione di tecniche di estrazione di attributi, di metodi di apprendimento automatico e di classificazione al caso di basi documentali ontologiche. I risultati sperimentali condotti mediante il sistema WebClassII su parte dell’ontologia di Yahoo mostrano l’importanza della struttura ontologica al fine di migliorare le prestazioni del processo di classificazione automatica.
File in questo prodotto:
Non ci sono file associati a questo prodotto.

I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/11586/107060
 Attenzione

Attenzione! I dati visualizzati non sono stati sottoposti a validazione da parte dell'ateneo

Citazioni
  • ???jsp.display-item.citation.pmc??? ND
  • Scopus ND
  • ???jsp.display-item.citation.isi??? ND
social impact