La volatilità dei rendimenti di un asset finanziario è generalmente con- siderata come una misura del rischio associato a tale attività. In questo lavoro ci concentreremo su un approccio atipico per la previsione della volatilità, basato su un insieme di algoritmi che permettono di risolvere problemi di classificazione te- stuale. A tale fine, abbiamo utilizzato un corpus messo a disposizione dal Center for Research in Security Prices (CRSP), contenente un insieme di report il cui mo- dello di riferimento è noto come Form 10-K, la cui compilazione è richiesta annualmente dalla SEC (U.S. Securities and Exchange Commission) alle aziende quotate le cui attività circolanti siano superiori a 10 milioni di dollari. Abbiamo messo a confronto le performance previsive di due classificatori testuali, utilizzan- do una versione discretizzata della volatilità come target previsivo. Il primo classi- ficatorte è il modello di regressione logistica multinomiale penalizzato, che utilizza una particolare norma sullo spazio dei parametri per risolvere il problema dell’overfitting, spingendo verso lo zero la maggior parte dei coefficienti di regres- sione. Il secondo è il modello Supervised Latent Dirichlet Allocation (SLDA), che permette di classificare un corpus testuale sulla base di un insieme di topic latenti (ossia di contenuti tematici) che vengono identificati all’interno di ciascuno docu- mento. I risultati ottenuti indicano una leggera prevalenza del modello di regressione logistica multinomiale, prevalenza che si rafforza quando si considera che i tempi di calcolo richiesti sono nettamente inferiori a quelli del modello SLDA.

Previsione del rischio a partire da report finanziari mediante l’utilizzo di modelli per topic latenti

BILANCIA MASSIMO
;
2017-01-01

Abstract

La volatilità dei rendimenti di un asset finanziario è generalmente con- siderata come una misura del rischio associato a tale attività. In questo lavoro ci concentreremo su un approccio atipico per la previsione della volatilità, basato su un insieme di algoritmi che permettono di risolvere problemi di classificazione te- stuale. A tale fine, abbiamo utilizzato un corpus messo a disposizione dal Center for Research in Security Prices (CRSP), contenente un insieme di report il cui mo- dello di riferimento è noto come Form 10-K, la cui compilazione è richiesta annualmente dalla SEC (U.S. Securities and Exchange Commission) alle aziende quotate le cui attività circolanti siano superiori a 10 milioni di dollari. Abbiamo messo a confronto le performance previsive di due classificatori testuali, utilizzan- do una versione discretizzata della volatilità come target previsivo. Il primo classi- ficatorte è il modello di regressione logistica multinomiale penalizzato, che utilizza una particolare norma sullo spazio dei parametri per risolvere il problema dell’overfitting, spingendo verso lo zero la maggior parte dei coefficienti di regres- sione. Il secondo è il modello Supervised Latent Dirichlet Allocation (SLDA), che permette di classificare un corpus testuale sulla base di un insieme di topic latenti (ossia di contenuti tematici) che vengono identificati all’interno di ciascuno docu- mento. I risultati ottenuti indicano una leggera prevalenza del modello di regressione logistica multinomiale, prevalenza che si rafforza quando si considera che i tempi di calcolo richiesti sono nettamente inferiori a quelli del modello SLDA.
2017
9788866290131
File in questo prodotto:
Non ci sono file associati a questo prodotto.

I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/11586/207137
 Attenzione

Attenzione! I dati visualizzati non sono stati sottoposti a validazione da parte dell'ateneo

Citazioni
  • ???jsp.display-item.citation.pmc??? ND
  • Scopus ND
  • ???jsp.display-item.citation.isi??? ND
social impact