Presentare le
metodologie matematiche che sono alla base di alcuni algoritmi
utilizzati
nei motori di ricerca sul web..
Nel corso saranno
fornite le basi teoriche per il
trattamento di problemi relativi al recupero di
documenti presenti
sul web ed al loro ordinamento.
Verranno condotte
delle sperimentazioni al calcolatore per confrontare le varie tecniche
presentate.
Matrice termini documenti e modello dello
spazio vettoriale. Ricerca testuale. Precision e recall. Polisemia e
sinonimia. Strategia del Latent Semantic Indexing (LSI).
Fattorizzazioni QR ed SVD e loro utilizzo per l’implementazione del LSI.
2) Ordinamento di Documenti
L’algoritmo di Kleinberg: hub e authorities.
Struttura del motore di ricerca Google. Metodi per il calcolo di
autovalori e autovettori dominanti e loro utilizzo negli algoritmi di
page ranking.
M. Berry, M. Browne,
Understanding Search Engines. Mathematical Modelings and Text
Retrieval. SIAM, 1999
M. Berry, S. Dumais,
G. O'Brien, Using Linear Algebra for Intelligent Information Retrieval.
SIAM Review, 37, pp. 573-595, 1995
Altri articoli
distribuiti dal docente.