Forum by laureateci.it

Nome Utente:	Password:
Salva Password
Password Dimenticata?

Tutti i Forum

ITPS - Terzo Anno

Gestione della Conoscenza d'Impresa

Esercizio!!

Nuova Discussione

Nuovo Sondaggio

Rispondi

Versione Stampabile

Aggiungi Segnalibro

Autore

Discussione

disco.dance
Nuovo Utente

Inserito il - 04/10/2011 : 11:28:07

Salve a tutti, non ho capito bene come procedere con questo esercizio:

Sia data la collezione di doc={d1,d2,d3}. Di seguito riposta l'elenco dei termini presenti in ogni documento con le relative occorrenze:
d1=<a:2,b:5,c:1>
d2=<d:7,e:2,a:2>
d3=<b:2,c:1,e:3>
Rappresentare la collezione nel "vector space model" costruendo la relativa matrice termini-documenti. Si consideri come peso di ogni termine il corrispondente valore tf-idf, in cui il valore della frequenza di un termine all'interno di un documento è normalizzato rispetto alla frequenza max nel documento.

Ho costruito la matrice termini- documenti
a b c d e
d1 2 5 1 0 0
d2 2 0 0 7 2
d3 0 2 1 0 3

non ho capito bene che fare ora!