Salve a tutti, non ho capito bene come procedere con questo esercizio:
Sia data la collezione di doc={d1,d2,d3}. Di seguito riposta l'elenco dei termini presenti in ogni documento con le relative occorrenze: d1=<a:2,b:5,c:1> d2=<d:7,e:2,a:2> d3=<b:2,c:1,e:3> Rappresentare la collezione nel "vector space model" costruendo la relativa matrice termini-documenti. Si consideri come peso di ogni termine il corrispondente valore tf-idf, in cui il valore della frequenza di un termine all'interno di un documento è normalizzato rispetto alla frequenza max nel documento.
Ho costruito la matrice termini- documenti a b c d e d1 2 5 1 0 0 d2 2 0 0 7 2 d3 0 2 1 0 3
non ho capito bene che fare ora!
|