Nota: Devi essere registrato per poter inserire un messaggio. Per registrarti, clicca qui. La Registrazione è semplice e gratuita!
V I S U A L I Z Z A D I S C U S S I O N E
disco.dance
Inserito il - 04/10/2011 : 11:28:07 Salve a tutti, non ho capito bene come procedere con questo esercizio:
Sia data la collezione di doc={d1,d2,d3}. Di seguito riposta l'elenco dei termini presenti in ogni documento con le relative occorrenze: d1=<a:2,b:5,c:1> d2=<d:7,e:2,a:2> d3=<b:2,c:1,e:3> Rappresentare la collezione nel "vector space model" costruendo la relativa matrice termini-documenti. Si consideri come peso di ogni termine il corrispondente valore tf-idf, in cui il valore della frequenza di un termine all'interno di un documento è normalizzato rispetto alla frequenza max nel documento.
Ho costruito la matrice termini- documenti a b c d e d1 2 5 1 0 0 d2 2 0 0 7 2 d3 0 2 1 0 3