Diskussion:Inverse Dokumenthäufigkeit

aus Wikipedia, der freien Enzyklopädie
Letzter Kommentar: vor 13 Jahren von White rotten rabbit
Zur Navigation springen Zur Suche springen

Ist die Addition mit 1 wirklich notwendig?

Der Quotient kann nicht kleiner als 1 sein, denn dann müßte es mehr Dokumente die den Term enthalten geben als es Dokumente gibt, und das kann nicht sein. --LarsT Diskussion:Inverse Dokumenth%C3%A4ufigkeit#c-LarsT-2006-10-12T15:24:00.000Z11Beantworten

Nach über vier Jahren hat sich noch keiner dazu geäußert? Hmm... Also dass der Quotient nie kleiner als 1 sein kann, stimmt natürlich. Das einzige, was mir dazu einfällt, ist wenn Term t in jedem Dokument auftritt. Dann berechnet man log(1), was natürlich 0 ist. Nun möchte man vielleicht als IDF-Wert keine Null haben (etwa bei der Berechnung von TF-IDF), also schlägt man eine Eins drauf. Aber vielleicht gibt es einen ganz anderen Grund dafür? -- White rotten rabbit Diskussion:Inverse Dokumenth%C3%A4ufigkeit#c-White rotten rabbit-2011-04-07T11:30:00.000Z-LarsT-2006-10-12T15:24:00.000Z11Beantworten

es muss log zur Basis 2 heißen oder? (nicht signierter Beitrag von 88.72.237.68 (Diskussion) 12:14, 23. Jul 2012 (CEST))