Diskussion:Tf-idf-Maß

aus Wikipedia, der freien Enzyklopädie
Letzter Kommentar: vor 10 Jahren von Daniel16 08 in Abschnitt Inverse Dokumenthäufigkeit
Zur Navigation springen Zur Suche springen

freq_l,j

[Quelltext bearbeiten]

sollte auch zuvor deklariert werden (nicht signierter Beitrag von 153.96.14.101 (Diskussion) Diskussion:Tf-idf-Ma%C3%9F#c-153.96.14.101-2010-12-17T12:51:00.000Z-freq l,j11) Beantworten

Normalisierung der TF

[Quelltext bearbeiten]

Im Nenner der TF-Berechnung sollte eher die Summe und nicht das Maximum der Termhäufigkeit stehen. (nicht signierter Beitrag von 129.26.72.29 (Diskussion) Diskussion:Tf-idf-Ma%C3%9F#c-129.26.72.29-2010-09-14T08:25:00.000Z-Normalisierung der TF11) Beantworten

Die Normalisierung hat erstmal garnichts mit TF-IDF zu tun. Alternative Funktionen können später eingeführt werden und verwirren erstmal nur. Daher ändere ich die bestehende Formel ab und entferne die vermeintliche Normalisierung -- Philip (nicht signierter Beitrag von 134.100.32.31 (Diskussion) Diskussion:Tf-idf-Ma%C3%9F#c-134.100.32.31-2011-05-18T08:06:00.000Z-129.26.72.29-2010-09-14T08:25:00.000Z11) Beantworten

Artikelname

[Quelltext bearbeiten]

Ein besserer Name wäre TF-IDF-Maß statt TF-IDF-Formel. Es gibt mehrere Algorithmen oder Formeln, um TF-IDF zu berechnen und in der Information-Retrieval-Community wird auch nur vom TF-IDF-Maß gesprochen. 139.18.2.46 Diskussion:Tf-idf-Ma%C3%9F#c-139.18.2.46-2010-10-06T12:25:00.000Z-Artikelname11Beantworten

Inverse Dokumenthäufigkeit

[Quelltext bearbeiten]

Es existieren zwei verschiedene Formeln zur Berechnung der inversen Dokumentenhäufigkeit.

1. Die hier stehende

2. Inverse Dokumenthäufigkeit (nicht signierter Beitrag von Daniel16 08 (Diskussion | Beiträge) Diskussion:Tf-idf-Ma%C3%9F#c-Daniel16 08-2013-12-16T13:27:00.000Z-Inverse Dokumenthäufigkeit11)Beantworten

Müsste im folgenden Satz nicht ein anstatt eines stehen? Das ist ja nirgends definiert worden.

Das Gewicht eines Terms im Dokument ist dann nach TF-IDF:

Wird dann zu:

Das Gewicht eines Terms im Dokument ist dann nach TF-IDF: