Benutzer Diskussion:Baiel Nazarov/Markov Spamfilter

aus Wikipedia, der freien Enzyklopädie
Zur Navigation springen Zur Suche springen
  • Es sollte einheitlich die Transkription "Markow" (wie auch z. B. in Markow-Kette verwendet werden.
  • Der Abschnitt "mathematische Grundlage" kann deutlich gekürzt werden. Beschreiben Sie die Grundannahme des verdeckten Markow-Modells und verweisen Sie für Details auf den Artikel Hidden Markov Model.
  • Der Artikel https://en.wikipedia.org/wiki/Markovian_discrimination, den Sie als Grundlage für den Abschnitt "Funktionsweise" genommen haben, hat zu Recht den Kommentar: "This article provides insufficient context for those unfamiliar with the subject.". Das trifft auch für Ihren Beitrag zu. Was ist zum Beispiel der "interne Zustand des Sprachmodells"?
  • Der existierende Artikel Markow-Spamfilter ist zwar schlecht, aber er geht auf die im Artikel "Spam Filtering using a Markov Random Field Model with Variable Weighting Schemas" genutzten Gewichte und das "über den Text verschobene Fenster" ein. Das fehlt bei Ihnen. Ebenso fehlt die Information, nach welcher Formel denn die Wahrscheinlichkeit, dass eine Nachricht als Spam zu klassifizieren ist, berechnet wird. Das ist aber die Grundlage von allem, also wichtig.
  • Man wird sicher auch einige grundlegende Informationen aus Bayesscher Spamfilter wiederholen wollen.

Kommentare zum Stand vom 23.01.

[Quelltext bearbeiten]
  • Die erste Überschrift (Markov Spamfilter) ist unnötig und entspricht nicht dem Format von Wikipedia.
  • Die anderen Überschriften sollten keine Unterüberschriften sein.
  • Wenn es möglich ist, Verweiwse auf andere Wiki-Artikel einbinden (z.B. Spamfilter, Hidden Markov Model, Segmentierung, Präfixbaum,...).
  • Dass der Markov-Spamfilter ein Spamfilter ist, ist unnötig zu erwähnen.
  • Rechtschreibfehler Spam-Filtern -> Spam-Filter
  • Es wäre hilfreich zu erklären was verschleierte Wörter sind z.B. Definition. Außerdem sollte darauf eingegangen werden warum diese Problematisch sind.
  • Nach Möglichkeit keine rethorischen Fragen verwenden.
  • Vorzugsweise das Passiv verwenden (https://studyflix.de/deutsch/aktiv-und-passiv-3623).
  • Erklärung von HHM für Personen ohne Vorwissen schwer zu verstehen (insbesondere mathematische Vorgänge).
  • Bei dem Abschnitt HHM fehlt ein roter Roter Faden.
  • "damit es es von anderen, scheinbar gleichwertigen Zeichenfolgen wie mortgegege und mortgige unterscheiden kann" ersetzen durch "damit es[..] unterschieden werden kann.
  • Die Ausführungen der Formel(HMM) sind zu unzureichend um diese zu verstehen.
  • Es empfiehlt sich das Beispiel mit Abbildungen zu unterstützen. Außerdem ist es im Aktuellen Zustand nicht geeignet um HMM zu verstehen.
  • "[..]keine zusätzlichen Informationen über die Zukunft aus der Vergangenheit benötigen." ersetzen durch "keine zusätzlichen Informationen über die Zukunft und die Vergangenheit benötigen."
  • Die mathematische Grundlage ist schwierig nachvollziehbar, unter anderem da die Verknüpfung von Formeln und Sätzen schlecht durchschaubar ist.
  • Quellenangaben fehlen

--Michel Hecker 13:55, 23 Jan. 2022 (CET)