Benutzerin Diskussion:Giftpflanze/Archiv/2014/11

aus Wikipedia, der freien Enzyklopädie
Letzter Kommentar: vor 9 Jahren von PerfektesChaos in Abschnitt Flag-Format Defekter Weblink
Zur Navigation springen Zur Suche springen

Einladung Stammtisch Nordhessen

Hallo Giftpflanze, könntest du für den Stammtisch Nordhessen die Einladung zeitnahe verschicken? Da ich recht aufgrund von Programmänderungen und andere Hinderlichkeiten spät dran bin, der Stammtisch ist kommenden Samstag, auch hier die Bitte. Gruß --codc Disk Benutzerin Diskussion:Giftpflanze/Archiv/2014/11#c-Codc-2014-11-04T12:16:00.000Z-Einladung Stammtisch Nordhessen11

Wird gemacht. — Giftpflanze Benutzerin Diskussion:Giftpflanze/Archiv/2014/11#c-Giftpflanze-2014-11-04T12:25:00.000Z-Codc-2014-11-04T12:16:00.000Z11
Vielen Dank --codc Disk Benutzerin Diskussion:Giftpflanze/Archiv/2014/11#c-Codc-2014-11-04T12:31:00.000Z-Giftpflanze-2014-11-04T12:25:00.000Z11

Du wurdest auf der Seite Vandalismusmeldung gemeldet (19:15, 11. Nov. 2014 (CET))

Hallo Giftpflanze, Du wurdest auf der o. g. Seite gemeldet. Weitere Details kannst du dem dortigen Abschnitt entnehmen. Wenn die Meldung erledigt ist, wird sie voraussichtlich hier archiviert werden.
Wenn du zukünftig nicht mehr von diesem Bot informiert werden möchtest, trage dich hier ein. – Xqbot (Diskussion) Benutzerin Diskussion:Giftpflanze/Archiv/2014/11#c-Xqbot-2014-11-11T18:15:00.000Z-Du wurdest auf der Seite Vandalismusmeldung gemeldet (19:15, 11. Nov. 2014 (CET)11

Hallo Giftpflanze. Bitte nicht eine solche Wortwahl. Da bleibt einem ja nichts anderes übrig als den Sperrknopf zu drücken. Ich musste die Zusammenfassungszeile sogar versionslöschen. Bitte verschnaufen, versuchen runterzukommen und dann mit ruhig Blut wieder argumentieren. --Micha Benutzerin Diskussion:Giftpflanze/Archiv/2014/11#c-Micha L. Rieser-2014-11-11T18:24:00.000Z-Du wurdest auf der Seite Vandalismusmeldung gemeldet (19:15, 11. Nov. 2014 (CET)11

Hallo Giftplfanze. Ich wollte dir ein Mail schreiben und habe nun bemerkt, dass die Mailfunktion bei dir leider nicht aktiviert ist. Ich hoffe, du liest das. Ich interpretiere deine Reaktion und Bemerkung auf Xocolatls Diskussionseite als ein Flinte-ins-Korn-Werfen. Anders kann ich mir diesen Ausfall und diese Steilvorlage für eine Sperre nicht erklären. Ich möchte dich aber bitten, hier zu bleiben. Du bist für das Projekt sehr wichtig und deine bisherige Arbeit ist ausgezeichnet. Ich möchte dich nicht verlieren. Deshalb bitte schreib mir ein Mail und wir diskutieren das mal unter vier Augen. Ok? Ich hoffe, die Dinge lassen sich irgendwie wieder einrenken. --Micha Benutzerin Diskussion:Giftpflanze/Archiv/2014/11#c-Micha L. Rieser-2014-11-11T20:42:00.000Z-Du wurdest auf der Seite Vandalismusmeldung gemeldet (19:15, 11. Nov. 2014 (CET)11

Guten Abend, liebe Mitstreiter. Ich bin in letzter Zeit recht frustriert und schaue derzeit nur noch ganz unregelmäßig hier herein. Kreuzkriege, Superschutz, ... ich glaub, ich brauch das alles gar nicht weiter ausführen. Mit ganz außerordentlichem Bedauern sehe ich jetzt diese Angelegenheit hier. Es würde mich etwas aufmuntern, wenn es gelänge, wenigsten hier einen (für mich) weiteren Tiefpunkt zu vermeiden. Es würde mich ganz besonders freuen, wenn auch @Xocolatl: dabei mithelfen könnte. Liebe Grüße, --Howwi (Diskussion) Benutzerin Diskussion:Giftpflanze/Archiv/2014/11#c-Howwi-2014-11-11T20:56:00.000Z-Micha L. Rieser-2014-11-11T20:42:00.000Z11

Hallo Giftpflanze. Ich habe die Sperre aufgehoben und gehe davon aus, die Sache hat sich zwischenzeitlich beruhigt. Ich hoffe, dass es nicht mehr zu solchen emotionalen Ausbrüchen kommen wird. Bitte komm zurück, wenn du der Sache wieder ein wenig gelassener gegenüberstehst. --Micha Benutzerin Diskussion:Giftpflanze/Archiv/2014/11#c-Micha L. Rieser-2014-11-11T22:44:00.000Z-Du wurdest auf der Seite Vandalismusmeldung gemeldet (19:15, 11. Nov. 2014 (CET)11

Ich schließe mich Micha an, bitte liebe Giftpflanze, komm zurück. Du bist natürlich im RL auch sehr eingespannt, drum würde ich es auch begrüßen, wenn Du zumindest später wieder zu uns trittst und weiterhin unterstützt. Vielen Dank und eine schöne Zeit, -- Doc Taxon @ Disc –  BIBR Benutzerin Diskussion:Giftpflanze/Archiv/2014/11#c-Doc Taxon-2014-11-12T20:07:00.000Z-Micha L. Rieser-2014-11-11T22:44:00.000Z11

Hi,

du hast in Special:diff/136324387 aus den explizit und unmissverständlich genannten ( . , ; ? (gehört da nicht ein ! auch mit zu?) ein nebulöses und unspezifisches „das Satzzeichen“ gemacht.

  • Diese exakten Angaben in der Doku sind aber die Schnittstelle zwischen der Programmfunktionalität und den Menschen da draußen in der Welt. Woher sollen die Menschen denn wissen, was für „Zeichen“ gemeint sind, zumal Mabschaaf sie neuerdings auch noch in den Verlinkungen verheimlichen will?
  • Verfolgtest du damit irgendeine Absicht?
  • Auf welche „Satzzeichen“ prüfst du denn?

LG --PerfektesChaos Benutzerin Diskussion:Giftpflanze/Archiv/2014/11#c-PerfektesChaos-2014-11-30T14:44:00.000Z-Flag-Format Defekter Weblink11

Ich wollte die Liste erst unendlich erweitern, dann dachte ich, ich erweiter das auch einfach im Programm (vorher (.,;?| oder .[a-z][satzzeichen], nun [satzzeichen] oder %7C) und schreib einfach satzzeichen oder %7C. Satzzeichen sind hier alle Zeichen der Unicodeklasse Punctuation. – Giftpflanze Benutzerin Diskussion:Giftpflanze/Archiv/2014/11#c-Giftpflanze-2014-11-30T14:54:00.000Z-PerfektesChaos-2014-11-30T14:44:00.000Z11
Tja, aber das war nicht der Grund für diese Ausnahmebedingung.
Es ging um die Satzzeichen, die MediaWiki nicht zur URL zählt, wenn die URL offen steht; umschließt man die nun mit eckigen Klammern, gibt ihm einen Titel, und vergisst das Satzzeichen rausznehmen, dann wird es wirksam. Das kann Ursache für ein defektes Link gewesen sein
Und das sind nur die ( . , ; ? " ! ) und nicht unendlich; und es käme ohnehin nur ASCII-Punctuation in Frage.
LG --PerfektesChaos Benutzerin Diskussion:Giftpflanze/Archiv/2014/11#c-PerfektesChaos-2014-11-30T15:11:00.000Z-Giftpflanze-2014-11-30T14:54:00.000Z11
Dann darf ich mal in meine Wundertüte greifen und präsentiere:
- : “ ” * _ % \ /
Giftpflanze Benutzerin Diskussion:Giftpflanze/Archiv/2014/11#c-Giftpflanze-2014-11-30T15:21:00.000Z-PerfektesChaos-2014-11-30T15:11:00.000Z11
Okay, dann machen wir es mal systematisch.
Wird bei Klammerung einbezogen; Fehlerquelle Gehört immer dazu

> ASCII

Stern, Dollar und Undersore sind reguläre Zeichen in einer URL; Prozent auch, nur nicht grad am Ende.
Eine Doku zu diesem Feature wird man lange suchen können; ist aber eine Frage, die an den Normalautoren vorbeigeht. Mal sehen, vielleicht baue ich H:L etwas aus.
Eigentlich hatte ich die im ASCII-Bereich schon mal systematisch durchgetestet. Was mich erstaunt, ist die öffnende runde Klammer; die hatte ich bei einem früheren systematischen Test unverbunden vorgefunden. Vielleicht hat da in den letzten Jahren wer was dran gedreht.
Dieser Mist stammt aus der BB-Code-Ära von 2002/2003, als man ganz einfach irgendwelche Texte in die Seite knallen wollte.
Mal sehn --PerfektesChaos Benutzerin Diskussion:Giftpflanze/Archiv/2014/11#c-PerfektesChaos-2014-11-30T15:58:00.000Z-PerfektesChaos-2014-11-30T15:11:00.000Z11
Es ist mir egal, was du als Grund für dieses Feature ansiehst. Es gibt auch noch andere Gründe, warum Sonderzeichen an das Ende einer URL geraten. Zum Beispiel wird / gerne als „Trennzeichen“ für die Formatierung von URLs genutzt. Oder man vertut sich bei der Formatierung von Aufzählungen. Oder man vertut sich bei ''/'''. Und die willst du dann nicht akzeptieren? Hä? – Giftpflanze Benutzerin Diskussion:Giftpflanze/Archiv/2014/11#c-Giftpflanze-2014-11-30T16:45:00.000Z-PerfektesChaos-2014-11-30T15:58:00.000Z11
Na, dass ein Schrägstrich am Ende einer Domain steht, ist nicht weiter erstaunlich, sondern bei http://example.com/ die Standard-Notation, und bei vielen URL der Normalfall.
Mal anders gefragt: Wie viele Fälle wirft deine schlaue Datenbank denn aus, wo das mit irgendeinem Sonderzeichen nicht geht, und es ohne funktionieren würde? Und bei wie vielen davon lag es an einem Schrägstrich?
LG --PerfektesChaos Benutzerin Diskussion:Giftpflanze/Archiv/2014/11#c-PerfektesChaos-2014-11-30T16:57:00.000Z-Giftpflanze-2014-11-30T16:45:00.000Z11
Deine Entgegnung verstehe ich nicht. Es geht doch um Fälle, wo ein / eben nicht angebracht ist aber trotzdem hinzugefügt wird.
1570/2657. Dann noch 362 , 345 | 240 . 97 : 27 ; 4 ' alle anderen 1–2 – Giftpflanze Benutzerin Diskussion:Giftpflanze/Archiv/2014/11#c-Giftpflanze-2014-11-30T17:03:00.000Z-PerfektesChaos-2014-11-30T16:57:00.000Z11
  • Die Angabe „1570/2657“ verstehe ich nicht.
  • Die ursprüngliche Aufgabenstellung ging von der Beobachtung aus, dass häufig mal beim Klammern eines offenen Weblinks ein Pünktchen mit einbezogen wurde. Dementsprechend lautete die Bitte, gezielt nach dieser Situation zu suchen.
    • 362 , 240 . 97 : 27 ; entsprechen auch genau diesem Unfallhergang.
  • Die Pipe kommt von Aktionen wie [http://example.com|Offizielle Webpräsenz].
  • Was da mit 4 oder 1–2 Treffern rumschwimmt, ist normales Rauschen; banale Tippfehler, beim C&P nicht weit genug markiert oder zu weit und so.
    • Wenn du URL-Endungen auf .htm mal probehalber auf .html ausdehnst, müssten sich auch ein paar Dutzend Reparaturen ergeben.
    • Eine ähnliche Reparaturquote von 1 oder 2 oder 4 wirst du durch bloßes Rumprobieren mit Weglassen irgendwelcher letzter Buchstaben erreichen können. Gegen eine Viertelmillion Artikel ist das aber Zeit- und Nervenvergeudung. Es ist ja noch nicht mal gesagt, dass nach formalem Rumraten die entstehende funktionierende URL auch den richtigen Inhalt hat.
  • Weil du ja jetzt mit der Statistik soweit bist: Wie viele Artikel, wie viele URL sind es denn geworden?
Schönen Abend --PerfektesChaos Benutzerin Diskussion:Giftpflanze/Archiv/2014/11#c-PerfektesChaos-2014-11-30T19:18:00.000Z-Giftpflanze-2014-11-30T17:03:00.000Z11
1570/2657 bedeutet: Es gibt 2657 URLs, bei denen das Weglassen des letzten Zeichens zu einer funktionierenden URL führt. 1570 davon enden mit /.
Als Zeichen hätte ich dann: . , : ; %7C und so Sachen wie .html/ .pdf/
Ich lasse morgen erstmal alle Zeichen zu, mal gucken, was noch so rausspringt.
Es sind bislang 615.177 defekte Links von 5.459.127 Links aus 1.397.228 Artikeln, 401.880 Diskussionsseiten werden beschrieben. Gesamtzahl der gemeldeten Links: 696.146 – Giftpflanze Benutzerin Diskussion:Giftpflanze/Archiv/2014/11#c-Giftpflanze-2014-11-30T19:41:00.000Z-PerfektesChaos-2014-11-30T19:18:00.000Z11
Frei-Form-Weblinks dürften so aussehen:
(\\b(?i:bitcoin:|ftp://|ftps://|geo:|git://|gopher://|http://|https://|irc://|ircs://|magnet:|mailto:|mms://|news:|nntp://|redis://|sftp://|sip:|sips:|sms:|ssh://|svn://|tel:|telnet://|urn:|worldwind://|xmpp:)[^][<>"\\x00-\\x20\\x7F\p{Zs}]+)
Also Worttrenner, gefolgt von einem der erlaubten Protokollen, gefolgt von einer negierten Zeichenklasse, die aus ], [, ", allen Kontrollzeichen und der Unicode-Kategoriy "separator, space" besteht. Der Umherirrende Benutzerin Diskussion:Giftpflanze/Archiv/2014/11#c-Umherirrender-2014-11-30T19:24:00.000Z-Giftpflanze-2014-11-30T17:03:00.000Z11
@Umherirrender: Danke, aber die gopher wais waren vorher schon mangels Masse eliminiert worden, mailto news nntp irc ircs sind im ANR unerwünscht und waren vorab fast alle aus den Artikeln entfernt worden (gab nur 50 mailto), interessieren also nicht für defekte Weblinks. bitcoin geo magnet ssh tel telnet worldwind kamen wohl überhaupt nicht aktiv vor oder wurden aus den Artikeln geschmissen; git svn gibt es im ANR wohl nicht.
Es bleiben 4–5 ftps (die manuell gecheckt wurden); der Bot konzentriert sich wohl auf http https ftp als Ressourcen-URL.
Wie sollten wir auch mailto oder bitcoin auf 404 checken?
LG --PerfektesChaos Benutzerin Diskussion:Giftpflanze/Archiv/2014/11#c-PerfektesChaos-2014-11-30T20:01:00.000Z-Umherirrender-2014-11-30T19:24:00.000Z11
Ah, jetzt verstehe ich erst, was du uns sagen wolltest; das Zeilenende kam erst nach einem halben Daumenmuskelkater Scrollweg.
Ja, um diese Zeichen geht es, wobei das unterschiedliche Verhalten der öffnenden und schließenden runden Klammer seltsam ist.
Die x00-\x20 sind Whitespace und \x7F ist kein echtes ASCII mehr.
Müsste man sich mal durchwühlen, was alles bei \p{Zs} drinsteht.
Danke schön --PerfektesChaos Benutzerin Diskussion:Giftpflanze/Archiv/2014/11#c-PerfektesChaos-2014-11-30T20:13:00.000Z-PerfektesChaos-2014-11-30T20:01:00.000Z11
Ne, das haut gar nicht hin, und die Zeichen da innen drin sind ja innerhalb der URL erlaubt; nur bei der Frage, wozu die letzten Zeichen vor dem Whitespace etc. gezählt werden, wird ja ein Unterschied gemacht. Die Unicode-Klassen sind:
  • 21 EXCLAMATION MARK Po
  • 22 QUOTATION MARK Po
  • 25 PERCENT SIGN Po
  • 26 AMPERSAND Po
  • 27 APOSTROPHE Po
  • 28 LEFT PARENTHESIS Ps
  • 29 RIGHT PARENTHESIS Pe
  • 2A ASTERISK Po
  • 2C COMMA Po
  • 2D HYPHEN-MINUS Pd
  • 2E FULL STOP Po
  • 2F SOLIDUS Po
  • 3A COLON Po
  • 3B SEMICOLON Po
  • 3F QUESTION MARK Po
  • 40 COMMERCIAL AT Po
  • 5C REVERSE SOLIDUS Po
  • 5F LOW LINE Pc
  • 7B LEFT CURLY BRACKET Ps
  • 7D RIGHT CURLY BRACKET Pe
Rätselnd --PerfektesChaos Benutzerin Diskussion:Giftpflanze/Archiv/2014/11#c-PerfektesChaos-2014-11-30T21:30:00.000Z-PerfektesChaos-2014-11-30T20:13:00.000Z11
Habe nochmal weiter geschaut. Neben dem Regex kommt auch etwas Anwendungslogik zum Tragen, beispielsweise beenden < oder > eine URL. Desweiteren werden folgende Zeichen vom Ende der URL abgeschnitten: ,;\.:!?, falls die URL kein ( enthält, kommt ) noch dazu. Da wäre auch deine Erklärung für das Klammerverhalten. Also ist die Regex-Suche erstmal nur grob. Der Umherirrende Benutzerin Diskussion:Giftpflanze/Archiv/2014/11#c-Umherirrender-2014-12-01T08:19:00.000Z-PerfektesChaos-2014-11-30T21:30:00.000Z11
Danke schön; dieses urtümliche Verhalten ist den meisten Autoren unbekannt und führt dazu, dass beim nachträglichen Klammern und Betiteln offener URL die ,;\.:!? als scheinbarer Bestandteil der URL mit hinein genommen werden (zumindest 362 , 240 . 97 : 27 ;), während erst nach dem sich üblicherweise anschließenden Leerzeichen ein Linktitel eingefügt wird. Auch die Sache mit der ) ist aus der Billig-Text-Variante heraus sinnvoll, wenn die öffnende Klammer schon vor der URL aufmacht; das wusste ich auch noch nicht.
Schöne Woche --PerfektesChaos Benutzerin Diskussion:Giftpflanze/Archiv/2014/11#c-PerfektesChaos-2014-12-01T08:51:00.000Z-Umherirrender-2014-12-01T08:19:00.000Z11
Der Klammertrick ist aber primitiv und wirkt bei einfachen URLs die eingeklammert werden (http://example.com), wenn aber ein Klammerlink eingeklammert wird sieht es schon schlechter aus (http://example.com?test=H(2)O), außer er wird urlencoded (http://example.com?test=H%282%29O) oder nowikied (oder andere Tags) (http://example.com?test=H(2)O). Der Umherirrende Benutzerin Diskussion:Giftpflanze/Archiv/2014/11#c-Umherirrender-2014-12-01T17:13:00.000Z-PerfektesChaos-2014-12-01T08:51:00.000Z11
Vielleicht können wir uns darauf einigen: Das Ruminterpretieren am letzten Zeichen einer URL vor dem Whitespace war eine Narretei aus der Krabbelphase um 2002, als man wie im BBCode möglichst einfach eine URL in den Text einstreuen wollte. Damals lieb gemeint, aber die konnten ja nicht ahnen, dass mal in allen Sprachen der Welt Wikis mit teils über einer Million Artikel sich mit den Folgen herumquälen müssen. In einem laufenden Qualitätstext haben offene URL sowieso nichts verloren; die könnten höchstens mal in einer Aufzählung als Einzelpunkte stehen. Aber das war im Kindergartenalter nicht absehbar. Die offenen URL gehören in einen Chat.
Gute Nacht --PerfektesChaos Benutzerin Diskussion:Giftpflanze/Archiv/2014/11#c-PerfektesChaos-2014-12-01T23:54:00.000Z-Umherirrender-2014-12-01T17:13:00.000Z11