Benutzer Diskussion:Mabschaaf/Quelltextfehler

aus Wikipedia, der freien Enzyklopädie
Zur Navigation springen Zur Suche springen

Diskussion zu den RegEx-Ausdrücken

[Quelltext bearbeiten]

@Mfb: Sollten wir die von Dir eingefügte letzte Spalte nicht hierher verlagern, dann werden Kommentare dazu einfacher. Mein Vorschlag wäre: Vorne alle Suchlinks entfernen, die noch nicht optimal sind oder noch diskutiert werden sollten, die Vorschläge hierher umziehen, dafür vorne die Zeilen durchnummerieren, damit man den Bezug leichter herstellen kann. --Mabschaaf Benutzer Diskussion:Mabschaaf/Quelltextfehler#c-Mabschaaf-2014-12-10T16:03:00.000Z-Diskussion zu den RegEx-Ausdrücken11Beantworten

Können wir auch machen. Suchstrings->HTML sollte mit Tools wie diesem gehen - aber nur den Suchstring nehmen, sonst wird zu viel umgewandelt.--mfb (Diskussion) Benutzer Diskussion:Mabschaaf/Quelltextfehler#c-Mfb-2014-12-10T16:19:00.000Z-Mabschaaf-2014-12-10T16:03:00.000Z11Beantworten

n-Butan: Suchstring chemi* insource:/ n-[A-Z]/ gibt viele false positives (n-Eck, n-Halbleiter, ...), ohne dass ich eine gute Trennmöglichkeit sehe. Insgesamt 150 Treffer. Mit Infobox Chemie noch 80 Treffer, davon aber 30 durch eine Navileiste bei der das sinnvoll ist. --mfb (Diskussion) Benutzer Diskussion:Mabschaaf/Quelltextfehler#c-Mfb-2014-12-10T16:19:00.000Z-#1211Beantworten

Letztere Treffen können ja mittels chemi* insource:/[^(sleiste)] n-[A-Z]/ oder ähnlich entfernt werden. --Leyo Benutzer Diskussion:Mabschaaf/Quelltextfehler#c-Leyo-2014-12-10T17:54:00.000Z-Mfb-2014-12-10T16:19:00.000Z11Beantworten
So funktionieren Charakterklassen ( [ ] ) nicht. Im Prinzip gibt es lookbehind dafür, aber das unterstützt die Suche wohl nicht. Was die Hilfe noch verrät: < > " haben besondere Funktionen.
Naja, das scheint nicht so schlecht zu passen. Publikationstitel kriegt man wohl fast nicht raus. --Leyo Benutzer Diskussion:Mabschaaf/Quelltextfehler#c-Leyo-2014-12-13T23:24:00.000Z-Leyo-2014-12-10T17:54:00.000Z11Beantworten

Das einschränkende chemi* oder insource:"{{Infobox Chemikalie" sollte generell weggelassen werden, wenn dadurch keine Massen an false-positives entstehen.--Mabschaaf Benutzer Diskussion:Mabschaaf/Quelltextfehler#c-Mabschaaf-2014-12-10T16:33:00.000Z-zu allen11Beantworten

Teilweise kann ich mir diese Massen vorstellen, ansonsten ist es aber auch einfach schonender für den Server. Reguläre Ausdrücke auszuwerten kostet Zeit, wenn das nur für xx.xxx Chemie-Artikel geschehen muss ist das viel schneller als wenn es für 1,8 Millionen Artikel geschieht. --mfb (Diskussion) Benutzer Diskussion:Mabschaaf/Quelltextfehler#c-Mfb-2014-12-10T22:17:00.000Z-Mabschaaf-2014-12-10T16:33:00.000Z11Beantworten