Benutzer Diskussion:Mabschaaf/Quelltextfehler
Diskussion zu den RegEx-Ausdrücken
[Quelltext bearbeiten]@Mfb: Sollten wir die von Dir eingefügte letzte Spalte nicht hierher verlagern, dann werden Kommentare dazu einfacher. Mein Vorschlag wäre: Vorne alle Suchlinks entfernen, die noch nicht optimal sind oder noch diskutiert werden sollten, die Vorschläge hierher umziehen, dafür vorne die Zeilen durchnummerieren, damit man den Bezug leichter herstellen kann. --Mabschaaf Benutzer Diskussion:Mabschaaf/Quelltextfehler#c-Mabschaaf-2014-12-10T16:03:00.000Z-Diskussion zu den RegEx-Ausdrücken11
- Können wir auch machen. Suchstrings->HTML sollte mit Tools wie diesem gehen - aber nur den Suchstring nehmen, sonst wird zu viel umgewandelt.--mfb (Diskussion) Benutzer Diskussion:Mabschaaf/Quelltextfehler#c-Mfb-2014-12-10T16:19:00.000Z-Mabschaaf-2014-12-10T16:03:00.000Z11
chemi* insource:/[0-9]ß-/
findet noch einen.--Mabschaaf Benutzer Diskussion:Mabschaaf/Quelltextfehler#c-Mabschaaf-2014-12-10T16:26:00.000Z-#111
#12
[Quelltext bearbeiten]n-Butan: Suchstring chemi* insource:/ n-[A-Z]/
gibt viele false positives (n-Eck, n-Halbleiter, ...), ohne dass ich eine gute Trennmöglichkeit sehe. Insgesamt 150 Treffer. Mit Infobox Chemie noch 80 Treffer, davon aber 30 durch eine Navileiste bei der das sinnvoll ist. --mfb (Diskussion) Benutzer Diskussion:Mabschaaf/Quelltextfehler#c-Mfb-2014-12-10T16:19:00.000Z-#1211
- Letztere Treffen können ja mittels
chemi* insource:/[^(sleiste)] n-[A-Z]/
oder ähnlich entfernt werden. --Leyo Benutzer Diskussion:Mabschaaf/Quelltextfehler#c-Leyo-2014-12-10T17:54:00.000Z-Mfb-2014-12-10T16:19:00.000Z11- So funktionieren Charakterklassen ( [ ] ) nicht. Im Prinzip gibt es lookbehind dafür, aber das unterstützt die Suche wohl nicht. Was die Hilfe noch verrät:
< > "
haben besondere Funktionen.- Naja, das scheint nicht so schlecht zu passen. Publikationstitel kriegt man wohl fast nicht raus. --Leyo Benutzer Diskussion:Mabschaaf/Quelltextfehler#c-Leyo-2014-12-13T23:24:00.000Z-Leyo-2014-12-10T17:54:00.000Z11
- So funktionieren Charakterklassen ( [ ] ) nicht. Im Prinzip gibt es lookbehind dafür, aber das unterstützt die Suche wohl nicht. Was die Hilfe noch verrät:
zu allen
[Quelltext bearbeiten]Das einschränkende chemi*
oder insource:"{{Infobox Chemikalie"
sollte generell weggelassen werden, wenn dadurch keine Massen an false-positives entstehen.--Mabschaaf Benutzer Diskussion:Mabschaaf/Quelltextfehler#c-Mabschaaf-2014-12-10T16:33:00.000Z-zu allen11
- Teilweise kann ich mir diese Massen vorstellen, ansonsten ist es aber auch einfach schonender für den Server. Reguläre Ausdrücke auszuwerten kostet Zeit, wenn das nur für xx.xxx Chemie-Artikel geschehen muss ist das viel schneller als wenn es für 1,8 Millionen Artikel geschieht. --mfb (Diskussion) Benutzer Diskussion:Mabschaaf/Quelltextfehler#c-Mfb-2014-12-10T22:17:00.000Z-Mabschaaf-2014-12-10T16:33:00.000Z11