„Benutzer Diskussion:Uwe Martens/Archiv bis 28.05.2021“ – Versionsunterschied

aus Wikipedia, der freien Enzyklopädie
Letzter Kommentar: vor 3 Jahren von Uwe Martens in Abschnitt Diverse Anmerkungen
Zur Navigation springen Zur Suche springen
Inhalt gelöscht Inhalt hinzugefügt
Markierung: Zurückgesetzt
K →‎Diverse Anmerkungen: ach, eigentlich habe ich gar keine Lust mehr auf diese Diskussion - und das Leerzeichen ist mir auch egal ;)
Markierung: Manuelle Zurücksetzung
Zeile 193: Zeile 193:
::::: Ich werte die letzten Änderungen aus und lasse durch Perl-Scripte darin nach Fehlern suchen. Ich konzentriere mich dabei genau auf die Fehler, die eben kein Bot korrigieren kann, weil auffällige Stellen nicht immer wirklich falsch sind oder die Korrektur nicht eindeutig - der Rest wird eh schon lange von tatsächlichen Bots abgedeckt. Bei den Tippfehlern habe ich dir die Gründe ja oben verlinkt. Darum finde ich die Fehlerarten, nach denen ich suche - das ist sind mittlerweile ca. 100! -, regelmäßig und korrigiere sie, wenn ich Zeit habe - und das ist eben genau nicht rund um die Uhr. In der Tat versuche ich, das wenigstens ein Mal pro Tag zu machen, meist sogar zwei Mal, damit die Warteliste nicht zu lang wird. Das größte Problem ist hier nämlich, die Selbstmotivation aufrecht zu erhalten. Vielleicht sollte ich mal ein YouTube-Video machen, damit Leute wie du sehen, wie viel Aufwand da wirklich drin steckt, dann würdest du nicht so schlecht darüber reden. -- [[user:aka|aka]] 21:43, 24. Mai 2021 (CEST)
::::: Ich werte die letzten Änderungen aus und lasse durch Perl-Scripte darin nach Fehlern suchen. Ich konzentriere mich dabei genau auf die Fehler, die eben kein Bot korrigieren kann, weil auffällige Stellen nicht immer wirklich falsch sind oder die Korrektur nicht eindeutig - der Rest wird eh schon lange von tatsächlichen Bots abgedeckt. Bei den Tippfehlern habe ich dir die Gründe ja oben verlinkt. Darum finde ich die Fehlerarten, nach denen ich suche - das ist sind mittlerweile ca. 100! -, regelmäßig und korrigiere sie, wenn ich Zeit habe - und das ist eben genau nicht rund um die Uhr. In der Tat versuche ich, das wenigstens ein Mal pro Tag zu machen, meist sogar zwei Mal, damit die Warteliste nicht zu lang wird. Das größte Problem ist hier nämlich, die Selbstmotivation aufrecht zu erhalten. Vielleicht sollte ich mal ein YouTube-Video machen, damit Leute wie du sehen, wie viel Aufwand da wirklich drin steckt, dann würdest du nicht so schlecht darüber reden. -- [[user:aka|aka]] 21:43, 24. Mai 2021 (CEST)
::::::Ich rede nicht schlecht über Deine Arbeit (Bot-, Skript- oder wie auch immer unterstützt). Es ist halt einfach nur nicht möglich, 18 Jahre lang ununterbrochen im Druchschnitt alle 3 Minuten einen händischen Edit zu tätigen. Du machst das halt schon, seit Botflags noch nicht obligatorisch waren, und mir ist das eigentlich auch vollkommen egal, ob Du mit oder ohne Botflag arbeitest. Aber bitte, lade bitte ein Screen-Capture hoch! Hättest Du Dich mal lieber zu dem Leerzeichen geäußert. -- [[Benutzer:Uwe Martens|Uwe Martens]] ([[Benutzer Diskussion:Uwe Martens|Diskussion]]) 21:52, 24. Mai 2021 (CEST)
::::::Ich rede nicht schlecht über Deine Arbeit (Bot-, Skript- oder wie auch immer unterstützt). Es ist halt einfach nur nicht möglich, 18 Jahre lang ununterbrochen im Druchschnitt alle 3 Minuten einen händischen Edit zu tätigen. Du machst das halt schon, seit Botflags noch nicht obligatorisch waren, und mir ist das eigentlich auch vollkommen egal, ob Du mit oder ohne Botflag arbeitest. Aber bitte, lade bitte ein Screen-Capture hoch! Hättest Du Dich mal lieber zu dem Leerzeichen geäußert. -- [[Benutzer:Uwe Martens|Uwe Martens]] ([[Benutzer Diskussion:Uwe Martens|Diskussion]]) 21:52, 24. Mai 2021 (CEST)
::::::: Alle 3 Minuten (ich habe nicht nachgerechnet) klingt heftig, aber so arbeite ich ja gar nicht. Es sind eher 1 - 2 Stunden pro Tag, da aber natürlich so schnell und effektiv wie möglich. Und nur, weil du oder irgendwer etwas nicht für möglich hält, heißt das nicht, dass das auch unmöglich ist. Meiner Lebenserfahrung nach ist das oft nur ein Mangel an Vorstellungsvermögen und von zu engem Denken, aber das genaue Gegenteil bringt Projekte voran, inkl. diesem Ding namens Menschheit. Und es ist nicht nur so, dass ich hier schon ein paar Jahre mitmache - ich optimiere auch die ganze Zeit an dem, was ich tue, herum. Die Zusammenfassungszeile fülle ich z. B. nur höchst selten von Hand aus. Eigentlich bin ich nämlich auch etwas faul. Zum Leerzeichen: ich habe mir bisher nicht genau durchgelesen, um was es da überhaupt geht. -- Gruß, [[user:aka|aka]] 22:08, 24. Mai 2021 (CEST)

Version vom 24. Mai 2021, 22:11 Uhr


Pings und jegliche Systembenachrichtigungen für diesen Account sind deaktiviert


Für Fragen und Mitteilungen bitte diese Diskussionsseite bemühen, danke! -- Uwe Martens (Diskussion) Benutzer Diskussion:Uwe Martens/Archiv bis 28.05.2021#c-Uwe Martens-2021-05-13T08:21:00.000Z11Beantworten


Archivübersicht

CAS

Du hast hier die CAS von Antimon durch eine andere (die von Aluminium) ersetzt (bei Arsen auch). Bitte korrigieren und bei den nächsten Edits drauf aufpassen. --Orci Disk Benutzer Diskussion:Uwe Martens/Archiv bis 28.05.2021#c-Orci-2021-05-17T19:20:00.000Z-CAS11Beantworten

Klar, sorry, Moment! Ich korrigiere das gerade. -- Uwe Martens (Diskussion) Benutzer Diskussion:Uwe Martens/Archiv bis 28.05.2021#c-Uwe Martens-2021-05-17T19:24:00.000Z-Orci-2021-05-17T19:20:00.000Z11Beantworten

ChemID

Die Edits sehen bisher gut aus. Aber noch ein Hinweis: beim Namen in der ChemID-Vorlage werden kryptische Steuerzeichen (die aus irgendeinem Grund in der Chem-ID-Datenbank hinter dem Namen stehen) ergänzt (z.B. hier bei den Löslichkeitsangaben). Kannst Du den Bot so einstellen, dass er die ignoriert? --Orci Disk Benutzer Diskussion:Uwe Martens/Archiv bis 28.05.2021#c-Orci-2021-05-19T11:33:00.000Z-ChemID11Beantworten

Servus! Da hatte ich ja extra nachgefragt, und es kam keine Antwort. Deswegen habe ich das mit reingenommen. Kann ich aber auch weglassen. Keine Ahnung, was das bedeutet. Vermutlich deren Kategoriesystem. -- Uwe Martens (Diskussion) Benutzer Diskussion:Uwe Martens/Archiv bis 28.05.2021#c-Uwe Martens-2021-05-19T11:34:00.000Z-Orci-2021-05-19T11:33:00.000Z11Beantworten
Das ist dann in der Fülle der Themen einfach untergegangen. Ein Kategoriesystem könnte sein, es gibt aber auch Substanzen ohne diese Zeichen. Jedenfalls kann niemand hier was damit anfangen, also am Besten rauslassen. Der Parameter heißt ja auch "substance name" und ein Teil des Substanznamens ist "[USP:JAN]" mit Sicherheit nicht. --Orci Disk Benutzer Diskussion:Uwe Martens/Archiv bis 28.05.2021#c-Orci-2021-05-19T11:44:00.000Z-Uwe Martens-2021-05-19T11:34:00.000Z11Beantworten
Kein Problem, erledige ich gerade. Ich jage dann die betroffenen Artikel nochmal durch den Fleischwolf... 😆😆😆 PS: Alle Linktexte mit diesem Kat-Namen habe ich händisch, teils testweise mit dem Bot korrigiert. Lasse da wohl jetzt insgesamt nochmal ein paar Testedits laufen. -- Uwe Martens (Diskussion) Benutzer Diskussion:Uwe Martens/Archiv bis 28.05.2021#c-Uwe Martens-2021-05-19T14:02:00.000Z-Orci-2021-05-19T11:44:00.000Z11Beantworten

Da habe ich ein vom Bot verschlucktes Abrufdatum nachgetragen. --Leyo Benutzer Diskussion:Uwe Martens/Archiv bis 28.05.2021#c-Leyo-2021-05-19T21:03:00.000Z-ChemID11Beantworten

Danke! Gleiches bei Nicotinsäure, ich habe es aber revertiert, weil ich ja sonst den Bot nicht testen kann. Ich kümmere mich später darum.
PS: Hatte ich vergessen, eine Variable mit ins Ausgabe-Array zu geben, ist erledigt. Testedits sind durchgelaufen. -- Uwe Martens (Diskussion) Benutzer Diskussion:Uwe Martens/Archiv bis 28.05.2021#c-Uwe Martens-2021-05-20T00:10:00.000Z-Leyo-2021-05-19T21:03:00.000Z11Beantworten
 Info: Ich wollte hier übrigens nochmal anmerken (wie auf der To do list auf der Bot-Disk angeführt), daß ich (selbstverständlich) auch die Vorlage:ChemID auf Erreichbarkeit des CAS-Links teste und dann ggf. den Parameter "KeinCASLink=1" setze. Jedenfalls hatte ich das als selbstverständlich vorausgesetzt. Dieser Parameter ist allerdings in der Vorlage noch gar nicht implementiert. Bei rund 800 der bereits bearbeiteten Artikel ist das allerdings auch nicht vorgekommen. Hier sollte man vielleicht mal abwarten und schauen, wie viele Artikel betroffen sind? Wenn so ein Fall auftritt, dann jedenfalls bitte erst mal nicht gleich revertieren! -- Uwe Martens (Diskussion) Benutzer Diskussion:Uwe Martens/Archiv bis 28.05.2021#c-Uwe Martens-2021-05-21T21:22:00.000Z-Uwe Martens-2021-05-20T00:10:00.000Z11Beantworten
Die Vorlage:ChemID verlinkt ja nicht auf die Common Chemistry Database (CCD) - eine Linkprüfung dorthin ist daher überflüssig. Das Nichtvorhandensein einer CAS-Nummer in der CCD besagt zudem nichts über die Existenz der CAS-Nummer an sich und nichts über das Vorhandensein eines Eintrags in der ChemIDplus-Datenbank.--Mabschaaf Benutzer Diskussion:Uwe Martens/Archiv bis 28.05.2021#c-Mabschaaf-2021-05-22T05:56:00.000Z-Uwe Martens-2021-05-21T21:22:00.000Z11Beantworten
Ähm, ja. Es wird natürlich nicht der CAS-Eintrag an sich geprüft, sondern die Erreichbarkeit des ChemIDplus-Eintrages (der aber ja von der CAS-Nummer bestimmt wird). Ich lasse die Prüfung jedenfalls mal weiterlaufen und ändere den ggf. zu setzenden Parameternamen auf "KeinChemIDLink=1". Dann kann man ggf. immer noch sehen, ob man das im Artikel wieder löscht oder die Vorlage erweitert. -- Uwe Martens (Diskussion) Benutzer Diskussion:Uwe Martens/Archiv bis 28.05.2021#c-Uwe Martens-2021-05-22T14:38:00.000Z-Mabschaaf-2021-05-22T05:56:00.000Z11Beantworten

Sigma-Aldrich

Noch ein Hinweis, der mir bei Serotonin aufgefallen ist: Du hast zwar bei der Römpp-Vorlage korrekt Datum gegen Abruf ersetzt, allerdings bei der Vorlage:Sigma-Aldrich nur den Abruf als leeren Parameter ergänzt und nicht den Datums-Parameter ersetzt. --Orci Disk Benutzer Diskussion:Uwe Martens/Archiv bis 28.05.2021#c-Orci-2021-05-19T11:50:00.000Z-Sigma-Aldrich11Beantworten

Und noch ein Hinweis zur Datum/Abruf-Ersetzung: Hier hat die Ersetzung in der Römpp-Vorlage nicht geklappt. --Orci Disk Benutzer Diskussion:Uwe Martens/Archiv bis 28.05.2021#c-Orci-2021-05-19T12:02:00.000Z-Sigma-Aldrich11Beantworten

Danke für den Hinweis! In beiden Fällen hat das Suchmuster nicht angesprochen. Ich kümmere mich darum. -- Uwe Martens (Diskussion) Benutzer Diskussion:Uwe Martens/Archiv bis 28.05.2021#c-Uwe Martens-2021-05-19T12:13:00.000Z-Orci-2021-05-19T12:02:00.000Z11Beantworten
Beim Kokain sieht es jetzt gut aus, allerdings hat der Bot in die Sigma-Aldrich-Vorlage zwei || hintereinander eingefügt, was eine Fehlermeldung ergibt. --Orci Disk Benutzer Diskussion:Uwe Martens/Archiv bis 28.05.2021#c-Orci-2021-05-19T12:17:00.000Z-Uwe Martens-2021-05-19T12:13:00.000Z11Beantworten
Ok, ist wieder behoben. Das Suchmuster für das Datum mußte ich nochmal anpassen. Das hatte mal alles funktioniert, bis ein "März" dabei war. Umlaute werden extra behandelt. Dann hatte ich ein Such-Array mit dem ä eingefügt, was offenbar zu fehleranfällig war. Also jetzt aber dann... -- Uwe Martens (Diskussion) Benutzer Diskussion:Uwe Martens/Archiv bis 28.05.2021#c-Uwe Martens-2021-05-19T13:27:00.000Z-Orci-2021-05-19T12:17:00.000Z11Beantworten
Das doppelte Pipe kommt noch öfter vor, z.B. in Gift, Adrenalin und Eisen(III)-chlorid.--Mabschaaf Benutzer Diskussion:Uwe Martens/Archiv bis 28.05.2021#c-Mabschaaf-2021-05-19T18:45:00.000Z-Orci-2021-05-19T12:02:00.000Z11Beantworten
Oha, na Du hast ja genau hingeschaut! ;-) Bei Eisen(III)-chlorid kann ich nichts finden. Aber ich behebe das noch, danke für Deine Aufmerksamkeit! PS: Also hab's auch bei Eisen(III)-chlorid gefunden. Der Fehler in der Vorlage:RömppOnline war noch von einem Testedit heute um 13:13 Uhr, den Datumsfehler (und damit den nachfolgenden Sortierfehler) habe ich ja zwischenzeitlich schon behoben, wie vorstehend ersichtlich. Vorlage:Alfa wird zusammen mit Vorlage:Sigma-Aldrich sortiert, da war bei einer Array-Zusammenführung ein Trennstrich zu viel. Grüße, Uwe Martens (Diskussion) Benutzer Diskussion:Uwe Martens/Archiv bis 28.05.2021#c-Uwe Martens-2021-05-19T20:49:00.000Z-Mabschaaf-2021-05-19T18:45:00.000Z11Beantworten

CAS-Nummern

Spezial:Diff/211564849/212153940 - Da hast Du ein paar CAS-Nummern nicht gefunden - was aber nicht wirklich verwundert. Interessante Formatierungsvariante....tststs--Mabschaaf Benutzer Diskussion:Uwe Martens/Archiv bis 28.05.2021#c-Mabschaaf-2021-05-20T14:39:00.000Z-CAS-Nummern11Beantworten

Servus! Das wollte ich eh noch fragen, was das da zu bedeuten hat! 😆😆😆 Grüße, Uwe Martens (Diskussion) Benutzer Diskussion:Uwe Martens/Archiv bis 28.05.2021#c-Uwe Martens-2021-05-20T14:54:00.000Z-Mabschaaf-2021-05-20T14:39:00.000Z11Beantworten
Naja, Zweck ist eine Einrückung (vertikales Alignment). Immer wieder spannend, was sich die Autoren alles einfallen lassen.--Mabschaaf Benutzer Diskussion:Uwe Martens/Archiv bis 28.05.2021#c-Mabschaaf-2021-05-21T09:27:00.000Z-Uwe Martens-2021-05-20T14:54:00.000Z11Beantworten

Noch eine Frage zum API-CAS-Call: „Siehst“ Du eigentlich einen Unterschied beim Aufruf von CAS-Nummern, die nur als Weiterleitung auf eine andere Seite existieren (z.B. leitet 7488-70-2 auf 51-48-9 weiter)? Falls ja, wäre eine Wartungsliste aller Nummern, die nur Weiterleitungen sind (ggf. mit dem Lemma, aus dem sie aufgerufen werden und dem Weiterleitungsziel) für eine anschließende Nachkontrolle mM sehr nützlich.--Mabschaaf Benutzer Diskussion:Uwe Martens/Archiv bis 28.05.2021#c-Mabschaaf-2021-05-21T09:27:00.000Z-CAS-Nummern11Beantworten

Also der API-Call 51-48-9 ergibt exakt das gleiche, wie der API-Call 7488-70-2. Im HTTP-Header finden sich auch bei beiden Malen Statuscode 200, so daß man auch hier nicht unterscheiden kann. Allerdings könnte ich natürlich die RN, hier "51-48-9", extrahieren und mit dem Match aus dem Wikiquelltext abgleichen. Stimmen sie nicht überein, handelt es sich um eine Umleitung. Die Anfrage kommt aber reichlich spät, da ich dann die bisher rund 2500 abgefragten bzw. 800 bearbeiteten Artikel nochmal durchlaufen lassen müßte. Aber PS: Meinetwegen implementiere ich das noch, dann wird aus den API-Calls wenigstens noch ein inhaltlicher Nutzen gezogen. Die CAS-Nummer wäre dann aber im Wikiquelltext durch die neue Nummer zu ersetzen, nehme ich an? -- Uwe Martens (Diskussion) Benutzer Diskussion:Uwe Martens/Archiv bis 28.05.2021#c-Uwe Martens-2021-05-21T10:57:00.000Z-Mabschaaf-2021-05-21T09:27:00.000Z11Beantworten
Tja, sorry, ist mir eben erst aufgefallen, dass wir wohl tw. veraltete Nummern wiedergeben. Andererseits sind die vermutlich noch weit verbreitet. Daher auch die Frage nach einer Wartungsliste. Automatische Ersetzung in den Artiklen soll auf keinen Fall vorgenommen werden. Dazu muss sich Mensch den Kontext anschauen und ggf. in den Boxen die veralteten Nummern noch beibehalten, aber entsprechend kennzeichnen.
Bei den letzten Änderungen Deines Bots, die ich über meine Beo bekommen habe, konnte ich übrigens keinen einzigen Fehler mehr finden. Sehr gute Arbeit!--Mabschaaf Benutzer Diskussion:Uwe Martens/Archiv bis 28.05.2021#c-Mabschaaf-2021-05-21T11:23:00.000Z-Uwe Martens-2021-05-21T10:57:00.000Z11Beantworten
Danke! So diverse Flüchtigkeitsfehler im Skript waren ja noch zu beheben, manche Eventualitäten im Wikiquelltext zu bedenken. Also bez. Weiterleitungen: Ich könnte die neue CAS-Nummer in Klammern dahinter schreiben. Ansonsten kann ich diese Nummern zusammen mit dem Lemma in eine CSV-Datei schreiben zur weiteren Verwendung, auch kein Problem. Ich hätte ja dazu tendiert, die CAS-Nummer gleich zu ersetzen, in diesem Falle könnte man die betreffende Nummer in der Zusammenfassung als geändert anführen. Auch die Zusammenfassung kann dynamisch gestaltet werden. -- Uwe Martens (Diskussion) Benutzer Diskussion:Uwe Martens/Archiv bis 28.05.2021#c-Uwe Martens-2021-05-21T11:30:00.000Z-Mabschaaf-2021-05-21T11:23:00.000Z11Beantworten
Ich wäre für das Sammeln. Dürfte am einfachsten sein und es kann auch passieren, dass sowohl eine veraltete als auch die aktuelle CAS im Artikel steht und man nur die alte löschen muss. War mir bei 2,5-Dimethoxy-4-bromamphetamin aufgefallen. --Orci Disk Benutzer Diskussion:Uwe Martens/Archiv bis 28.05.2021#c-Orci-2021-05-21T12:15:00.000Z-Uwe Martens-2021-05-21T11:30:00.000Z11Beantworten
Ja, wir müssten erst mal eine Ahnung von den Dimensionen bekommen: Sind das 3, 30 oder 300 betroffene Nummern? Anschließend ist vermutlich eine Diskussion in der RC fällig, wie wir damit umgehen - löschen, Klammerzusatz, auskommentieren mit Bemerkung, ... --Mabschaaf Benutzer Diskussion:Uwe Martens/Archiv bis 28.05.2021#c-Mabschaaf-2021-05-21T12:23:00.000Z-Orci-2021-05-21T12:15:00.000Z11Beantworten
Ja, gut, dann machen wir es so (als Vorschlag): Wenn eine CAS-Nummer umgeleitet wird, ergänze ich das als Hinweis in der Zusammenfassung, aber im Wikiquelltext bleibt die alte Nummer. Zusätzlich schreibe ich diese Weiterleitungen in eine CSV. PS: Habe ich jetzt so implementiert, waren 7 Zeilen weiterer Code, also keine große Sache. Ich lasse den Bot dann halt nochmal von Vorne laufen, wir werden ja sehen, ob es da viele Treffer gibt. Im Laufe des Abends dann bitte. Grüße, Uwe Martens (Diskussion) Benutzer Diskussion:Uwe Martens/Archiv bis 28.05.2021#c-Uwe Martens-2021-05-21T18:10:00.000Z-Mabschaaf-2021-05-21T12:23:00.000Z11Beantworten
PPS: Ich wollte darauf hinweisen, daß Redirects aus bisher abgearbeiteten Artikeln jetzt natürlich nicht in der Zusammenfassung angezeigt werden, da vermutlich keine Änderung an den betroffenen Artikeln mehr vorgenommen wird, wie gewünscht. Diese Artikel werden daher ausschließlich in der CSV gelistet. Die sich aktuell im Zweitdurchlauf ergebenden kosmetischen Leerzeichenentfernungen sind leider unvermeidlich, da ich sie nachträglich (während der vorherigen Testläufe) als zwingend implementieren mußte, um die anschließende Datumsauswertung durchzuführen. -- Uwe Martens (Diskussion) Benutzer Diskussion:Uwe Martens/Archiv bis 28.05.2021#c-Uwe Martens-2021-05-21T20:03:00.000Z-Mabschaaf-2021-05-21T12:23:00.000Z11Beantworten

Spezial:Diff/212182337 - damit gibt es ein Problem, weil versucht wird, einen weiteren Link im Linktext zu erzeugen.--Mabschaaf Benutzer Diskussion:Uwe Martens/Archiv bis 28.05.2021#c-Mabschaaf-2021-05-21T15:49:00.000Z-CAS-Nummern11Beantworten

Ok, vielen Dank für den Hinweis! Ich hatte gehofft, daß solche Eventualitäten nicht auftauchen würden, aber ich werde da noch eine weitere Prüfroutine (so, wie bei den Dateinamen) dazu nehmen. -- Uwe Martens (Diskussion) Benutzer Diskussion:Uwe Martens/Archiv bis 28.05.2021#c-Uwe Martens-2021-05-21T16:49:00.000Z-Mabschaaf-2021-05-21T15:49:00.000Z11Beantworten

Spezial:Diff/211057161/212208557 - Da wurden hinter der neu eingefügten Vorlage bei CAS 2437-95-8 und 23089-32-9 die Leerzeichen geschluckt; CAS 127-91-3 wurde nicht gefunden. Übrigens, falls Du Lust auf noch mehr Code-Zeilen hast: vorhandene Leerzeilen am Artikelanfang könnten auch entfernt werden (kommen durch einen Visual Editor Bug rein).--Mabschaaf Benutzer Diskussion:Uwe Martens/Archiv bis 28.05.2021#c-Mabschaaf-2021-05-22T06:11:00.000Z-CAS-Nummern11Beantworten

Hm, guten Morgen und danke mal wieder für den Review! Das mit den Leerzeichen muß ich eruieren, das mit der nicht gefundenen CAS-Nummer ist klar: Sie steht nicht frei im Quelltext, sondern direkt hinter einem br-Tag. Ich will mal schauen, ob ich für diese hoffentlich sehr seltene Eventualität eine Lösung finde. Eine Leerzeile am Anfang eines Artikels filtere ich doch bereits seit geraumer Zeit. Sollte es Fälle von mehreren Leerzeilen am Anfang geben, muß ich die Routine im Skript wiederholen. Grüße, Uwe Martens (Diskussion) Benutzer Diskussion:Uwe Martens/Archiv bis 28.05.2021#c-Uwe Martens-2021-05-22T08:14:00.000Z-Mabschaaf-2021-05-22T06:11:00.000Z11Beantworten
erledigtErledigt Also das mit den verschluckten Leerzeichen ist behoben, das mit dem br-Tag ist nun als mögliche zulässige Variante mit eingeschlossen. -- Uwe Martens (Diskussion) Benutzer Diskussion:Uwe Martens/Archiv bis 28.05.2021#c-Uwe Martens-2021-05-22T09:54:00.000Z-Mabschaaf-2021-05-22T06:11:00.000Z11Beantworten

Umleitungen

Die folgenden CAS-Nummern, die bisher nicht in der Zusammenfassungszeile angezeigt, aber umgeleitet werden, sind:

Lemma Aktuelle Nr. Umleitungsziel
Fructose 6035-50-3 30237-26-4
Limonen 7705-14-8 138-86-3
Fluoxetin 59333-67-4 56296-78-7
Glucosamin 28905-10-4 14257-69-3
Kältemittel 134237-37-9 422-52-6
Kältemittel 134237-38-0 422-54-8
Kältemittel 134308-72-8 431-87-8
Thyroxin 7488-70-2 51-48-9

Das sind also die Treffer bis ca. Artikel Nr. 2350 (von insg. 34.769) aus der Datenbank bzw. nach rund 800 bearbeiteten Artikeln.

-- Uwe Martens (Diskussion) Benutzer Diskussion:Uwe Martens/Archiv bis 28.05.2021#c-Uwe Martens-2021-05-21T23:27:00.000Z-Umleitungen11Beantworten

Statistik

Aus bisher 3450 Artikeln aus der Datenbank wurden 1178 bearbeitet, das sind also bisher 10 % des zu prüfenden Artikelbestandes bzw. sind statistisch 34% vom Artikelbestand (oder hochgerechnet 11.871 Artikel) zu bearbeiten. Dabei wurden hier (mit den im Abschnitt drüber bereits genannten) CAS-Nummern insg. 16 umgeleitet, hochgerechnet wären es also 160 zu erwartende Umleitungen:

Lemma Aktuelle Nr. Umleitungsziel
Fructose 6035-50-3 30237-26-4
Limonen 7705-14-8 138-86-3
Fluoxetin 59333-67-4 56296-78-7
Glucosamin 28905-10-4 14257-69-3
Kältemittel 134237-37-9 422-52-6
134237-38-0 422-54-8
134308-72-8 431-87-8
Thyroxin 7488-70-2 51-48-9
Glutamin 585-21-7 6899-04-3
4-Methoxyamphetamin 52740-56-4 3706-26-1
Pinene 2437-95-8 80-56-8
23089-32-9 127-91-3
Aluminiumhydroxychlorid 84861-98-3 1327-41-9
11097-68-0 1327-41-9
Polyvinylfluorid 95508-16-0 24981-14-4
Metoprolol 37350-58-6 51384-51-1

-- Uwe Martens (Diskussion) Benutzer Diskussion:Uwe Martens/Archiv bis 28.05.2021#c-Uwe Martens-2021-05-22T01:11:00.000Z-Statistik11Beantworten

Moin, moin, Uwe, wenn ich nochmal eine Umleitung beim Überprüfen entdecke, wo soll ich das dann melden? Hier in diesem Abschnitt? Viele Grüße -- (Diskussion) Benutzer Diskussion:Uwe Martens/Archiv bis 28.05.2021#c-Jü-2021-05-22T08:18:00.000Z-Uwe Martens-2021-05-22T01:11:00.000Z11Beantworten
Servus! Sehr gerne, so denn mein Bot einmal Schluckauf haben sollte... 😁😁😁 Die komplette Liste der Umleitungen werde ich dann (nach Abschluß des Botlaufs) eh vermultich in der Redaktion Chemie posten. Grüße, Uwe Martens (Diskussion) Benutzer Diskussion:Uwe Martens/Archiv bis 28.05.2021#c-Uwe Martens-2021-05-22T08:28:00.000Z-Jü-2021-05-22T08:18:00.000Z11Beantworten

Strukturformel(n)

Moin, moin, auf der Seite Fenchole werden durch den Bot mehrere Strukturformeln nicht mehr angezeigt. Kannst Du das bitte reparieren? Viele Grüße -- (Diskussion) Benutzer Diskussion:Uwe Martens/Archiv bis 28.05.2021#c-Jü-2021-05-22T14:46:00.000Z-Strukturformel(n)11Beantworten

Ja also tut mir leid, weiß ich auch nicht, wie ich sowas handhaben soll! Wenn da freistehende CAS-Nummern mitten im Dateinamen stehen, dann interpretiert der Bot das eben als freistehende CAS-Nummer. CAS-Nummern mit Dateiendungen habe ich bereits gefiltert, aber sowas hier wäre mit einem verhältnismäßigen Programmieraufwand nur zu beheben, indem ich die Leerzeichen in Dateinamen grundsätzlich vorab durch Unterstriche ersetze, zumindest, wenn diese eine CAS-Nummer beinhalten. -- Uwe Martens (Diskussion) Benutzer Diskussion:Uwe Martens/Archiv bis 28.05.2021#c-Uwe Martens-2021-05-22T15:27:00.000Z-Jü-2021-05-22T14:46:00.000Z11Beantworten
erledigtErledigt Ok, das habe ich jetzt so umgesetzt, und damit Aka dann nicht wieder mit seinem Bot hinterher kommt, und den Dateinamen in alter Manie zurück umbenennt, habe ich das am Ende der ganzen Routine ebenfalls bereits selber getan. Testedits folgen. -- Uwe Martens (Diskussion) Benutzer Diskussion:Uwe Martens/Archiv bis 28.05.2021#c-Uwe Martens-2021-05-22T16:07:00.000Z-Jü-2021-05-22T14:46:00.000Z11Beantworten

Q0

Hallo Uwe, ich denke, die Angabe von „Q0“ (hastemplate:CASRN insource:/\|Q0/) ist nicht so gewollt. Magst du mal schauen? --Leyo Benutzer Diskussion:Uwe Martens/Archiv bis 28.05.2021#c-Leyo-2021-05-20T21:20:00.000Z-Q011Beantworten

Guten Abend! Doch, das war der Vorschlag von Deinem Kollegen. Wenn es keine Q-Nummer gibt, dann Q0 als Wert (außer, die CAS-Nummer entspricht der Q-Nummer des Lemmas natürlich). Ich ging davon aus, daß dem von allen Beteiligten stillschweigend zugestimmt wurde? -- Uwe Martens (Diskussion) Benutzer Diskussion:Uwe Martens/Archiv bis 28.05.2021#c-Uwe Martens-2021-05-20T21:22:00.000Z-Leyo-2021-05-20T21:20:00.000Z11Beantworten
Okay, bei den „Diskussionskilometern“ hatte ich dies übersehen. Selbsterklärend ist „Q0“ als Platzhalter nicht gerade, aber mir fällt gegenwärtig keine bessere (selbsterklärend und kurz) Alternative ein. --Leyo Benutzer Diskussion:Uwe Martens/Archiv bis 28.05.2021#c-Leyo-2021-05-20T21:32:00.000Z-Uwe Martens-2021-05-20T21:22:00.000Z11Beantworten
Q als Bezeichner und 0 für "nicht vorhanden" ist doch ganz gut. Wohl für die Vorlagenauswertung dann. -- Uwe Martens (Diskussion) Benutzer Diskussion:Uwe Martens/Archiv bis 28.05.2021#c-Uwe Martens-2021-05-20T21:34:00.000Z-Leyo-2021-05-20T21:32:00.000Z11Beantworten

Sprache

Die Entfernung von sprache=de funktioniert öfter nicht korrekt: Spezial:Diff/212221073/212225164, Spezial:Diff/212210096/212224216.

Und hier noch ein Datumsfehler: Spezial:Diff/212208912/212224415. Kontrollierst Du die Edits beim Sichten eigentlich nicht selbst?--Mabschaaf Benutzer Diskussion:Uwe Martens/Archiv bis 28.05.2021#c-Mabschaaf-2021-05-22T13:44:00.000Z-Sprache11Beantworten

Das hier und das hier war kein Botfehler, sondern ein bereits vorher existierender Fehler. Und jein, natürlich prüfe ich bei 1500 Edits nicht jedes einzelne Byte, sondern nur auf augenscheinliche Auffälligkeiten. Dieser Fehler ist auch das erste Mal aufgetreten, was daran liegt, daß hier die Vorlage wieder nicht richtig verwendet wird. Da z.B. die Vorlage Substanzinfo hingegen durchgehend mit Leerzeichen verwendet wird, habe ich grundsätzlich nur die Vorlagen einer Leerzeichenentfernung unterzogen, wo die willkürliche Verwendung von Leerzeichen zu Fehlern führt. Diese zwei neuerlichen Vorlagen werde ich dem also auch hinzufügen. -- Uwe Martens (Diskussion) Benutzer Diskussion:Uwe Martens/Archiv bis 28.05.2021#c-Uwe Martens-2021-05-22T14:21:00.000Z-Mabschaaf-2021-05-22T13:44:00.000Z11Beantworten

Falsch-positive und falsch-negative

In Spezial:Diff/212210126 wurden nur CAS-Nummern in Weblinkbeschriftungen erkannt und fälschlicherweise in die Vorlage gepackt. Umgekehrt wurden die CAS-Nummern in der Tabelle nicht erkannt … --Leyo Benutzer Diskussion:Uwe Martens/Archiv bis 28.05.2021#c-Leyo-2021-05-22T19:06:00.000Z-Falsch-positive und falsch-negative11Beantworten

Danke für den Review! Das sind halt mal wieder Eventualitäten, auf die meine Suchmuster nicht ausgelegt sind. Bez. der Tabelle werde ich da ein weiteres Suchmuster ergänzen. Aber dann wieder mal freistehende CAS-Nummern in ewig langen Textlegenden eines Einzelnachweises, die Du anno 2009 so aus der EN:WP hierher kopiert hast. Sowas ist hierzupedia unüblich und das sollte man mal lieber auf unseren Stand bringen. Ehrlich gesagt ist das Aufwand-Nutzen-Verhältnis an diesem Punkt deutlich aus dem Gleichgewicht geraten, wenn ich jetzt auch noch anfangen muß, den Quelltext in Teile zu zerschnibbeln, um jede einzelne Eventualität abzudecken. Es wird langsam zu einem Fulltime-Job hier! Also bitte mal abwägen, ob sich das lohnt, sich da programmiertechnisch noch groß Gedanken zu machen um derartige Auswüchse! -- Uwe Martens (Diskussion) Benutzer Diskussion:Uwe Martens/Archiv bis 28.05.2021#c-Uwe Martens-2021-05-22T19:29:00.000Z-Leyo-2021-05-22T19:06:00.000Z11Beantworten
„anno 2009 so aus der EN:WP hierher kopiert“? Die Dokumente sind doch von 2015, 2017 bzw. 2019 …
Die CAS-Nummern stehen halt in den Titeln der Dokumente. Kann dein Bot nicht alles zwischen [http und der nächsten ] ignorieren? --Leyo Benutzer Diskussion:Uwe Martens/Archiv bis 28.05.2021#c-Leyo-2021-05-22T19:46:00.000Z-Uwe Martens-2021-05-22T19:29:00.000Z11Beantworten
Naja, ob ich jetzt die Ref-Tags oder die HTTP-Klammern ausschließe, macht technisch keinen Unterschied. Aber da kann es sein, daß ich einen Quelltext in hundert Teile zerschnibbeln muß. Ich wollte mal ganz am Rande anmerken, daß wir jetzt bereits rund 5500 von 34.769 Artikeln abgearbeitet haben, das sind rund 15%. Wenn da mal was nicht paßt, könnte man ja nötigenfalls auch mal händisch nachbessern. Aber nun denn: eher mache ich es so, daß ich alle Leerzeichen aus solchen Linktexten vor der Abarbeitungsroutine mit einer definierten Zeichenkette ersetze, die ich am Ende mit getauschten Arrays zurück ersetze. So habe ich es (wie oben beschrieben) mit den Dateinamen auch gemacht und das ist der einzige zeitmäßig praktikable Workaround. Testedit folgt. -- Uwe Martens (Diskussion) Benutzer Diskussion:Uwe Martens/Archiv bis 28.05.2021#c-Uwe Martens-2021-05-22T19:56:00.000Z-Leyo-2021-05-22T19:46:00.000Z11Beantworten
erledigtErledigt Ok, ist mit 2 x 10 Zeilen Code erledigt. Das Suchmuster für die Tabelle ergänze ich noch. -- Uwe Martens (Diskussion) Benutzer Diskussion:Uwe Martens/Archiv bis 28.05.2021#c-Uwe Martens-2021-05-22T20:16:00.000Z-Leyo-2021-05-22T19:46:00.000Z11Beantworten
Danke! --Leyo Benutzer Diskussion:Uwe Martens/Archiv bis 28.05.2021#c-Leyo-2021-05-22T21:00:00.000Z-Uwe Martens-2021-05-22T20:16:00.000Z11Beantworten
Kein Problem. Das Suchmuster für die Tabelle muß ich noch nachbessern, da das dann bei ISBN-Nummern zu Konflikten geführt hat. Aber ist auch keine große Sache. -- Uwe Martens (Diskussion) Benutzer Diskussion:Uwe Martens/Archiv bis 28.05.2021#c-Uwe Martens-2021-05-22T21:12:00.000Z-Leyo-2021-05-22T21:00:00.000Z11Beantworten

Diverse Anmerkungen

Spezial:Diff/207009225/212244316 - Hier wurde Vorlage:CASRN in Vorlage:Substanzinfo eingefügt.

Spezial:Diff/212230584/212245866 - Meldung über Weiterleitung ist doppelt in der ZQ --Mabschaaf Benutzer Diskussion:Uwe Martens/Archiv bis 28.05.2021#c-Mabschaaf-2021-05-23T07:16:00.000Z-Diverse Anmerkungen11Beantworten

Danke für den Review, der doppelte Hinweis kommt von der doppelten Routine, die ich für sich überschneidende Suchmuster eingeführt habe. Werde ich filtern. Die Vorlage:Substanzinfo wurde da ja wieder nicht korrekt verwendet. Ich werde nunmehr alle verbleibenden Vorlagen zumindest einer teilweisen Leerzeichenentfernung unterziehen, also etwaige Leerzeichen zwischen "=" und dem Parameter. Die jeweils rechten Leerzeichen würde ich zumindest in so umfangreichen Vorlagen belassen, der Übersichtlichkeit wegen. -- Uwe Martens (Diskussion) Benutzer Diskussion:Uwe Martens/Archiv bis 28.05.2021#c-Uwe Martens-2021-05-23T11:02:00.000Z-Mabschaaf-2021-05-23T07:16:00.000Z11Beantworten

Testbenzin dürfte die perfekte Seite zur Optimierung der Erkennungsroutine von CAS-Nummern sein. Frag mich jetzt lieber nicht zu meiner Meinung bezüglich maximaler Quelltextverkomplizierung.--Mabschaaf Benutzer Diskussion:Uwe Martens/Archiv bis 28.05.2021#c-Mabschaaf-2021-05-23T17:34:00.000Z-Diverse Anmerkungen11Beantworten

Au weiha! Ich sehe schon, da sind   Zeichen vor der CAS-Nummer! Schon wieder eine "böse" Überraschung! Ich bin noch nicht mal dazu gekommen, obige Updates einzupflegen, bin dieser Tage ziemlich beschäftigt. Ich schmeiße aber zu später Stunde dann mal wieder den Bot an für einen Testlauf. -- Uwe Martens (Diskussion) Benutzer Diskussion:Uwe Martens/Archiv bis 28.05.2021#c-Uwe Martens-2021-05-23T20:01:00.000Z-Mabschaaf-2021-05-23T17:34:00.000Z11Beantworten

Da ordnete dein Bot eine Klammer der CAS-Nr. zu. --Leyo Benutzer Diskussion:Uwe Martens/Archiv bis 28.05.2021#c-Leyo-2021-05-23T20:13:00.000Z-Diverse Anmerkungen11Beantworten

Ok, danke! Das kommt alles von den ständigen Einpflegungen neuer Eventualitäten (und PHP hat übrigens doch ein chronisches Problem mit Leerzeichen oder Zeilenumbrüchen am Anfang eines zu prüfenden Strings). Ich werde aber die Ausschluß-Muster eh nochmal umstellen auf Zeichenersetzung via Arrays (so, wie ich es bei den Dateinamen und den Link-Legenden umgesetzt habe), dann sind solche Fehler künftig ausgeschlossen und der Code wird auch wesentlich einfacher. Ich werd aber wohl heut nicht mehr dazu kommen, also bitte eher morgen im Laufe des Tages dann. -- Uwe Martens (Diskussion) Benutzer Diskussion:Uwe Martens/Archiv bis 28.05.2021#c-Uwe Martens-2021-05-23T21:03:00.000Z-Leyo-2021-05-23T20:13:00.000Z11Beantworten
Danke für die Rückmeldung. Eilen tut's ja nicht speziell.
Deine Anpassung beim gemeldeten Fehler verstehe nicht bzw. ich halte sie für falsch. --Leyo Benutzer Diskussion:Uwe Martens/Archiv bis 28.05.2021#c-Leyo-2021-05-23T21:17:00.000Z-Uwe Martens-2021-05-23T21:03:00.000Z11Beantworten
Ja, sorry, da hatte ich den Diff von Dir geöffnet und dann offenbar die alte Version korrigiert (was Du aber ja schon vorgenommen hast). Natürlich war die Klammer auch im Match und deswegen wurde keine existierende CAS-Nummer erkannt. -- Uwe Martens (Diskussion) Benutzer Diskussion:Uwe Martens/Archiv bis 28.05.2021#c-Uwe Martens-2021-05-24T04:42:00.000Z-Leyo-2021-05-23T21:17:00.000Z11Beantworten

Nachdem ich ja nun auch das   vor einer CAS-Nummer abhandle, wäre die Frage, ob ich Leerzeichen vor einer CAS-Nummer nicht generell durch das No-Break-Whitespace ersetze? Gibt ja solche Fanatiker, auch der Bot von Aka ersetzt diese zwischen zusammengehörigen Strings. Ich bin allerdings kein Fan davon und halte es für unnötig. Allerdings will ich tunlichst vermeiden, daß dann ein anderer Bot hinterher editiert. Bitte andere Meinungen, thx! -- Uwe Martens (Diskussion) Benutzer Diskussion:Uwe Martens/Archiv bis 28.05.2021#c-Uwe Martens-2021-05-24T18:36:00.000Z-Diverse Anmerkungen11Beantworten

Ich habe keinen Bot für meine Korrekturen, siehe bitte Benutzer:Aka/Tippfehler entfernt. Könntest du bitte aufhören, so etwas zu behaupten und mich dabei auch noch ständig anzupingen? Danke! -- aka Benutzer Diskussion:Uwe Martens/Archiv bis 28.05.2021#c-Aka-2021-05-24T18:40:00.000Z-Uwe Martens-2021-05-24T18:36:00.000Z11Beantworten
Ok, 3 Millionen Bearbeitungen, so daß es nicht mal mehr der Toolserver anzeigen kann, alles in händischer Fleißarbeit und "teilweise mit der Unterstützung einiger Zeilen Perl" - wie aufschlußreich! Gut, mein Bot ist eigentlich auch kein Bot, ich mache das alles ebenfalls in händischer Fleißarbeit, teilweise mit der Unterstützung einiger Zeilen PHP! 🤣🤣🤣🤣 -- Uwe Martens (Diskussion) Benutzer Diskussion:Uwe Martens/Archiv bis 28.05.2021#c-Uwe Martens-2021-05-24T19:04:00.000Z-Aka-2021-05-24T18:40:00.000Z11Beantworten
Nicht jedes Programm, dass bei der Suche nach Fehlern oder der Korrektur dieser hilft, ist ein Bot. Wikipedia:AutoWikiBrowser würdest du vermutlich auch nicht als Bot bezeichnen. Die 3 Millionen Bearbeitungen verteilen sich übrigens auf mehr als 18 Jahre Mitarbeit hier. Und der Toolserver ist ein Schlaffi, dafür kann ich aber nichts ;-) -- aka Benutzer Diskussion:Uwe Martens/Archiv bis 28.05.2021#c-Aka-2021-05-24T19:17:00.000Z-Uwe Martens-2021-05-24T19:04:00.000Z11Beantworten
Ok, das sind ja nur 166.666 Edits im Jahr, rund um die Uhr, stets prompt nach geänderten Artikeln, und davon 10 Edits pro Minute. Nee, aber natürlich kein Bot, schon klar! Das ist hierzupedia wohl eher wie mit des Kaisers neuen Kleidern! -- Uwe Martens (Diskussion) Benutzer Diskussion:Uwe Martens/Archiv bis 28.05.2021#c-Uwe Martens-2021-05-24T19:23:00.000Z-Aka-2021-05-24T19:17:00.000Z11Beantworten
Ich werte die letzten Änderungen aus und lasse durch Perl-Scripte darin nach Fehlern suchen. Ich konzentriere mich dabei genau auf die Fehler, die eben kein Bot korrigieren kann, weil auffällige Stellen nicht immer wirklich falsch sind oder die Korrektur nicht eindeutig - der Rest wird eh schon lange von tatsächlichen Bots abgedeckt. Bei den Tippfehlern habe ich dir die Gründe ja oben verlinkt. Darum finde ich die Fehlerarten, nach denen ich suche - das ist sind mittlerweile ca. 100! -, regelmäßig und korrigiere sie, wenn ich Zeit habe - und das ist eben genau nicht rund um die Uhr. In der Tat versuche ich, das wenigstens ein Mal pro Tag zu machen, meist sogar zwei Mal, damit die Warteliste nicht zu lang wird. Das größte Problem ist hier nämlich, die Selbstmotivation aufrecht zu erhalten. Vielleicht sollte ich mal ein YouTube-Video machen, damit Leute wie du sehen, wie viel Aufwand da wirklich drin steckt, dann würdest du nicht so schlecht darüber reden. -- aka Benutzer Diskussion:Uwe Martens/Archiv bis 28.05.2021#c-Aka-2021-05-24T19:43:00.000Z-Uwe Martens-2021-05-24T19:23:00.000Z11Beantworten
Ich rede nicht schlecht über Deine Arbeit (Bot-, Skript- oder wie auch immer unterstützt). Es ist halt einfach nur nicht möglich, 18 Jahre lang ununterbrochen im Druchschnitt alle 3 Minuten einen händischen Edit zu tätigen. Du machst das halt schon, seit Botflags noch nicht obligatorisch waren, und mir ist das eigentlich auch vollkommen egal, ob Du mit oder ohne Botflag arbeitest. Aber bitte, lade bitte ein Screen-Capture hoch! Hättest Du Dich mal lieber zu dem Leerzeichen geäußert. -- Uwe Martens (Diskussion) Benutzer Diskussion:Uwe Martens/Archiv bis 28.05.2021#c-Uwe Martens-2021-05-24T19:52:00.000Z-Aka-2021-05-24T19:43:00.000Z11Beantworten