Benutzer Diskussion:MisterSynergy

aus Wikipedia, der freien Enzyklopädie
Dies ist eine alte Version dieser Seite, zuletzt bearbeitet am 6. Dezember 2018 um 17:42 Uhr durch WolfgangRieger (Diskussion | Beiträge) (→‎Wikiläum). Sie kann sich erheblich von der aktuellen Version unterscheiden.

Letzter Kommentar: vor 5 Jahren von WolfgangRieger in Abschnitt Wikiläum
Zur Navigation springen Zur Suche springen
Zum Archiv
Wie wird ein Archiv angelegt?

Verteilung

Quelltextgrößenverteilung in dewiki

Nochmals Dank für dein kenntnisreiches Eingreifen! Ich überlege, ob man das nicht in einem knappen WP-Kurier-Artikel verbreiten sollte (scheint ja sonst keiner zu wissen). Ist es viel Aufwand (überhaupt möglich?), die einzelnen 10 grössten Artikel (in deiner Auflistung, S. 24) zu benennen? Drei (Beispiel)Artikel, die im Peak der Verteilung liegen, kann ich selber heraussuchen. Cheers! Play It Again, SPAM (Diskussion) Benutzer Diskussion:MisterSynergy#c-Play It Again, SPAM-2016-10-11T07:09:00.000Z-Verteilung11Beantworten

Hallo Play It Again, SPAM! Inwiefern man das Wissen über Daten wie den Ermittelten verbreiten möchte, bin ich nicht festgelegt – ich stehe dem ausdrücklich nicht im Wege und würde bei Interesse auch versuchen, weitere Daten zu beschaffen (Vergleiche mit anderen Sprachversionen etc, als „Qualitätsvergleich“ und mglw. auch zum Aufspüren von signifikanten Botaktivitäten). Die 10 (bzw. 100) größten Artikel sind schnell ermittelt: noch ein Quarry. Allerdings wird vielen so theoretisches Zahlenmaterial wenig zugänglich sein, deshalb bin ich nicht sicher ob der Kurier dazu nicht vielleicht eine zu große Plattform wäre.
Diesen Peak sollte man vielleicht noch etwas untersuchen. Mein Studium mit Mathematik-Vorlesungen liegt weit genug zurück und die Vorlesungen waren reichlich abstrakt, so dass ich da die praktischen Aspekte der Statistikdetails gerade nicht mehr so parat habe ein SmileysymbolVorlage:Smiley/Wartung/zwinker . Wenn ich aber doch mal mutig die bei FzW angedeutete Log-normalverteilung anfitte, kommen ein paar Ergebnisse raus: und , demnach ist der Median , das Maxium der Verteilung liegt bei . Passt insofern alles zu der Auftragung, aber da gibt es ein paar statistische Fallstricke, wegen derer das trotzdem alles großer Quatsch sein könnte. Interessant war glaub ich auch die Verteilungsfunktion, die ich mir gestern kurz angeschaut habe, aber ohne davon ein Bild zu speichern. Daraus dürfte man in der Praxis mehr ablesen können als aus dieser logarithmisch skalierten Auftragung, bei der die Datenpunkte nach rechts immer dichter liegen.
Wie auch immer. Wenn ich Dir noch mit Abfragen helfen kann, lass mich das wissen. Eile haben wir in der Sache ja nicht. Viele Grüße! MisterSynergy (Diskussion) Benutzer Diskussion:MisterSynergy#c-MisterSynergy-2016-10-11T07:46:00.000Z-Play It Again, SPAM-2016-10-11T07:09:00.000Z11Beantworten
Ich sehe mal nach, ob dieses Thema schon dort präsentiert wurde. Es sollte einfach zu schlucken und zu verdauen sein. ob @HilberTraum: mehr mit den Zahlen (merkwürdig: vorhin konnte ich hier noch alle Zahlen sehen...) anfangen kann?!? Melde mich wieder. Play It Again, SPAM (Diskussion) Benutzer Diskussion:MisterSynergy#c-Play It Again, SPAM-2016-10-11T09:09:00.000Z-MisterSynergy-2016-10-11T07:46:00.000Z11Beantworten
Hoppla, ich hatte versehentlich an der Abfrage rumgebastelt, das aber nicht zum Ende geführt. Sollte nun wieder laufen! —MisterSynergy (Diskussion) Benutzer Diskussion:MisterSynergy#c-MisterSynergy-2016-10-11T09:11:00.000Z-Play It Again, SPAM-2016-10-11T09:09:00.000Z11Beantworten
Ja, ich denke auch, dass eine Log-Normalverteilung hier gut passt. Wie kommen die Werte für und zustande? Ich habe die Zahlen jetzt mal mit R fitten lassen und es hat und ausgespuckt. Kann aber gut sein, dass ich was falsch gemacht habe. -- HilberTraum (d, m) Benutzer Diskussion:MisterSynergy#c-HilberTraum-2016-10-11T13:11:00.000Z-MisterSynergy-2016-10-11T07:46:00.000Z11Beantworten
Hallo HilberTraum, ich den Fit auf den blauen Daten (nur Artikel ohne BKS, Datensatz von gestern) mit Origin gemacht und dabei festgehalten, i.e. keine Verschiebung entlang der y-Achse erlaubt. Das Fitmodell y = y0 + A/(sqrt(2*PI)*w*x)*exp(-(ln(x/xc))^2/(2*w^2)) hat die Parameter etwas anders definiert, so dass , und rauskommen, so ich mich nicht vertue. In doppelt-logarithmischer Auftragung sieht das Fitmodell leider nicht mehr so gut für den Bereich oberhalb von ~10000 Bytes aus – die Daten fallen dort sehr schön ohne jegliche Beule bis zum Ende ab, aber signifikant langsamer als der Fit das tut. Das Konzept der gestreckten Exponentialfunktion könnte hier dem Gefühl nach besser passen, ich habe aber gerade kein Fitmodell dafür vorhanden – und wüsste auch nicht ob das am Ende irgendetwas helfen würde. Viele Grüße! —MisterSynergy (Diskussion) Benutzer Diskussion:MisterSynergy#c-MisterSynergy-2016-10-11T13:38:00.000Z-HilberTraum-2016-10-11T13:11:00.000Z11Beantworten
Quetsch: Ok, das sieht ziemlich professionell aus ;-) Soweit ich sehe berechnet die R-Funktion, die ich verwendet habe, einfach die Maximum-Likelihood-Schätzer. Dass der Plot bei ungefähr 10000 nicht so gut passt, ist mit aber auch aufgefallen. -- HilberTraum (d, m) Benutzer Diskussion:MisterSynergy#c-HilberTraum-2016-10-11T14:00:00.000Z-MisterSynergy-2016-10-11T13:38:00.000Z11Beantworten
Wenn man mit der einen, halblogarithmischen Grafik einen Kurzbericht schreiben möchte, was wäre dann erwähnenswert?
  • Datum, Gesamtanzahl Artikel, Gesamt-kB-Menge
  • Die kB-Grösse, die die meisten (Peak) Artikel haben. (2232 ?!)
  • Die Durchschnittsgrösse eines Artikel ist x kB.
  • 50 %, 75 % und 95 % aller Artikel liegen bei kleiner/gleich...
  • Die Top-5-% aller Artikel stellen x % der Gesamtdatenmenge dar.
  • Die drei Artikel mit den meisten kB
Andere interessante Spitzenwerte? Play It Again, SPAM (Diskussion) Benutzer Diskussion:MisterSynergy#c-Play It Again, SPAM-2016-10-11T13:46:00.000Z-MisterSynergy-2016-10-11T13:38:00.000Z11Beantworten
Also ich hab mich ja gefragt, welches die beiden Artikel mit gerundet null Byte sind ;-) -- HilberTraum (d, m) Benutzer Diskussion:MisterSynergy#c-HilberTraum-2016-10-11T14:05:00.000Z-Play It Again, SPAM-2016-10-11T13:46:00.000Z11Beantworten
Nationales Pferdezentrum mit 47 Bytes (URV-Meldung) und White House Station (New Jersey) mit 48 Bytes (Vandalismus). —MisterSynergy (Diskussion) Benutzer Diskussion:MisterSynergy#c-MisterSynergy-2016-10-11T14:11:00.000Z-HilberTraum-2016-10-11T14:05:00.000Z11Beantworten

Ich versuche gerade nochmal Daten für verschiedene große Sprachversionen zusammenzubekommen. Leider ist enwiki zu groß, die Abfrage wird nicht innerhalb einer halben Stunde fertig. Ich versuche das später nochmal direkt von der Konsole, ohne das Quarry-Tool zu nutzen. —MisterSynergy (Diskussion) Benutzer Diskussion:MisterSynergy#c-MisterSynergy-2016-10-11T14:34:00.000Z-Verteilung11Beantworten

Auch das finde ich interessant, wir müssen es aber um "sprachspezifische Textlänge" korrigieren. Ich versuche herauszufinden, welche nummerischen Faktoren man für die Hauptsprachen gefunden hat. Gruss Play It Again, SPAM (Diskussion) Benutzer Diskussion:MisterSynergy#c-Play It Again, SPAM-2016-10-12T06:19:00.000Z-MisterSynergy-2016-10-11T14:34:00.000Z11Beantworten

Benutzer:MisterSynergy/Linkfixliste

Hallo MisterSynergie,

könntest du zum Zwecke der Priorsierung Ähnlichkeiten zwischen Rotlinks auf Benutzer:Drahreg01/American Academy of Arts and Sciences/Wartung/Fehlende und Rotlinks in der Kategorie:Wissenschaftspreis analysieren?

Liebe Grüße und ein schönes Weihnachtsfest, --Drahreg01 (Diskussion) Benutzer Diskussion:MisterSynergy#c-Drahreg01-2016-12-23T09:56:00.000Z-Benutzer:MisterSynergy/Linkfixliste11Beantworten

Hallo Drahreg! Ja das schaue ich mir an, vermutlich aber erst im Januar. Ich bastle zurzeit an einem Websitecrawler in einer anderen Sache, und weil die Website bald offline geht ist das etwas dringlich. Dazu kommen natürlich diverse familiäre Verpflichtungen über Weihnachten, so dass die Urlaubszeit wikitechnisch vermutlich nicht so produktiv sein wird. Wenn es soweit ist, lade ich das Ergebnis auf der bekannten Seite ab, die Du einfach weiter beobachten kannst. Viele Grüße und eine schöne Zeit, MisterSynergy (Diskussion) Benutzer Diskussion:MisterSynergy#c-MisterSynergy-2016-12-23T10:02:00.000Z-Drahreg01-2016-12-23T09:56:00.000Z11Beantworten
Selbstverständlich. Ich hatte keine Bearbeitung noch dieses Jahr erwartet. Vielen lieben Dank für deine Hilfe! --Drahreg01 (Diskussion) Benutzer Diskussion:MisterSynergy#c-Drahreg01-2016-12-23T14:41:00.000Z-MisterSynergy-2016-12-23T10:02:00.000Z11Beantworten

@Drahreg01: ich will zum Verständnis nochmal nachfragen, was hier das Ziel sein soll. Möchtest Du tatsächlich die Rotlinks der Liste in Deinem BNR mit denen in den Artikeln in der Kategorie verglichen haben, damit die vereinheitlicht und dann abgezählt werden können? Das wäre möglich, ich will nur nicht wieder einen falschen Job ausführen und frage daher nach :-) Viele Grüße, MisterSynergy (Diskussion) Benutzer Diskussion:MisterSynergy#c-MisterSynergy-2016-12-24T15:49:00.000Z-Benutzer:MisterSynergy/Linkfixliste11Beantworten

Eins vorab: Das soll eine höfliche Anfrage sein, deren Bearbeitung oder Irgendwann-Bearbeitung oder eben auch Nichtbearbeitung vollständig und ganz alleine deine Entscheidung ist.
Ursprung ist diese Debatte. Es geht darum, unter den fast 7.000 fehlenden Artikeln unter Benutzer:Drahreg01/American Academy of Arts and Sciences/Wartung/Fehlende solche zu finden, die (mehrfach) ausgezeichnete Wissenschaftler repräsentieren. Alle Artikel zu schreiben wird Jahrzehnte (oder Jahrhunderte?) dauern. Die wichtigsten könnten vielleicht eher geschrieben werden.
Viele Grüße, --Drahreg01 (Diskussion) Benutzer Diskussion:MisterSynergy#c-Drahreg01-2016-12-24T16:51:00.000Z-MisterSynergy-2016-12-24T15:49:00.000Z11Beantworten
Hallo @Drahreg01, Du musst mir mit der Sache mal gerade helfen, ich stehe auf dem Schlauch. Ich habe mittlerweile dreimal (seit Anfang Januar) versucht, mit Petscan die Rotlinks aus Deiner Seite zu extrahieren – und das will einfach nicht richtig klappen??! An sich sollte die Abfrage ja sehr simpel sein – siehst Du da einen Fehler? Petscan hat so irre viele Funktionen, dass ich mit dem Ding ein wenig auf dem Kriegsfuß stehe… Viele Grüße, MisterSynergy (Diskussion) Benutzer Diskussion:MisterSynergy#c-MisterSynergy-2017-01-13T22:41:00.000Z-Drahreg01-2016-12-24T16:51:00.000Z11Beantworten
Soweit ich das kapiere, werden rote Links ausgegeben, die auf Seiten stehen, die auf Benutzer:Drahreg01/American Academy of Arts and Sciences/Wartung/Fehlende blau sind. Warum PetScan das macht, habe ich noch nicht verstanden.
Was bedeutet die Tick box in den Ergebnissen?
Vielen Dank für deine Unterstützung. --Drahreg01 (Diskussion) Benutzer Diskussion:MisterSynergy#c-Drahreg01-2017-01-14T05:48:00.000Z-MisterSynergy-2017-01-13T22:41:00.000Z11Beantworten
Guten Morgen! Deine Beobachtung sieht gut aus. Irgendwie hätte ich gedacht, dass Petscan da anders reagiert oder mglw. in der Vergangenheit auch anders reagiert hat.
Die Checkbox ist vermutlich ein Wikidata-Tool – für die angehakten Elemente gibt es nichts bei Wikidata passendes, und Du könntest Items erstellen. Die nicht angehakten Elemente sind zwar bei dewiki rot, aber es gibt mögliche Treffer bei Wikidata. Du kannst mal auf die check Wikidata-Links klicken und den Unterschied sehen. Petscan als Nachfolger von Catscan bietet als einziges Tool die Möglichkeit, Wikidata-Daten und Wikipedia-Kategorien in einer Anfrage zu kombinieren, das ist auch sehr nützlich. Aber die Benutzeroberfläche ist nicht optimal gelungen, finde ich…
Ich schaue nochmal weiter, was ich tun kann. Es gibt ja nicht nur Petscan… ein lächelnder Smiley MisterSynergy (Diskussion) Benutzer Diskussion:MisterSynergy#c-MisterSynergy-2017-01-14T06:56:00.000Z-Drahreg01-2017-01-14T05:48:00.000Z11Beantworten

Guten Morgen @Drahreg01! Da ist nun ein Ergebnis auf der Linkfixseite – und das ist umfangreicher ausgefallen als ich es erwartet habe. Da beide Quellen einigermaßen in Eurem Einflussbereich liegen, habe ich diesmal deutlich weniger vorab händisch rausgefiltert. Bei der Abarbeitung scheint mir auch einiges an Spezialwissen über die Personen, deren Fachgebiete und die Wissenschaftspreise notwendig zu sein. Überlegt Euch also, inwiefern das Ergebnis für Euch nützlich ist. Viele Grüße! —MisterSynergy (Diskussion) Benutzer Diskussion:MisterSynergy#c-MisterSynergy-2017-01-20T08:49:00.000Z-Benutzer:MisterSynergy/Linkfixliste11Beantworten

Hola, das sieht tatsächlich nach viel Arbeit aus – für dich in der Vergangenheit und für mich in der Zukunft! Erstmal herzlichen Dank dafür! Viele Grüße, --Drahreg01 (Diskussion) Benutzer Diskussion:MisterSynergy#c-Drahreg01-2017-01-20T10:43:00.000Z-MisterSynergy-2017-01-20T08:49:00.000Z11Beantworten
Das ging heute morgen recht fix. Die Rotlinks aus Deiner Wartungsliste habe ich direkt übernommen, die aus der Kategorie kann ich mittlerweile mit ein paar Routineschritten per Datenbankabfrage an der Toolserver-Konsole ermitteln. Das Vergleichsskript hat für diesen Durchlauf einige wenige zusätzliche Zeilen Code (und entsprechende Funktionalität) bekommen, und der Durchlauf selbst dauerte dann aufgrund der erheblich niedrigeren Linkzahlen nur ein paar Minuten. Danach war nur noch das händische Nachfiltern und die Vorbereitung als Wikitabelle zu tun.
Lass Dir ruhig Zeit mit der Abarbeitung, und vielleicht können und wollen Dir Deine Wissenschaftlerkollegen auch helfen. Meinerseits besteht ausdrücklich keine Notwendigkeit zur eiligen Abarbeitung. Und ich würde Dir auch gern weitere Listen bauen, wenn Du bei der Korrektur nicht müde wirst ein lächelnder Smiley  Viele Grüße! MisterSynergy (Diskussion) Benutzer Diskussion:MisterSynergy#c-MisterSynergy-2017-01-20T10:51:00.000Z-Drahreg01-2017-01-20T10:43:00.000Z11Beantworten
Noch eine Nachfrage: ich finde (zumindest unter A bis C als Anfangsbuchstaben) keine einzige 100%ige Übereinstimmung zwischen einem Eintrag in der linken und einem in der rechten Spalte. Das erscheint mir unplausibel. Spezial:Linkliste/Alexander Hollaender enthält auch zum Beispiel einen Wissenschaftspreis. Der müsste also auch in der rechten Spalte auftauchen!? (Konnte ich mich verständlich ausdrücken?) Liebe Grüße, --Drahreg01 (Diskussion) Benutzer Diskussion:MisterSynergy#c-Drahreg01-2017-01-20T15:05:00.000Z-MisterSynergy-2017-01-20T10:51:00.000Z11Beantworten
Ich musste etwas nachdenken, aber jetzt verstehe ich Dein Anliegen.
Der grundlegenden Idee folgend müsste er tatsächlich auch auf der rechten Seite auftauchen, wegen der konkreten Implementierung meines Skriptes passiert das zurzeit nicht. Weniger weil ich das hier beabsichtigt habe, sondern mehr weil wir erstmals Rotlinks miteinander vergleichen, und nicht Blau- mit Rotlinks. So kann es jetzt vorkommen, dass Links tatsächlich in beiden Datensätzen vorkommen. Ich habe das Skript aber bisher so gebaut, dass in der Vergleichsdatenbank alle Links mit ihrer exakten Schreibweise nur einmal vorkommen können. Deine Liste habe ich zuerst importiert, deshalb ist die vollständig drin. Danach wurden die Rotlinks aus der Kategorie:Wissenschaftspreis importiert, wobei die bereits von der anderen Liste vorhandenen Exemplare nicht erneut rein kamen. Entsprechend steht der von Dir genannte Eintrag auf der rechten Seite nicht mehr, und bei einem 100 %-igen Treffer wäre eigentlich auch nichts zu tun. (Oder?)
Ich muss also die Beschreibung des Auswertungsergebnisses noch einmal dahingehend anpassen, dass diese Tatsache korrekt dargestellt wird (frühestens heute Abend). Wenn Du feststellst, dass der Import in genau umgekehrter Reihenfolge sinnvoller ist, dann kann ich Dir das gern noch einmal machen. Ich habe das Verhalten des Skriptes in diesem Punkt tatsächlich beim Auswerten nicht bedacht, und die Importreihenfolge deshalb zufällig, nicht bewusst aus den beiden Möglichkeiten gewählt.
Alles klar? ein lächelnder Smiley  Viele Grüße, MisterSynergy (Diskussion) Benutzer Diskussion:MisterSynergy#c-MisterSynergy-2017-01-20T15:19:00.000Z-Drahreg01-2017-01-20T15:05:00.000Z11Beantworten
Nicht ganz klar ein SmileysymbolVorlage:Smiley/Wartung/8p , was aber sicherlich an meinem mangelnden Intellekt liegt. <kopfkratz />
"Viel zu tun" ist mit der Liste zunächst ohnehin nicht. Ich bin mal diagonal über die Einträger gegangen, die rechts blau sind. Zu tun waren: einen Link fixen, eine BKL anlegen, eine Weiterleitung anlegen. Immerhin!
Intention war aber ja etwas anderes, nämlich die Priorisierung der >> 6000 Rotlinks auf Benutzer:Drahreg01/American Academy of Arts and Sciences/Wartung/Fehlende mit Hilfe des Kriteriums "hat (mehrere) Wissenschaftspreise gewonnen".
Liebe Grüße, --Drahreg01 (Diskussion) Benutzer Diskussion:MisterSynergy#c-Drahreg01-2017-01-20T15:41:00.000Z-MisterSynergy-2017-01-20T15:19:00.000Z11Beantworten
<salopp>Also das mit dem „mangelnden Intellekt“ glaub ich Dir nicht. Dein Tun verrät Gegenteiliges :-)</salopp>
Ich hielte es auch nicht für clever, jetzt durch die Liste zu pflügen und Rotlinks auf Rotlinks umzubiegen. Hilfreich ist es aber sicher schon, bei der Anlage eines neuen Artikels schauen zu können, welche anderen Schreibweisen im Umlauf sind.
Die Zahl der gewonnenen Wissenschaftspreise (bzw. korrekter: die Zahl der Wissenschaftspreislisteneinträge in dewiki) je Rotlink kann ich glaub ich anders besser bestimmen, da ist das bisher genutzte Skript eigentlich nicht für prädestiniert. Ich muss ein bisschen hirnen und hoffe dann noch ein anderes Ergebnis liefern zu können… Viele Grüße, MisterSynergy (Diskussion) Benutzer Diskussion:MisterSynergy#c-MisterSynergy-2017-01-20T15:52:00.000Z-Drahreg01-2017-01-20T15:41:00.000Z11Beantworten
Danke für die Blumen, aber ich verstell mich bloß...
Die schiere Zahl der Rotlinks ist ja wahrscheinlich relativ trivial und kann von Petscan ausgeliefert werden. Ist auch auf Benutzer:Reinhard Kraasch/Häufigkeiten Wissenschaftspreisträger dokumentiert. Die Zahl der ähnlichen links dagegen wäre ein echter Zugewinn. Danke, dass du hier Hirnschmalz investierst!
Vielleicht wäre ja eine absolute Zahl von Preisen (unabhängig von etwaigen Ähnlichkeiten zu meiner AAAS-Arbeitsliste) auch ein interessantes Objekt?
LG, --Drahreg01 (Diskussion) Benutzer Diskussion:MisterSynergy#c-Drahreg01-2017-01-20T16:10:00.000Z-MisterSynergy-2017-01-20T15:52:00.000Z11Beantworten

Guten Morgen! So etwas ähnliches wie Benutzer:Reinhard Kraasch/Häufigkeiten Wissenschaftspreisträger basierend auf Deiner Liste bekomme ich mit einer Datenbankabfrage auch hin, das generiert jetzt aber keinerlei neue Einsicht (die Zahlen sind sehr ähnlich). Für solch eine Liste wären einheitliche Rotlinks natürlich schon dufte, aber das haben wir nicht – und das bekommen wir mit dem Status Quo auch kaum automatisiert ausgewertet.

Jetzt kratze ich mir am Kopf, ehrlich gesagt. Der ganze Bereich würde in meinen Augen von sauberen Daten bei Wikidata sehr profitieren, da könnte man dann auch ziemlich fix Häufigkeitslisten von dewiki-Rotlinks basierend auf verschiedenen Kriterien rausgenerieren. Allerdings wäre da wohl noch einige Arbeit zu tun, bis die Daten sauber bei Wikidata wären. Bin unschlüssig, wie ich Euch gerade helfen kann… Viele Grüße! —MisterSynergy (Diskussion) Benutzer Diskussion:MisterSynergy#c-MisterSynergy-2017-01-21T09:22:00.000Z-Benutzer:MisterSynergy/Linkfixliste11Beantworten

Also, wenn du die fehlenden Preisträger aus der linken Spalte noch rechts ergänzen könntest, wie du es weiter oben schon mal angedeutet hattest, wäre ich dir schon sehr dankbar. Cluster aus ähnlichen Namen kann ich dann immer noch „händisch“ bilden.
Mit Wikidata bin ich nie richtig warm geworden. Ja, wenn man erst mal alle Informationen nach Wikidata trägt, kann man sie alle von dort wieder abholen. <sarkasmus />
Liebe Grüße, --Drahreg01 (Diskussion) Benutzer Diskussion:MisterSynergy#c-Drahreg01-2017-01-21T10:10:00.000Z-MisterSynergy-2017-01-21T09:22:00.000Z11Beantworten
Hallo MisterSynergy, darf ich nochmal höflich fragen, ob du diese erweiterte Abfrage noch machen könntest? Wenn das (derzeit oder dauerhaft) für dich zu aufwändig ist, ist das für mich aber auch vollkommen ok. Ich bin dir für deine bisherigen Zuarbeiten mehr als dankbar. Liebe Grüße, --Drahreg01 (Diskussion) Benutzer Diskussion:MisterSynergy#c-Drahreg01-2017-03-04T22:04:00.000Z-Drahreg01-2017-01-21T10:10:00.000Z11Beantworten
Guten Abend! Ja, das habe ich noch im Kopf. Ich bin gerade heute aus dem Urlaub zurückgekehrt und möchte mich in der nächsten Zeit dransetzen, ebenso wie an den (einfacheren) nachstehenden Auftrag. Viele Grüße! MisterSynergy (Diskussion) Benutzer Diskussion:MisterSynergy#c-MisterSynergy-2017-03-04T22:30:00.000Z-Drahreg01-2017-03-04T22:04:00.000Z11Beantworten

Schachanfrage

Könntest du so eine Liste auf für die Kategorie:Schach erstellen? Es gibt da allerdings keine Vergleichsliste, ist das ein Problem? Zu vergleichen wären dann halt nur untereinander die Artikel in der Kategorie. 129.13.72.198 Benutzer Diskussion:MisterSynergy#c-129.13.72.198-2017-01-20T12:03:00.000Z-Schachanfrage11Beantworten

Ja, das stelle ich auch mal in die Warteschlange. Wie melde ich mich bei Dir, wenn das fertig ist? Das könnte nämlich ein paar Tage dauern. —MisterSynergy (Diskussion) Benutzer Diskussion:MisterSynergy#c-MisterSynergy-2017-01-20T12:06:00.000Z-129.13.72.198-2017-01-20T12:03:00.000Z11Beantworten
Auf meiner Diskussionsseite, die IP ist ja statisch. Oder ansonsten schau ich immer mal wieder hier rein. 129.13.72.198 Benutzer Diskussion:MisterSynergy#c-129.13.72.198-2017-01-20T12:10:00.000Z-MisterSynergy-2017-01-20T12:06:00.000Z11Beantworten
Danke. Soweit alles erledigt. Allerdings hast du ja jetzt nur Blaulinks mit Rotlinks abgeglichen, oder? Was ist mit einem Vergleich der Rotlinks untereinander? 2A00:1398:9:FB00:5931:294E:69DD:6567 Benutzer Diskussion:MisterSynergy#c-2A00:1398:9:FB00:5931:294E:69DD:6567-2017-01-24T16:29:00.000Z-129.13.72.198-2017-01-20T12:03:00.000Z11Beantworten
Eins nach dem anderen; rote Links blaumachen ist erstmal wichtiger gewesen als Rotlinks zu anderen Rotlinks umzukorrigieren. Das ist nämlich gar nicht so einfach, da mache ich Dir aber auch noch etwas fertig … Viele Grüße! —MisterSynergy (Diskussion) Benutzer Diskussion:MisterSynergy#c-MisterSynergy-2017-01-24T16:31:00.000Z-2A00:1398:9:FB00:5931:294E:69DD:6567-2017-01-24T16:29:00.000Z11Beantworten
Die Rotlinks sind nun da. —MisterSynergy (Diskussion) Benutzer Diskussion:MisterSynergy#c-MisterSynergy-2017-01-24T19:32:00.000Z-MisterSynergy-2017-01-24T16:31:00.000Z11Beantworten
Danke. 85.216.41.109 Benutzer Diskussion:MisterSynergy#c-85.216.41.109-2017-01-24T20:40:00.000Z-MisterSynergy-2017-01-24T19:32:00.000Z11Beantworten

Ich hab einiges korrigiert. Kannst du beide Listen (also die Blaulink-Vergleichsliste und die Rotlink-Vergleichsliste) nochmal generieren? 129.13.72.198 Benutzer Diskussion:MisterSynergy#c-129.13.72.198-2017-02-02T10:23:00.000Z-Schachanfrage11Beantworten

Ja, dauert aber ein bisschen. —MisterSynergy (Diskussion) Benutzer Diskussion:MisterSynergy#c-MisterSynergy-2017-02-02T10:26:00.000Z-129.13.72.198-2017-02-02T10:23:00.000Z11Beantworten
Das dauert aber lange. Bei der letzten Abfrage hat es nur drei Tage gedauert. 129.13.72.198 Benutzer Diskussion:MisterSynergy#c-129.13.72.198-2017-02-08T15:29:00.000Z-MisterSynergy-2017-02-02T10:26:00.000Z11Beantworten
Ich habe das nicht vergessen, bleibe bitte geduldig. Es könnte vielleicht heute Abend klappen. —MisterSynergy (Diskussion) Benutzer Diskussion:MisterSynergy#c-MisterSynergy-2017-02-08T15:31:00.000Z-129.13.72.198-2017-02-08T15:29:00.000Z11Beantworten

Jetzt ist mir grade aufgefallen, dass deine Schachabfrage wie folgt lautete: Vergleiche Blaulinks aus Kategorie:Person (Schach) mit Rotlinks aus Artikeln in der Kategorie:Schach. Was ich eigentlich wollte war Vergleiche Blaulinks aus Kategorie:Schach mit Rotlinks aus Artikeln in der Kategorie:Schach Kannst du das noch machen? 129.13.72.198 Benutzer Diskussion:MisterSynergy#c-129.13.72.198-2017-03-01T07:50:00.000Z-Schachanfrage11Beantworten

Hallo, ja das war eigentlich so Absicht. Wenn ich alle Blaulinks aus Kategorien wie Kategorie:Schach vergleiche, führt das manchmal zu schwierigen Ergebnissen. Da sind oft zu viele systematisch ähnliche Lemmata drin, was bei Personenkategorien so nicht der Fall ist. Ich versuche das trotzdem mal nächste Woche, bin nämlich zurzeit im Urlaub und da habe ich nur mein Dritt-Notebook ohne alle Wikipedia-Skripte dabei. Viele Grüße! --MisterSynergy (Diskussion) Benutzer Diskussion:MisterSynergy#c-MisterSynergy-2017-03-01T16:50:00.000Z-129.13.72.198-2017-03-01T07:50:00.000Z11Beantworten
Wieso dauert das so lange? 129.13.72.198 Benutzer Diskussion:MisterSynergy#c-129.13.72.198-2017-03-22T16:30:00.000Z-MisterSynergy-2017-03-01T16:50:00.000Z11Beantworten
Ich bin auf längerer Dienstreise unterwegs und komme zu kaum etwas anderem. Schaue zwar täglich rein, aber zu mehr als ein paar wenige Kleinstedits hier und bei Wikidata reichts zurzeit einfach nicht. Ich habe Euch beide (und auch einige andere Jobs) nicht vergessen und werde mich drum kümmern, sobald meine Zeit es zulässt. Viele Grüße! MisterSynergy (Diskussion) Benutzer Diskussion:MisterSynergy#c-MisterSynergy-2017-03-22T20:35:00.000Z-129.13.72.198-2017-03-22T16:30:00.000Z11Beantworten
Der Nachschlag zur Schachanfrage ist nun da. Sorry fürs Warten lassen, ich hab zurzeit leider nicht viel Luft für Wikipedia-Arbeit. Viele Grüße! —MisterSynergy (Diskussion) Benutzer Diskussion:MisterSynergy#c-MisterSynergy-2017-04-14T17:02:00.000Z-MisterSynergy-2017-03-01T16:50:00.000Z11Beantworten
Danke! 79.229.67.23 Benutzer Diskussion:MisterSynergy#c-79.229.67.23-2017-04-14T22:00:00.000Z-MisterSynergy-2017-04-14T17:02:00.000Z11Beantworten

Weblinkkrabbler

Frohes Neues;

ich hätte da ein kleines Attentat in der Schublade.

  • Du bist mir bei den WP:BA angenehm aufgefallen und scheinst dich besser auf toollabs: auszukennen als ich.
  • Auf diese Seite kommend, lese ich zufällig im Abschnitt drüber „Ich bastle zurzeit an einem Websitecrawler in einer anderen Sache“ – vermutlich nur um eine Domain auszusaugen, aber geht schon in die richtige Richtung.
  • Ich hätte da etwas Zukunftsmusik.
    • Keine Angst, du müsstest nicht gleich die ganze WMF zum Glühen bringen; unser ANR würde für den Anfang reichen.
    • Ist auch keine unmittelbare Terminsache, liegt bereits ein Jahr in der Pipeline.
    • Die erste Stufe eines Mock-Up wäre scho schee.
    • Wobei man die Strukturen gleich ausbaufähig für die absehbar gierigen weiteren Wünsche halten kann, bloß derartige Abfragen erstmal nicht unterstützt.
    • Interaktive vielsprachige Formulare machen viel Arbeit; für den Anfang würden Abfragen per URL-Parameter auf Jahre hinaus reichen und wären eine wesentliche Hilfe für unsere Linkpflege; auch um diesen Diskussionsseitenwahnsinn ausschleichen zu lassen.

Gifti ist stark im RL eingespannnt und baut derzeit eher Bot-Projekte zurück, als dass sie noch neue Herausforderungen annehmen könnte.

  • Vielleicht überlässt sie dir aber ihre Datenbank als Anfangspopulation.
  • Vielleicht lässt sie auch den Krabbler bis auf Weiteres weiterlaufen, so dass dessen Ergebnisse einmal monatlich in deine neustrukturierte Datenbank übernommen werden können, und du persönlich erstmal keine Websites kontaktieren brauchst; falls das einfacher wäre.
  • Sicher würde sie dich in ihren Krabbler-Code gucken lassen, auch wenn das mutmaßlich nicht byteweise in ein neu und auf Zuwachs designtes System übernommen werden könnte. Auf jeden Fall kann sie in haushaltsüblichen Mengen Tipps geben und Fragen zum schlauesten Vorgehen aus ihrer Erfahrung beantworten.

Ein toollabs:weboid wäre toll, und wenn das als Mock-Up erstmal liefe (mir ist zurzeit kein vergleichbares Projekt aus einem anderen Wiki bekannt), dann kämen sicher auch Leute aus der enWP hinzu, und auch Gifti würde wohl als wenigstens passives Mitglied einsteigen.

Antwort hat keine Eile; erfolgreiches 2017 --PerfektesChaos Benutzer Diskussion:MisterSynergy#c-PerfektesChaos-2017-01-05T09:14:00.000Z-Weblinkkrabbler11Beantworten

Hallo und Frohes Neues! Ich nehme diese Anfrage zunächst einmal ohne Bewertung zur Kenntnis und denke ein paar Tage drüber nach. Du bekommst hier auf der Seite Ping, wenn ich mich dazu äußern kann! ein lächelnder Smiley  Viele Grüße, MisterSynergy (Diskussion) Benutzer Diskussion:MisterSynergy#c-MisterSynergy-2017-01-05T11:08:00.000Z-PerfektesChaos-2017-01-05T09:14:00.000Z11Beantworten

Hilfe bei Wikidata List für Unix-Wikiprojekt

Hallo MisterSynergy,

ich habe vor kurzem eine Frage in Wikipedia:Fragen zur Wikipedia gestellt und von deiner Erfahrung dort profitiert. Ich habe jetzt wie verabredet die Vorlage:Wikidata list eingebunden. Ich habe ein paar erste Versuche gestartet (um ehrlich zu sein hauptsächlich copy&paste). Ich komme aber noch nicht sehr weit und ich bin auch nicht sicher,ob der Bot wirklich meine Seite aktualisiert.

Kannst du mir ein wenig unter die Arme greifen? Du kannst auch gerne Benutzer:Hundsrose/Wikidata Spielwiese bearbeiten, falls du möchtest.

Vielen Dank für die Hilfe. Beste Grüße --Hundsrose (Diskussion) Benutzer Diskussion:MisterSynergy#c-Hundsrose-2018-10-22T19:29:00.000Z-Hilfe bei Wikidata List für Unix-Wikiprojekt11Beantworten

Hallo Hundsrose, ich war dran und habe einen Vorschlag gemacht. Probleme mit Deinem Start waren:
  • Die Vorlage braucht eine weitere Vorlage {{Wikidata list end}} zum Abschließen, und der Bot editiert danach alles zwischen den beiden Vorlagen. Die zweite fehlte, deshalb mochte er nicht.
  • Außerdem fehlte bei der SPARQL-Abfrage die abschließende geschweifte Klammer.
Ansonsten habe ich ein paar Beispieldaten aus Wikidata ergänzt, und das alles nach der Lizenz in Abschnitte gruppieren lassen. Die meisten Programme haben tatsächlich noch keine Lizenz bei Wikidata angegeben, deshalb erscheinen die im letzten Abschnitt.
Änderungen musst Du nun in Wikidata vornehmen, und dann die Liste manuell aktualisieren lassen (sonst tut der Bot das alle paar Tage, kannst Du auch irgendwo einstellen).
Abgesehen von der ersten Spalte sollten keine Q-Identifikatoren erscheinen. Wenn das doch passiert, fehlt im entsprechenden Objekt die deutschsprachige Bezeichung (label).
Du kannst gern an der Liste weiter ausprobieren, und/oder bei Wikidata die Objekte besser mit Informationen ausstatten. Eine Übersicht der zurzeit genutzten Aussagen in den Objekten findest Du mit dieser Abfrage; da dürfen aber natürlich auch (passende) andere Eigenschaften genutzt werden.
Have fun. Bei Fragen kannst Du gern in diesem Abschnitt weiterfragen. Viele Grüße! —MisterSynergy (Diskussion) Benutzer Diskussion:MisterSynergy#c-MisterSynergy-2018-10-22T20:43:00.000Z-Hundsrose-2018-10-22T19:29:00.000Z11Beantworten
Vielen Dank, MisterSynergy. Sieht sehr beeindruckend aus. Ich bin momentan noch ein wenig erschlagen von der Informationsmenge, werde mir aber bei Gelegenheit etwas mehr Zeit nehmen um mich einzuarbeiten und zu experimentieren. Ich freue mich meinen ersten Ansprechpartner in Wikidata gefunden zu haben. :) Vielen Dank. Liebe Grüße --Hundsrose (Diskussion) Benutzer Diskussion:MisterSynergy#c-Hundsrose-2018-10-22T20:56:00.000Z-MisterSynergy-2018-10-22T20:43:00.000Z11Beantworten
Hallo MisterSynergy. Ich habe leider noch nicht das manuelle Update eingestellt, kannst du mir erklären wie ich das mache? Außerdem würde gerne ein paar Lizenzen in der Kategorie Misc eingetragen, wie z.B. für alias (Unix). Ich weiß aber nicht wo ich die Informationen erhalte und wie ich sie belegen kann. Kannst du mir weiter helfen? Vielen Dank und beste Grüße --Hundsrose (Diskussion) Benutzer Diskussion:MisterSynergy#c-Hundsrose-2018-12-03T17:29:00.000Z-Hundsrose-2018-10-22T20:56:00.000Z11Beantworten
Hallo Hundsrose, ganz oben auf der Seite gibt es einen Link “Liste manuell aktualisieren”, noch vor dem Inhaltsverzeichnis. Wenn Du den klickst, kommt der Bot unverzüglich vorbei und aktualisiert die Seite basierend auf dem aktuellen Stand der Objekte in Wikidata. Zurzeit passiert allerdings nichts – es sind keine Änderungen seit dem letzten Update zu machen, weil sich an den Objekten in Wikidata nichts geändert hat.
Hinsichtlich zu ergänzender Lizenzen: da wäre Recherche gefragt. Ich kenne mich in dem Themengebiet nicht besonders aus, deshalb kann ich nicht sagen, wo es Lizenzinformationen zu den Tools gibt. In einigen Fällen steht in den Englischsprachigen Wikipediaartikeln etwas drin. Wenn Du erstmal keine Fundstellen angeben kannst, ergänzt Du das ohne Fundstelle in Wikidata. Solange da niemand anderer Meinung ist, ist das kein echtes Problem. —MisterSynergy (Diskussion) Benutzer Diskussion:MisterSynergy#c-MisterSynergy-2018-12-03T18:36:00.000Z-Hundsrose-2018-12-03T17:29:00.000Z11Beantworten

Hallo MisterSynergy (hoffentlich dieses Mal richtig geschrieben), vielen Dank für die Infos! Beste Grüße --Hundsrose (Diskussion) Benutzer Diskussion:MisterSynergy#c-Hundsrose-2018-12-03T19:30:00.000Z-Hilfe bei Wikidata List für Unix-Wikiprojekt11Beantworten

Ausdrücklich gern wieder. Ich habe Deine Arbeitsseite im Übrigen auf der Beobachtungsliste und schaue mindestens interessiert zu, was Du da so machst :-) Viele Grüße, MisterSynergy (Diskussion) Benutzer Diskussion:MisterSynergy#c-MisterSynergy-2018-12-03T21:34:00.000Z-Hundsrose-2018-12-03T19:30:00.000Z11Beantworten
Das freut mich zu hören. :) Bezüglich der Lizenzen habe ich übrigens eine Anfrage in der englischsprachigen Wikipedia gestellt:
en:Wikipedia:Reference_desk/Computing#Sources/References_for_licences_of_Unix_commands_to_implement_in_Wikidata. Viele Grüße
--Hundsrose (Diskussion) Benutzer Diskussion:MisterSynergy#c-Hundsrose-2018-12-04T12:50:00.000Z-MisterSynergy-2018-12-03T21:34:00.000Z11Beantworten
Vielen Dank für deine Korrektur auf meiner Seite. Ich wollte die Gruppierung aufheben, da in der obigen Diskussion in der englischsprachigen Wikipedia klar wurde, dass das Thema Lizenzen in Unix nicht ganz so trivial ist. Ich habe in der Doku von Wikidata list gesehen, dass section optional ist. Ich dachte sie kann daher auch fehlen, also auskommentiert werden. Viele Grüße --Hundsrose (Diskussion) Benutzer Diskussion:MisterSynergy#c-Hundsrose-2018-12-05T14:56:00.000Z-Hundsrose-2018-12-04T12:50:00.000Z11Beantworten
Kurz bei enwiki die Diskussion überflogen: ja, es macht klar Sinn, dann nicht nach Lizenzen zu gruppieren. Du kannst nun selbst entscheiden, ob Du die Information da drin stehen lassen möchtest, oder nicht; vielleicht ist ja mittelfristig was anderes interessanter. Wegen der Auskommentierung: ich hätte das möglicherweise ähnlich versucht, aber der Bot ist halt gestolpert. Bei dem Ausfüllen von der Vorlage hilft häufig Ausprobieren, wenn etwas nicht wie erwartet klappt. Viele Grüße! —MisterSynergy (Diskussion) Benutzer Diskussion:MisterSynergy#c-MisterSynergy-2018-12-05T15:15:00.000Z-Hundsrose-2018-12-05T14:56:00.000Z11Beantworten

Ich habe die Anzahl der Spalten jetzt etwas verkürzt. Mir ist leider noch nicht ganz klar, wie in der zweiten Spalte das deutsche (und z.B nicht das englische) Label erkannt und anschließend auch verlinkt wird. Woher weiß ich dass der englische Link ?sitelinkEN:enwiki und nicht ?sitelinkEN heißt? Was war ?schema ? Ich habe die Wikidata-Hauptseite besucht, finde aber die Dokumentation zu Variablen und Parameter noch nicht (verstehe aber im Allgemeinen was Quantity und Property sind). Viele Grüße --Hundsrose (Diskussion) Benutzer Diskussion:MisterSynergy#c-Hundsrose-2018-12-05T18:13:00.000Z-Hilfe bei Wikidata List für Unix-Wikiprojekt11Beantworten

  • Zu den Spaltenüberschriften: eigentlich versucht der Bot, selbst was passendes da hinzuschreiben; wenn Du zum Beispiel im Parameter |column= unter anderem eine Spalte P31 definierst, dann schreibt der Bot die deutschsprachige Bezeichnung (in der deutschsprachigen Wikipedia) der Eigenschaft ist ein(e) (P31) da als Spaltenüberschrift hin (also "ist ein(e)"). Es gibt gemäß en:Template:Wikidata list auch einen optionalen Parameter |language=, mit dem Du eine andere Sprache auswählen kannst als die Standardsprache des Projektes, in dem Du Dich gerade befindest (ListeriaBot ist in ziemlich vielen verschiedensprachigen Projekten vorhanden). Auf der anderen Seite, wenn Du mit der automatisch generierten Spaltenüberschrift nicht zufrieden bist, dann kannst Du auch selbst eine vorgeben. Das wird mit Doppelpunkt von der Spaltendefinition getrennt, also bekommst Du beispielswiese bei "P31:foo" eine Spaltenüberschrift "foo" für die Spalte, in der die P31-Daten stehen. Spalten aus dem SPARQL-Ergebnis (also solche, die mit Fragezeichen beginnen), brauchen meines Wissens eigentlich immer eine händisch vorgegebene Spaltenüberschrift. Demnach greift "?sitelinkEN:enwiki" auf die SPARQL-Variable "?sitelinkEn" zu, und schreibt als Spaltenüberschrift "enwiki" drüber.
  • Zu "schema": ich nehme an, Du beziehst Dich auf das "schema" in der SPARQL-Abfrage. Das hat mit dem RDF-Modell zu tun. Ich habe glaub ich letztens schonmal länglich bei WP:FZW grob ausgeführt, wie SPARQL als Abfragesprache für Graphdatenbanken funktioniert: Graph in gerichtete Tripel zerlegen, davon haben wir gut 6 Milliarden, und dann Tripel mit bestimmten Eigenschaften suchen. Die Tripel kannst Du Dir als "Subjekt, Prädikat, Objekt"-Tripel vorstellen, wobei für alle drei Komponenten je nach Situation verschiedene "Vokabulare" in Frage kommen. Einige Vokabulare definiert Wikidata selbst (Objekte, Eigenschaften, etc.), andere sind Standard-Vokabulare. "schema" ist ein bei https://schema.org/ definiertes Standardvokabular, welches bei Wikidata unter anderem dafür genutzt wird, einen Sitelink zu einem Objekt in Relation zu setzen. Hier also: <Douglas Adams11> <http://schema.org/about> <http://www.wikidata.org/entity/Q42>; anschaulich: Douglas Adams (=Subjekt) ist ein Artikel über (=Prädikat) "Douglas Adams" (=Objekt). Etwas allgemeiner: wenn Du den Wikidata SPARQL Endpoint nutzen möchtest, brauchst Du zwei Dinge: Kenntnisse in SPARQL (der Abfragesprache), und Kenntnisse über das Wikidata-Datenmodell (wie also die Tripel in der Praxis aussehen). Für SPARQL dürften Deine mutmaßlich vorhandenen SQL-Kenntnisse helfen, auch wenn SPARQL durchaus anders ist, plus entweder ein (einfaches) Buch oder – so mache ich das – die SPARQL 1.1-Referenz. Das Wikidata-Datenmodell ist auf Objektseiten im Wikidata Web-Frontend nicht erkennbar, das ist jedoch unter mw:Wikibase/Indexing/RDF Dump Format vollumfänglich beschrieben; beachte darin insbesondere auch das Bild recht weit oben. Das Datenmodell erlernt man nicht mal ebenso nebenbei, sondern eher Schritt für Schritt durch verschiedene Anwendungsfälle.
MisterSynergy (Diskussion) Benutzer Diskussion:MisterSynergy#c-MisterSynergy-2018-12-05T22:55:00.000Z-Hundsrose-2018-12-05T18:13:00.000Z11Beantworten

Vielen Dank für deine Erklärungen.

  • Das mit der Formatierung der enwiki-Links machen wir später (ist aber nicht schwer). Erstmal: je Seite nur eine Listeria-Liste, bitte. Sonst weiß der Bot nicht, wo er hinschreiben soll ;-) Wenn Du das auf eine Version zurückgebaut hast, dann kann ich gern die enwiki-Links formatieren.
  • Beim Wikidata SPARQL Endpoint kannst Du üben und Abfragen ausprobieren. Wenn das darin klappt, dann (meistens) auch mit dem Listeria-Bot. Tatsächlich bin ich vor drei Jahren ähnlich unbedarft eingestiegen: ich hatte selbsterlernte, grundlegende SQL-Kenntnisse, und hab mir SPARQL dann ebenfalls selbst beigebracht und natürlich nebenbei auch das Wikidata-Datenmodell kennengelernt – so sehr, dass ich auf die genannten Links nur noch sehr selten zugreifen muss. Ausweislich Deiner Beitragsliste vermute ich, dass Du auch bereits SQL-Kenntnisse mitbringst, insofern wärest Du gut vorbereitet, auch SPARQL hinreichend gut zu lernen.
  • Dein Ansinnen, Objekte ohne dewiki-Artikel auszugeben, ist schon weit gediegen. Zwei Sachen: erstens entferne GROUP BY ?item ?sitelinkEn am Ende, da Du nichts weiter aggregierst (keine Operation GROUP_CONCAT(), SUM(), COUNT(), oder so). Dann kannst Du zweitens in der ersten Zeile auch ?sitelinkDE entfernen, weil das natürlich alles leer sein wird ;-)
Jetzt erstmal gute Nacht. —MisterSynergy (Diskussion) Benutzer Diskussion:MisterSynergy#c-MisterSynergy-2018-12-06T00:31:00.000Z-Hundsrose-2018-12-06T00:11:00.000Z11Beantworten

Weiblich bei der deWP vs. männlich bei VIAF/DNB

Hallöchen! Kannst du mal gucken, ob es noch so einen Fall wie bei Yang Lei (ist schon korrigiert, ev. Versionsgeschichte gucken) gibt, wo einer eindeutig weiblichen Person (deWP) Normdaten einer männlichen Person zugeordnet wurden? Es mag da sicher ein paar geben, welche eine Geschlechtsumwandlung machten, aber hoffentlich kaum welche wie dieser Fall. Danke! --Wurgl (Diskussion) Benutzer Diskussion:MisterSynergy#c-Wurgl-2018-11-15T10:14:00.000Z-Weiblich bei der deWP vs. männlich bei VIAF/DNB11Beantworten

Hallo Wurgl, ich kann die Geschlechter aus VIAF und GND mit denen in Wikidata (Geschlecht (P21)) vergleichen, basierend auf den Identifikator-Links VIAF-Kennung (P214) und GND-Kennung (P227) im jeweiligen Wikidata-Objekt. Weiter könnten wir mit Petscan Fälle finden, wo das Geschlecht in Wikidata und dewiki abweichend ist. Auf die dewiki-lokalen Identifikatoren kann ich bisher nicht direkt zugreifen.
Jedenfalls müsste ich sowieso erstmal ein bisschen Code schreiben, das schaffe ich frühestens heute Abend, spätestens (hoffentlich) am Wochenende. Die DNB würde ich über User:Jneubert’s SPARQL-Endpoint befragen, für VIAF habe ich den aktuellsten RDF-Dump bereits lokal vorliegen und die Geschlechter daraus ermittelt. Da könnte ich Dir aber auch eigentlich direkt die Textdatei mit VIAF-ID -> gender zukommen lassen (~115M Größe, ~5.48M Zeilen). —MisterSynergy (Diskussion) Benutzer Diskussion:MisterSynergy#c-MisterSynergy-2018-11-15T10:41:00.000Z-Wurgl-2018-11-15T10:14:00.000Z11Beantworten
Kein Stress! Weihnachten ist früh genug :-) Den DNB-Dump hab ich auch. Das Geschlecht lässt sich durch Kategorie:Mann vs. Kategorie:Frau ermitteln (gäbe dann noch ein paar in Kategorie:Person_nach_Geschlecht aber das sind so wenige, das muss nicht sein). Ich kann hier nur nicht diese zwei Datensätze direkt miteinander verknüpfen – ich müsste die zu Fuß einzeln vergleichen. Und es reicht erstmal der Vergleich Wikidata mit der DNB. --Wurgl (Diskussion) Benutzer Diskussion:MisterSynergy#c-Wurgl-2018-11-15T11:00:00.000Z-MisterSynergy-2018-11-15T10:41:00.000Z11Beantworten

So, hier wäre schonmal etwas:

Wenn ich das Ergebnis anschaue, sieht das aber so aus als seien das fast ausschließlich Fehler in der GND, nicht in Wikidata. Möglicherweise ist das jetzt kein so hilfreiches Ergebnis für Dich, denn Du hast ja implizit angenommen, dass die Informationen aus der GND korrekt sind, und Du per Abgleich hier Fehler finden kannst. Sieht aber eher so aus, als müssten im Wesentlichen die GND-Leute was reparieren (@Kolja21 bei der Gelegenheit).

Wegen der VIAF-Sache schicke ich Dir heute Abend eine Email mit den Rohdaten. Da kannste dann selbst vergleichen ;-) Viele Grüße, MisterSynergy (Diskussion) Benutzer Diskussion:MisterSynergy#c-MisterSynergy-2018-11-15T16:23:00.000Z-Weiblich bei der deWP vs. männlich bei VIAF/DNB11Beantworten

Ja is' denn heut schon Weihnachten? Ui, gleich der/die erste ist eine harte Nuss. Die Quellen sind Japanisch. Und Google übersetzt die sehr schlecht. Aber wenn ich den Lebenslauf (Einzelnachweis 1) bei google Translate einwerfe, dann steht schon im ersten Block "Tochter". Zweite Stichprobe ist wohl ein Fehler von filmportal.de --Wurgl (Diskussion) Benutzer Diskussion:MisterSynergy#c-Wurgl-2018-11-15T16:51:00.000Z-MisterSynergy-2018-11-15T16:23:00.000Z11Beantworten
Ich hab mir die beiden mal in Benutzer:Wurgl/Zeugs2 zurechtgelegt. Muss erstmal ein Gefühl dafür bekommen, bevor ich irgendwen mit Mails oder so zuschütte. (falls jemand mitliest, Hilfe ist willkommen). --Wurgl (Diskussion) Benutzer Diskussion:MisterSynergy#c-Wurgl-2018-11-15T19:41:00.000Z-Wurgl-2018-11-15T16:51:00.000Z11Beantworten
Danke für den Ping. Leider können wir diese Fehler nicht über das GND-Webformular korrigieren. (Ich vermute mal, es werden kaum Tp4 oder Tp6 darunter sein.) Ich würde vorschlagen, die Tabelle an die aktuelle Monatsliste unter WP:GND/F dranzuhängen. --Kolja21 (Diskussion) Benutzer Diskussion:MisterSynergy#c-Kolja21-2018-11-15T20:08:00.000Z-Wurgl-2018-11-15T19:41:00.000Z11Beantworten
Ich generier dann aus der Tabelle eine Fehlermeldungsliste für Copy/Paste. Aber erst möchte ich die einzeln anstarren. Wie gehen wir bei filmportal um? Denen eine Mail mit Hinweis schicken und hoffen, dass die dann die Änderungen auch bei der DNB machen, oder einfach an filmportal zusätzlich eine Mail? --Wurgl (Diskussion) Benutzer Diskussion:MisterSynergy#c-Wurgl-2018-11-15T20:16:00.000Z-Kolja21-2018-11-15T20:08:00.000Z11Beantworten
Das wäre auch eine Möglichkeit: Erst das Filmportal anschreiben, und dann die Meldung an die DNB, falls das Filmportal nicht die Korrekturen vornimmt. --Kolja21 (Diskussion) Benutzer Diskussion:MisterSynergy#c-Kolja21-2018-11-15T20:23:00.000Z-Wurgl-2018-11-15T20:16:00.000Z11Beantworten
 Info: Der Dump ist zwar am 6. November ins Netz gestellt worden, der Datenbestand ist wohl von vor dem 18. Oktober. Bei GND 1062238087 ist das schön zu sehen. Im Dump sind keine Lebensdaten enthalten, auf der Webseite aber schon. Und wenn man dann rechts bei "RDF (Turtle)-Repräsentation" reinguckt, dann ist dort das letzte Änderungsdatum zu sehen und das ist 2018-10-18T11:00:15.00 – ähnlich wie bei Adolf von Stählin. Denk dir also nix dabei. --Wurgl (Diskussion) Benutzer Diskussion:MisterSynergy#c-Wurgl-2018-11-16T10:35:00.000Z-MisterSynergy-2018-11-15T16:23:00.000Z11Beantworten
Danke, gut beobachtet. Ich hätte allerdings schon erwartet, dass die RDF-Einzeldateien auch jederzeit auf dem aktuellen Stand sind. Dass der Dump es nicht ist, ist ja selbstverständlich. —MisterSynergy (Diskussion) Benutzer Diskussion:MisterSynergy#c-MisterSynergy-2018-11-16T10:48:00.000Z-Wurgl-2018-11-16T10:35:00.000Z11Beantworten
Wobei das schon merkwürdig ist. Im RDF-Einzelfile von Stählin wird das Aktulisierungsdatum aktualisiert, aber die aktualisierten Daten nicht? Gemäß dieser archivierten Version stand da im Übrigen schon länger (2016-01-30) männlich in im Web-Frontend, und im archivierten RDF-Einzelfile female (2016-10-10). Da scheint doch irgendetwas kaputt zu sein. —MisterSynergy (Diskussion) Benutzer Diskussion:MisterSynergy#c-MisterSynergy-2018-11-16T10:56:00.000Z-MisterSynergy-2018-11-16T10:48:00.000Z11Beantworten
(BK) Hast jetzt flash verstanden. Die RDF-Einzeldaten sind am aktuellen Stand, nur der Dump ist aber älter als er vorgibt. (scheint am 13. Oktober nach 15 Uhr (GMT oder UTC) erzeugt worden zu sein) --Wurgl (Diskussion) Benutzer Diskussion:MisterSynergy#c-Wurgl-2018-11-16T11:04:00.000Z-MisterSynergy-2018-11-16T10:48:00.000Z11Beantworten
Bei Stählin passt es eben nicht. Er ist männlich im Web-Frontend [1] und weiblich im aktuellen RDF-Einzelfile [2] (Zeile 69). —MisterSynergy (Diskussion) Benutzer Diskussion:MisterSynergy#c-MisterSynergy-2018-11-16T11:07:00.000Z-Wurgl-2018-11-16T11:04:00.000Z11Beantworten
Der ist echt klasse! Ich schick mal ne Mail an meinen Kontakt und frag mal ganz blauäugig … aber zuerst muss ich ein Pizza inkorporieren ;^) --Wurgl (Diskussion) Benutzer Diskussion:MisterSynergy#c-Wurgl-2018-11-16T11:12:00.000Z-MisterSynergy-2018-11-16T11:07:00.000Z11Beantworten
Nette Antwort bekommen. Im Datensatz sind zwei Einträge zum Geschlecht und damit kann der Export nicht so toll umgehen. Wird bald korrigiert. Hier ist noch so ein ähnlicher Fall GND 119362252, sind wohl auch zwei Angaben aber nicht versehentlich, sondern wegen Geschlechtsangleichung. --Wurgl (Diskussion) Benutzer Diskussion:MisterSynergy#c-Wurgl-2018-11-16T15:45:00.000Z-Wurgl-2018-11-16T11:12:00.000Z11Beantworten
Magst du bitte mal einen Blick auf d:Q15447639 bzw. Yoshio Yoshida werfen? Da war eine Hausnummer als GND-ID zugeordnet und entsprechendes Chaos bei Wikidata. Vielleicht hab ich ja was übersehen oder falsch gemacht. Danke! --Wurgl (Diskussion) Benutzer Diskussion:MisterSynergy#c-Wurgl-2018-11-18T07:46:00.000Z-MisterSynergy-2018-11-15T16:23:00.000Z11Beantworten
An sich okay, wobei bei Fehlern der Größenordnung es angemessen ist, das alte Objekt als “ill-defined” zu löschen, und die Informationen in ein neues Objekt zu übertragen. Ich mache das mal eben, danke für den Hinweis… —MisterSynergy (Diskussion) Benutzer Diskussion:MisterSynergy#c-MisterSynergy-2018-11-18T08:25:00.000Z-Wurgl-2018-11-18T07:46:00.000Z11Beantworten
Es gibt nun Yoshio Yoshida (Q58835715) und Valerie Etienne (Q4007836), welches ebenfalls ein paar neue Aussagen bekommen hat. Das alte Objekt ist gelöscht. Ursache waren wohl falsche Normdaten im dewiki-Artikel, und dann Importe basierend auf der falschen VIAF-ID. —MisterSynergy (Diskussion) Benutzer Diskussion:MisterSynergy#c-MisterSynergy-2018-11-18T08:37:00.000Z-MisterSynergy-2018-11-18T08:25:00.000Z11Beantworten
Danke! Das war der zweite Fehler hier in der deWP. Von den Fehlerchens in der DNB ist GND 115366148 mein Favorit! Hab hier mehr Fehler erwartet, aber ist so besser. --Wurgl (Diskussion) Benutzer Diskussion:MisterSynergy#c-Wurgl-2018-11-18T09:29:00.000Z-MisterSynergy-2018-11-18T08:37:00.000Z11Beantworten

Hilfe bei Commons-Wartungskategorie

Moin Moin MisterSynergy, ich schaue mal, ob ich bei dir richtig bin, bzw. ob du mir helfen kannst. Ich versuche auf Commons Wartungskategorien abzuarbeiten, die in Zusmamenhang mit der Wikidata Infobox stehen. Dabei ist mir aufgefallen, dass ich zu Fuß viel zu langsam bin. Es geht z.B. um commons:Category:Uses of Wikidata Infobox with no given name, hier kommen immer wieder gleiche Vornamen vor. Gibt es eine Möglichkeit, sich diese Kategorie in eine Art Excel zu ziehen, eine P-Nummer und eine Q-Nummer zu vergeben und automatisiert einzulesen? Danke schonmal vorab, Rückfragen und/oder Anregungen nehme ich gerne entgegen. mfg --Crazy1880 Benutzer Diskussion:MisterSynergy#c-Crazy1880-2018-11-29T06:33:00.000Z-Hilfe bei Commons-Wartungskategorie11Beantworten

Hallo Crazy1880, ja tatsächlich kann man in solch einem Fall automatisieren. Das populärste Tool dafür heißt „QuickStatements“, und dafür gibt es bei wikidata:Help:QuickStatements ein umfassendes Manual. Den Tool-Input kannst Du tatsächlich mit Excel vorbereiten, dazu gibt es Screenshots im Manual (die Tool-Oberfläche sieht allerdings mittlerweile ein bisschen anders aus). Es gibt auch einfache Tutorial-Videos dazu, zum Beispiel hier (ebenfalls mit der leicht veralteten Tool-Oberfläche).
Ob das gerade bei Vornamen jetzt besonders hilfreich ist, will ich aber mal bezweifeln. Die Vorname (P735)-Eigenschaft ist bereits relativ stark verbreitet, und der Blick in die Commons-Wartungskategorie zeigt weiterhin, dass vor allem eher ungewöhnliche Vornamen fehlen, bei denen dazu Transkription aus einem anderen Schriftsystem eine Rolle spielt. Dazu gibt es oft noch keine Objekte. Vielleicht kannst Du hier und da 10 Vornamen ergänzen, so richtig wirst Du aber keine Bäume ausreißen können.
In commons:Category:Wikidata infobox maintenance fallen vor allem drei Wartungskategorien auf, die augenscheinlich echten Wartungsbedarf anzeigen:
Grundsätzlich scheinst Du über Petscan mit dem Batch-Editing in Wikidata vertraut zu sein, aber QuickStatements hast Du offenbar noch nicht genutzt. Unabhängig davon ob das in dieser Sache jetzt wirklich weiterhilft, kannst Du Dir das Tool merken und vielleicht später irgendwann einsetzen. Bei Fragen helfe ich gern weiter. Viele Grüße! —MisterSynergy (Diskussion) Benutzer Diskussion:MisterSynergy#c-MisterSynergy-2018-11-29T07:23:00.000Z-Crazy1880-2018-11-29T06:33:00.000Z11Beantworten
Moin und danke für die schnelle Antwort.
  • Hast du rein zufällig noch ein Tool, was aus Kategorie eine Excel-Datei macht?
  • Ja, die Kategorien stehen früher oder später auch mit auf dem Plan.
mfg --Crazy1880 Benutzer Diskussion:MisterSynergy#c-Crazy1880-2018-11-29T09:59:00.000Z-MisterSynergy-2018-11-29T07:23:00.000Z11Beantworten
„Hast du rein zufällig noch ein Tool, was aus Kategorie eine Excel-Datei macht?“ — ich verstehe nicht so recht. Möchtest Du alle Wikidata-Objekte von Membern einer Kategorie in Commons in Excel haben? Dann wäre Petscan das richtige Tool. Wenn Du mir eine Kategorie zeigst, mache ich Dir den Link fertig. —MisterSynergy (Diskussion) Benutzer Diskussion:MisterSynergy#c-MisterSynergy-2018-11-29T10:03:00.000Z-Crazy1880-2018-11-29T09:59:00.000Z11Beantworten
Korrekt, die oben verlinkt Kategorie: commons:Category:Uses of Wikidata Infobox with no given name hätte ich gerne mit den Einträgen in Excel. Wenn ich es versuche, bekomme ich nur vier Einträge angezeigt. ;(
Dann stelle ich mir vor, dass man in einer Spalte in Excel die P-Nummer und eine Spalte mit Q-Nummer füllt und diese dann einlesen lassen kann. Hoffentlich geht soetwas.
mfg --Crazy1880 Benutzer Diskussion:MisterSynergy#c-Crazy1880-2018-11-29T11:54:00.000Z-MisterSynergy-2018-11-29T10:03:00.000Z11Beantworten
Dann wohl das hier. Du müsstest noch beim „Output“-Tab das TSV- oder CSV-Format einstellen, damit das einfach in Excel reinzukopieren ist. —MisterSynergy (Diskussion) Benutzer Diskussion:MisterSynergy#c-MisterSynergy-2018-11-29T12:29:00.000Z-Crazy1880-2018-11-29T11:54:00.000Z11Beantworten
Okai, zu doof dazu. Ich gebe in QuickStatement ein "Q6586284TABP735TABQ16002118" so wie in der Hilfe beschrieben und bekomme => No valid commands found. Die Doku finde ich persönlich auch eher schlecht und auch das Video hilft mir nicht. mfg --Crazy1880 Benutzer Diskussion:MisterSynergy#c-Crazy1880-2018-11-29T18:36:00.000Z-MisterSynergy-2018-11-29T12:29:00.000Z11Beantworten
Kopiervorlage:
Q6586284	P735	Q16002118
Versuch das bitte im QuickStatements-Tool einzugeben (einloggen, "Neuer Stapel", ins Textfeld reinkopieren, dann "V1 Anweisungen importieren" klicken). Bei mir funktioniert das… —MisterSynergy (Diskussion) Benutzer Diskussion:MisterSynergy#c-MisterSynergy-2018-11-29T20:11:00.000Z-MisterSynergy-2018-11-29T12:29:00.000Z11Beantworten
Moin, ahh, wenn ich den Tab von extern hereinkopiere, dann scheint es zu laufen. Wenn ich dort Tab drücke, springe ich nur zur nächsten Schaltfläche. Wenn man weis wie's läuft. Danke, ich schaue da mal. mfg --Crazy1880 Benutzer Diskussion:MisterSynergy#c-Crazy1880-2018-11-30T09:45:00.000Z-Crazy1880-2018-11-29T06:33:00.000Z11Beantworten

Nun Namensabgleich *seufz*

Hallöchen!

Ich versuche gerade was zu basteln, das die Namen bei uns (Lemma + Alternative Namen in Vorlage Personendaten) mit den Namen (und Varianten) bei der DNB abgleicht. Wobei ich mich mal auf Personen beschränke. 352.000 Personen mit DNB gibts momentan hier. Und bei 307.000 gibt es auch eine 1:1-Übereinstimmung. Mit etlichen Schätz-O-Maten hab ich das mal etwas reduziert, bin jetzt bei 12.700 (wobei sich 2900 davon nur durch einen Buchstaben unterscheiden), sind aber immer noch viel zu viele. Ich will so auf 1000 runterkommen, wird aber wohl nicht klappen.

So nebenbei beim Durchgucken der Debug-Ausgaben hab ich ich schon mal zwei gefunden und korrigiert: Oskar Lapp (da war ein Fritz Lapp drangehängt) und Franz Jakob Späth (da war ein Franz Joseph Späth dran). --Wurgl (Diskussion) Benutzer Diskussion:MisterSynergy#c-Wurgl-2018-11-30T18:54:00.000Z-Nun Namensabgleich *seufz*11Beantworten

Moin! Ich verstehe das weitgehend, aber hast Du jetzt eine Aufgabe für mich, oder brauchst Input?
Leicht offtopic: ich habe mal zur Rotlinkkorrektur in Wikipedia verschiedene Namensvergleichsskripte geschrieben, die vor allem Levenshtein-Distanzen und ein paar ähnliche Metriken zwischen zwei Strings (Namen) ausgerechnet haben; solche Funktionen sind in PHP und Python eingebaut, oder einfach als Modul zu ergänzen, und möglicherweise auch in anderen Skriptsprachen verfügbar. Wenn man diese Stringähnlichkeits-Metriken ausrechnet, kann man dann besonders deutliche Abweicher auflisten und diese zuerst anschauen. Viele Grüße! —MisterSynergy (Diskussion) Benutzer Diskussion:MisterSynergy#c-MisterSynergy-2018-11-30T21:41:00.000Z-Wurgl-2018-11-30T18:54:00.000Z11Beantworten
Moin ist erst in 30 Minuten *kicher* Levensthein hab ich implementiert, das sind die 2900. Das Problem sind die einerseits die transkribierten Namen aus kyrillischem und arabischem Zeichensatz und zusätzliche Namensteile bei der deWP und bzw. bei der DNB und da schlägt Levensthein extrem aus. Ich bin am Überlegen, ob ich noch die Namensversionen (Lemmata) der anderssprachigen Wikipedias vergleiche, eventuell reduziert das weiter. Oder bei Wikidata dieses "Auch bekannt als" … Wenn du da Ideen hast?
Beispiele für Problemfälle: Anatoli Borissowitsch Tschubais oder ʿAbd al-Qādir al-Dschīlānī für die Transkription. Hans Wilbert Petri (der Wilbert) und John Ponsonby, 4. Earl of Bessborough (der Willliam, nicht der 4. Earl etc.) für zusätzliche Namensteile. --Wurgl (Diskussion) Benutzer Diskussion:MisterSynergy#c-Wurgl-2018-11-30T22:41:00.000Z-MisterSynergy-2018-11-30T21:41:00.000Z11Beantworten
Ich fürchte, bei Transkriptionen wird wenig zu machen sein. Das ist ja so eine Wissenschaft für sich, das macht jeder irgendwie anders. Für den Petri kannst Du in Fällen, wo zwei Leerzeichen im Namen drin sind, mal wahlweise den mittleren oder einen anderen Namensbestandteil weglassen. Wobei das natürlich dann auch schnell falsch-negative Ergebnisse generiert.
Aliase von Wikidata könntest Du zwar auch vergleichen, da habe ich aber wenig Hoffnung, dass Dich das substantiell weiterbringt. Ist vermutlich den Aufwand nicht wert. Ansonsten würde ich bei 2900 Fällen vorschlagen, eine Arbeitsliste irgendwo einzustellen, beispielsweise mit alphabetischer Untergliederung nach Name, und dann mit scharfem Auge vermeintliche Problemfälle rauszufischen. —MisterSynergy (Diskussion) Benutzer Diskussion:MisterSynergy#c-MisterSynergy-2018-12-03T21:42:00.000Z-Wurgl-2018-11-30T22:41:00.000Z11Beantworten
Umgekehrt wird ein Schuh draus. 2.900 sind es, wo genau ein Buchstabe unterschiedlich ist. Knapp 10.000 wo mehr unterschiedlich ist und diese 10.000 wären zu kontrollieren.
Ich glaub ich werde das mal nach Ländern teilen und erstmal diese Transkribierten weglassen. Für diese werd ich dann mal gucken, ob es einen sprachspezifischen Soundex (oder sowas) gibt oder selber mal sowas in der Art ausschwitzen.
Bei den Daten aus Wikidata hätte ich zumindest andere Transkriptionen dabei. Das war da die Idee. Aber erstmal ein paar Nächte drüberschlafen, vielleicht fällt mir noch was ein. --Wurgl (Diskussion) Benutzer Diskussion:MisterSynergy#c-Wurgl-2018-12-03T21:54:00.000Z-MisterSynergy-2018-12-03T21:42:00.000Z11Beantworten
Moin Moin Wurgl, wenn du Hilfe brauchst, lass es mich wissen. Ich übertrage auch viel nach Wikidata bzw. korrigiere dort Dinge. Gib mir eine Wartungsliste und wir schauen, wo wir angreifen können. mfg --Crazy1880 Benutzer Diskussion:MisterSynergy#c-Crazy1880-2018-12-04T17:04:00.000Z-Wurgl-2018-11-30T18:54:00.000Z11Beantworten
Danke, danke! Ich brauch manchmal einfach nur Ideen und die kommen, wenn ich das Problemchen irgendwem erzähle. Das Programmieren ist nicht das Problem. Ich werde mal gucken, wieviele rausfallen bei denen Geburtsdatum und Sterbedatum (falls vorhanden) bis auf den Tag exakt gleich sind. Und dann als nächsten Schritt eventuell nach Ländern aufteilen (das Land ist ja im DNB-Dump enthalten). --Wurgl (Diskussion) Benutzer Diskussion:MisterSynergy#c-Wurgl-2018-12-04T19:44:00.000Z-Crazy1880-2018-12-04T17:04:00.000Z11Beantworten

Wikiläum

Hallo MisterSynergy,
gibt es irgendeine Möglichkeit, bei deinem Tool zur Ermittlung des Wikiläums importierte Edits nicht zu berücksichtigen? Bei mir gibt es z.B. zwei vom 24. September 2004, die nicht von mir, sondern dem damaligen Stefan bei en:wp sind. Das kriegt man aber vermutlich weder in der Versionsgeschichte, folglich auch nicht in deinem Tool gerade gebogen, oder? Mein erster Edit war nämlich erst am 2. Januar 2005. Viele Grüße, --Stefan »Στέφανος«⸘…‽ Benutzer Diskussion:MisterSynergy#c-Stefan-2018-12-04T20:41:00.000Z-Wikiläum11Beantworten

Hallo Stefan, das Problem uneindeutiger Benutzernamen aus der Prä-SUL-Zeit hatte ich bisher nicht auf dem Schirm.
Ich habe gerade einmal in der Datenbank nachgeschaut, in der Tabelle mit den Versionen. Bei den beiden fraglichen Edits im September 2004 steht Dein Benutzername und auch Deine dewiki-Benutzerkennung 54681 dran. Die Beiträge erscheinen ja auch in Deiner Beitragsliste. Ich fürchte, das Import-Tool war damals halt nicht gut genug, und ich könnte mir vorstellen, dass solche Situationen kaum sinnvoll nachträglich zu ermitteln sind.
Was meist möglich sein sollte, wäre ein Vergleich von Zeitpunkt des ersten Edits mit dem Anmeldezeitpunkt. Letztere muss zwingend vor ersterem liegen. Allerdings auch da: Dein Benutzeraccount so so alt, damals gab es kein Neuanmeldungslogbuch und entsprechend keine Information, wann Du Deinen Account registriert hast. Deinen speziellen Fall kann ich so nicht entdecken.
Jedenfalls würde ich WolfgangRieger einmal informieren wollen, damit er im Zweifel auf diesen Umstand aufpasst (mit diesem Ping hoffentlich erledigt). Ich denke aber auch drüber nach, wie ich der Sache codetechnisch begegnen könnte. Für weitere Hinweise und ggf. Fälle bin ich dankbar. Viele Grüße —MisterSynergy (Diskussion) Benutzer Diskussion:MisterSynergy#c-MisterSynergy-2018-12-04T21:03:00.000Z-Stefan-2018-12-04T20:41:00.000Z11Beantworten
Danke für deine Antwort und das Mitdenken. Ja, wahrscheinlich gibt es noch ziemlich viele ähnliche Fälle, du hast Recht, damals™ war die Software noch nicht so ganz ausgereift, aber das macht Wikipedia auch irgendwie schön, dass man sieht, wie sie gewachsen ist. Man kriegt das vermutlich nie auseinander, bei mir sind es ja auch nur zwei Edits, vielleicht gibt es noch Accounts, wo das Thema relevanter ist. Ich frage mal auf FZW nach. Gruß, --Stefan »Στέφανος«⸘…‽ Benutzer Diskussion:MisterSynergy#c-Stefan-2018-12-05T07:50:00.000Z-MisterSynergy-2018-12-04T21:03:00.000Z11Beantworten
Ich habe die entsprechenden Daten vermerkt. Danke. -- Wolfgang Rieger (Diskussion) Benutzer Diskussion:MisterSynergy#c-WolfgangRieger-2018-12-06T15:42:00.000Z-Stefan-2018-12-05T07:50:00.000Z11Beantworten