Benutzer Diskussion:Stefan Kühn/Check Wikipedia/Archiv/2008/Sep

aus Wikipedia, der freien Enzyklopädie
Letzter Kommentar: vor 15 Jahren von Stefan Kühn in Abschnitt Erkennungsfehler?
Zur Navigation springen Zur Suche springen

nowiki, source and such

Hi. The algorithm you use seems to omit some cases. Before you check for any syntax errors in articles you should clean it up from nowiki and such. I have a Javascript code for that which you can use. Not sure if it will be easy to change to Perl, but I hope this helps.

	//
	// remove nowiki and such (str is an article string)
	var re = /<(nowiki|pre|source|math)(|[ \t\n][^>]*)>/g;
	var m;
	// until opening tag was found
	for (var t_i = 0; (m=re.exec(str))!=null; t_i++)
	{
		var start, end, re_end;
 
		start = m.index;
 
		// find end tag: </tag([ \t\n]*)>
		re_end = new RegExp("</"+m[1]+"([ \t\n]*)>", "g")
		m = re_end.exec(str.substring(re.lastIndex));
		end = (m==null) ? str.length : re.lastIndex+re_end.lastIndex;
 
		// remove from string
		str = str.substring(0,start)+str.substring(end);
 
		// next search from start
		re.lastIndex = start;
	}

Full code for that, which actually only hides and then shows nowiki, is here - search for "Class: wp_sk.nowiki" (most comments in Polish, sorry ;)). --Nux (talk) Benutzer Diskussion:Stefan K%C3%BChn/Check Wikipedia/Archiv/2008/Sep#c-EcceNux-2008-09-13T12:46:00.000Z-nowiki, source and such11

I replace at the moment this tags with blanks. It work very well. Why should I change the script? -- sk Benutzer Diskussion:Stefan K%C3%BChn/Check Wikipedia/Archiv/2008/Sep#c-Stefan Kühn-2008-09-13T19:29:00.000Z-EcceNux-2008-09-13T12:46:00.000Z11
It seemed not to work correctly in some cases e.g. pl:Jedynkowy_system_liczbowy was in the section 'Headlines start with one "="', but it's not there any more, so I guess it's OK. --Nux (talk) Benutzer Diskussion:Stefan K%C3%BChn/Check Wikipedia/Archiv/2008/Sep#c-EcceNux-2008-09-13T21:32:00.000Z-Stefan Kühn-2008-09-13T19:29:00.000Z11
This in pl was a other problem. I forgot to delete the "pre"-Tag and so the text inside the pre tag were checked. :-) -- sk Benutzer Diskussion:Stefan K%C3%BChn/Check Wikipedia/Archiv/2008/Sep#c-Stefan Kühn-2008-09-14T07:28:00.000Z-EcceNux-2008-09-13T21:32:00.000Z11

Rechtschreibfehler

Die einzige etwas schräge Formulierung, die ich auch irgendwie nicht verbessern konnte ist: This error was found: 411. Im Englischen muss es eigentlich heißen This error was found 411 times. Ich bin mir aber nicht sicher, ob man das in dem Skript so umprogrammieren kann, dass hinter der Zahl noch das "times" steht. Wenn nicht.. ist auch kein Beinbruch, versteht man ja trotzdem. -- Louisana Benutzer Diskussion:Stefan K%C3%BChn/Check Wikipedia/Archiv/2008/Sep#c-Louisana-2008-09-18T13:52:00.000Z-Rechtschreibfehler11


The WikiProject Check Wikipedia will help to clean the syntax of wikipedia and to find some other errors

Alphatest - At the moment the script has some bugs and not every error on this page is an actual error. I am working on a stable version at the moment and hope that I will be able to go into the beta test some time soon.

  • Last scan: The script found 3996 errors in 3572 articles. (The search was limited to 5000 errors in the last dump scan.)
  • Scan begin: 2008-09-18 03:43 (GMT, Toolserver)
  • Scan end: 2008-09-18 04:09 (GMT, Toolserver)
  • Durration: 26 minutes 28 secounds
  • Next scan: normally in 24 hours, than please copy this page on toolserver on this page. (Attention: UTF8)

Project description in other languages

The translation of the description page will follow in the future. Once the project works stable the text on this page can be translated.


Project description in English

  • What is the goal of this project?
    • This project should help to clean up the data of all articles in many different languages.
    • If we have a clear and clean syntax in all articles more projects (for example: Wikipedia-DVD) can use our data more easily.
    • The project was inspired by en:Wikipedia:WikiProject Wiki Syntax.
    • In order to use the data of a Wikipedia project without the Mediawiki software you need to write a parser. If many articles have wrong syntax it is difficult to programm the parser since it needs to be complex enough to recognize the syntax errors.
    • This project helps to find many errors in all kinds of language and will support many languages in the future: cs, da, de, en, es, fr, it, nl, nds, nds-nl, pl, pt, ru, sv, ... (and more languages in the future)
  • How does it work?
    • The script scans every new dump and creates a list of articles with errors.
    • The script scans all articles on the list again on a daily basis to create a new list for the users which omitts already corrected articles.
    • The script is written in Perl by: Stefan Kühn
    • You can download the script here. It is licenced under GFDL.
    • New features, last changes and discussion.
  • What can you do?
    • The script creates a new error page at the toolserver every day. Please copy and paste that page on the toolserver to this page here. Attention: That page is a UTF-8 document. In case your browser cannot display the file in UTF-8 you can copy it into a text editor (for example: Notepad++) and convert it to UTF-8.
    • You can fix an error in one or more articles.
    • You can delete all fixed articles from this list.
    • If all articles in one category have been fixed you can delete this category.
    • You can suggest a new category of errors to the author of the script.
    • You can inform the author, too if you want this project to be implemented into your language's Wikipedia.
  • Please don't...
    • Insert an article by hand since it will disappear from the list with the next automatic update of this page.
    • try to fix spelling mistakes within this page since all manual changes will disappear as well with the next update. Instead, send an e-mail or message to the author so he can fix the spelling in the script.


High priority


Headlines start with three "="

The first headline start with "=== XY ===". It should only be "== XY ==".

This error was found: 411 - The output was limited to 200 article.


Image without description

The article has an image without a description. In order to provide good accessibility for everyone (e.g. blind people) a description for every image is needed.

This error was found: 30


Medium priority

Headline hierarchy

After a headline of level 1 (==) should not be a headline of level 3 (====).

This error was found: 469 - The output was limited to 200 article.


Lowest priority

Article with wrong <br> tag

This article contains a <br> or </br> or <br/> but a <br /> tag is necessary in order to be correct XHTML-syntax. There has to be a space in between "br" and the slash.

This error was found: 2679 - The output was limited to 200 article.


HTML list tags

Article contains a "<ol>", "<ul>" or "<li>". The Mediawiki software is very flexible but we don't need these HTML tags.

This error was found: 121


HTML text style tags

Article contains a "<b>" or "<p>" or "<i>". The Mediawiki software is very flexible but we don't need these HTML tags.

This error was found: 193


Vielen, vielen Dank. Mein Englisch hat sich zwar schon etwas verbessert, aber viele Fehler schleichen sich trotzdem ein, wenn man nicht genug übt. Danke Dir für die tolle Hilfe. Hab alles im Skript geändert. Schaue es dir einfach morgen mal in der neuen Ausgabe an. -- sk Benutzer Diskussion:Stefan K%C3%BChn/Check Wikipedia/Archiv/2008/Sep#c-Stefan Kühn-2008-09-18T19:03:00.000Z-Rechtschreibfehler11
"omitts" ist doch sicherlich ein Tippfehler von dir oder? -- sk Benutzer Diskussion:Stefan K%C3%BChn/Check Wikipedia/Archiv/2008/Sep#c-Stefan Kühn-2008-09-18T19:05:00.000Z-Stefan Kühn-2008-09-18T19:03:00.000Z11
Ja, tut mir leid, nur 1 t, also omits. -- Louisana Benutzer Diskussion:Stefan K%C3%BChn/Check Wikipedia/Archiv/2008/Sep#c-Louisana-2008-09-18T19:50:00.000Z-Stefan Kühn-2008-09-18T19:05:00.000Z11

Userspace

Would it be useful to omit the results from the user namespace from the output? Firstly the syntax isn't as important on them, for example the headline levels of one's userpage are irrelevant, and secondly the tinkering with other peoples' userpages is heavily frowned upon at least in fiwiki. --Albval Benutzer Diskussion:Stefan K%C3%BChn/Check Wikipedia/Archiv/2008/Sep#c-Albval-2008-09-22T10:14:00.000Z-Userspace11

I think for many errors we only need the article-namespace. I can deactivated this for usernamespace. But at the other site it will helpfull if we have everywhere a currect syntax. -- sk Benutzer Diskussion:Stefan K%C3%BChn/Check Wikipedia/Archiv/2008/Sep#c-Stefan Kühn-2008-09-22T11:51:00.000Z-Albval-2008-09-22T10:14:00.000Z11
I agree: the errors that affect page functionality should be checked from all namespaces (odd number of brackets etc.), but errors like headline levels that only affect the layout conventions of articles should be IMHO restricted to the article namespace. --Albval Benutzer Diskussion:Stefan K%C3%BChn/Check Wikipedia/Archiv/2008/Sep#c-Albval-2008-09-23T04:57:00.000Z-Stefan Kühn-2008-09-22T11:51:00.000Z11
Ok, thats right. -- sk Benutzer Diskussion:Stefan K%C3%BChn/Check Wikipedia/Archiv/2008/Sep#c-Stefan Kühn-2008-09-23T06:22:00.000Z-Albval-2008-09-23T04:57:00.000Z11

Ideas for more errors

 Ok -- sk Benutzer Diskussion:Stefan K%C3%BChn/Check Wikipedia/Archiv/2008/Sep#c-Stefan Kühn-2008-09-14T18:44:00.000Z-Ideas for more errors11
  • For Norwegian (no, nn) and Danish (da), the letters ÆØÅæøå should be allowed in DEFAULTSORT.
 Ok -- sk Benutzer Diskussion:Stefan K%C3%BChn/Check Wikipedia/Archiv/2008/Sep#c-Stefan Kühn-2008-09-17T19:57:00.000Z-Ideas for more errors11
After this was fixed, a strange error appears: In the 2008-09-18 version of nowiki (no:Wikipedia:WikiProject Check Wikipedia), the remaining characters are invalid UTF-8. They seem to be missing the initial 0xC2 or 0xC3 byte value. The code looks like this
[[:Agnetha Fältskog]] || <nowiki>�</nowiki> || <nowiki>DEFAULTSORT:Fältskog, Agnetha</nowiki>
I think this is a problem of the copy process. For example use Notepade++. Open a new document in "ANSI", insert the output, konvert it to "UTF-8 without BOM". With this procedure I have never a problem. -- sk Benutzer Diskussion:Stefan K%C3%BChn/Check Wikipedia/Archiv/2008/Sep#c-Stefan Kühn-2008-09-19T20:00:00.000Z-Stefan Kühn-2008-09-17T19:57:00.000Z11
I think you are wrong. As you can see, the ä in Fältskog is correctly encoded, but the single "ä" inside the nowiki tag is broken. This doesn't happen in other languages, only in Norwegian. --LA2 Benutzer Diskussion:Stefan K%C3%BChn/Check Wikipedia/Archiv/2008/Sep#c-LA2-2008-09-19T22:18:00.000Z-Stefan Kühn-2008-09-19T20:00:00.000Z11
 Ok -- sk Benutzer Diskussion:Stefan K%C3%BChn/Check Wikipedia/Archiv/2008/Sep#c-Stefan Kühn-2008-09-19T20:03:00.000Z-Ideas for more errors11
 Ok -- sk Benutzer Diskussion:Stefan K%C3%BChn/Check Wikipedia/Archiv/2008/Sep#c-Stefan Kühn-2008-09-20T16:25:00.000Z-Ideas for more errors11
 Ok -- sk Benutzer Diskussion:Stefan K%C3%BChn/Check Wikipedia/Archiv/2008/Sep#c-Stefan Kühn-2008-09-20T19:18:00.000Z-Ideas for more errors11
I will include this, but first I work at the translation for all languages. -- sk Benutzer Diskussion:Stefan K%C3%BChn/Check Wikipedia/Archiv/2008/Sep#c-Stefan Kühn-2008-09-22T11:44:00.000Z-Ideas for more errors11

Please use this page Benutzer:Stefan Kühn/Check Wikipedia -- sk Benutzer Diskussion:Stefan K%C3%BChn/Check Wikipedia/Archiv/2008/Sep#c-Stefan Kühn-2008-09-24T06:53:00.000Z-Ideas for more errors11

Komplette Übersetzungsvorlage

Hallo Stefan,

ein großes Lob für die Erstellung dieses Scripts. Ich habe bereits einen Script geschrieben, welcher die Überschriften automatisch berichtigt. Andere Features werde ich noch einfließen lassen (<br /> berichtigung , Klammern schließen, Tabelle beenden). Ist das <br /> in dewiki eigentlich noch erwünscht? Ich frage nur, weil du es der Statistik abgeschaltet hast.

Nun zu meinem Anliegen: Könntest du bitte auch noch eine Übersetzungsvorlage für die Kopftexte (alles über Top priority) erstelle, diese gibt es nämlich im Moment nicht bzw. werden auf der Übersetzungsseite nicht angezeigt. -- lateiner Benutzer Diskussion:Stefan K%C3%BChn/Check Wikipedia/Archiv/2008/Sep#c-Lateiner-2008-09-21T22:29:00.000Z-Komplette Übersetzungsvorlage11

Danke für das Lob. Die Übersetzungsfunktion ist noch in Entwicklung und noch nicht fertig. Auch gut zu sehen an der noch nicht übersetzten Ausgabe von de. Ich hab gestern abend da viel gemacht, bin aber nicht fertig geworden. Der Starttext kommt auf jeden Fall noch. -- sk Benutzer Diskussion:Stefan K%C3%BChn/Check Wikipedia/Archiv/2008/Sep#c-Stefan Kühn-2008-09-22T11:42:00.000Z-Lateiner-2008-09-21T22:29:00.000Z11
Übersetzungsfunktion ist fertig. -- sk Benutzer Diskussion:Stefan K%C3%BChn/Check Wikipedia/Archiv/2008/Sep#c-Stefan Kühn-2008-09-24T06:00:00.000Z-Stefan Kühn-2008-09-22T11:42:00.000Z11

Correct

Your spelling of correct as currect is a pain in the eye :-). Is it possible to get it correct in the script. I would like to thank you for the initiative to make nowp more correct. --Harald Haugland Benutzer Diskussion:Stefan K%C3%BChn/Check Wikipedia/Archiv/2008/Sep#c-Harald Haugland-2008-09-23T20:09:00.000Z-Correct11

;-) ok. -- sk Benutzer Diskussion:Stefan K%C3%BChn/Check Wikipedia/Archiv/2008/Sep#c-Stefan Kühn-2008-09-24T06:51:00.000Z-Harald Haugland-2008-09-23T20:09:00.000Z11

Talkpages

Hi, Again :). Could you remove all talk pages from most checks on pl-wiki? I'm not sure if strict code correctness is important on talk pages, but (as per Usernamespace above) you could check only top priorities on talk pages. Thanks in advance, --Nux (talk) Benutzer Diskussion:Stefan K%C3%BChn/Check Wikipedia/Archiv/2008/Sep#c-EcceNux-2008-09-23T22:03:00.000Z-Talkpages11

ok. -- sk Benutzer Diskussion:Stefan K%C3%BChn/Check Wikipedia/Archiv/2008/Sep#c-Stefan Kühn-2008-09-24T06:52:00.000Z-EcceNux-2008-09-23T22:03:00.000Z11

Sprachliche Verbesserungen

bitte schau mal auf [1]. Danke! --UV Benutzer Diskussion:Stefan K%C3%BChn/Check Wikipedia/Archiv/2008/Sep#c-UV-2008-09-23T23:43:00.000Z-Sprachliche Verbesserungen11

 Ok. I write this on my Benutzer:Stefan_Kühn/Check_Wikipedia#To-do-list. -- sk Benutzer Diskussion:Stefan K%C3%BChn/Check Wikipedia/Archiv/2008/Sep#c-Stefan Kühn-2008-09-24T06:02:00.000Z-UV-2008-09-23T23:43:00.000Z11

Errors missing

The latest output for fiwiki contains only about 15 entries, although the previous one has still hundreds of unchecked ones (that haven't been fixed). Do you have any idea where all the errors have gone? --Albval Benutzer Diskussion:Stefan K%C3%BChn/Check Wikipedia/Archiv/2008/Sep#c-Albval-2008-09-24T11:07:00.000Z-Errors missing11

Show here Benutzer:Stefan Kühn/Check Wikipedia#News. I have start the process again. And now it works. Wait some hours and than you have a new page. :-) -- sk Benutzer Diskussion:Stefan K%C3%BChn/Check Wikipedia/Archiv/2008/Sep#c-Stefan Kühn-2008-09-24T11:37:00.000Z-Albval-2008-09-24T11:07:00.000Z11
At the moment the script scan dawiki. -- sk Benutzer Diskussion:Stefan K%C3%BChn/Check Wikipedia/Archiv/2008/Sep#c-Stefan Kühn-2008-09-24T11:38:00.000Z-Stefan Kühn-2008-09-24T11:37:00.000Z11
Ah, should have read everything first:-) Thanks! --Albval Benutzer Diskussion:Stefan K%C3%BChn/Check Wikipedia/Archiv/2008/Sep#c-Albval-2008-09-24T12:07:00.000Z-Stefan Kühn-2008-09-24T11:38:00.000Z11

I must abort the scan. Now I have fix the script and it work very well. Tomorrow you have a new page. -- sk Benutzer Diskussion:Stefan K%C3%BChn/Check Wikipedia/Archiv/2008/Sep#c-Stefan Kühn-2008-09-24T19:18:00.000Z-Errors missing11

ol, ul and li

These should not be included if they are in an image description, since # and * doesn't work there. /Grillo Benutzer Diskussion:Stefan K%C3%BChn/Check Wikipedia/Archiv/2008/Sep#c-Grillo-2008-09-24T14:54:00.000Z-ol, ul and li11

Can you give me an example article, where I can check this. -- sk Benutzer Diskussion:Stefan K%C3%BChn/Check Wikipedia/Archiv/2008/Sep#c-Stefan Kühn-2008-09-24T15:35:00.000Z-Grillo-2008-09-24T14:54:00.000Z11
Here an example (it's down in the page): I resolved putting everything inside a box (using a template; see current version of the page). But, an image description should be short and clear, no? I can't find the bug on bugzilla [2]. Maybe, creating a list inside an image description is just deprecated. --Red Power Benutzer Diskussion:Stefan K%C3%BChn/Check Wikipedia/Archiv/2008/Sep#c-Red Power-2008-09-24T18:40:00.000Z-Stefan Kühn-2008-09-24T15:35:00.000Z11
You should also search for "Short text equivalents for images" and "Long descriptions of images" inside the www.w3.org. Anyway, if you stay with your mouse over the picture, the "alt-text" is not showing the list, so I suppose that a blind person can only get the text without understand the list indentation. I think we should suggest the user to move the long description with the list to the main text of the article. --Red Power Benutzer Diskussion:Stefan K%C3%BChn/Check Wikipedia/Archiv/2008/Sep#c-Red Power-2008-09-24T19:42:00.000Z-Red Power-2008-09-24T18:40:00.000Z11
Hmm, I think we should`t have li, ol or ul in the image description. After I read this from Red Power, I think this is the best. -- sk Benutzer Diskussion:Stefan K%C3%BChn/Check Wikipedia/Archiv/2008/Sep#c-Stefan Kühn-2008-09-25T04:47:00.000Z-Red Power-2008-09-24T19:42:00.000Z11

Hallo, die Interwikilinks zu af, eo und he sind nicht korrekt und der nach is und ja fehlt. Andim Benutzer Diskussion:Stefan K%C3%BChn/Check Wikipedia/Archiv/2008/Sep#c-Andim-2008-09-25T14:32:00.000Z-Interwikilinks11

Wird eingebaut. Hab durch die Übersetzungsgeschichte schleifen lassen.-- sk Benutzer Diskussion:Stefan K%C3%BChn/Check Wikipedia/Archiv/2008/Sep#c-Stefan Kühn-2008-09-25T15:06:00.000Z-Andim-2008-09-25T14:32:00.000Z11
 Ok, eo at the moment has no project page. -- sk Benutzer Diskussion:Stefan K%C3%BChn/Check Wikipedia/Archiv/2008/Sep#c-Stefan Kühn-2008-09-25T19:00:00.000Z-Stefan Kühn-2008-09-25T15:06:00.000Z11
Jetzt sind zwei Links zu he vorhanden, der richtige und ein falscher. Andim Benutzer Diskussion:Stefan K%C3%BChn/Check Wikipedia/Archiv/2008/Sep#c-Andim-2008-09-26T15:37:00.000Z-Stefan Kühn-2008-09-25T19:00:00.000Z11
Mist, ich schau nochmal. -- sk Benutzer Diskussion:Stefan K%C3%BChn/Check Wikipedia/Archiv/2008/Sep#c-Stefan Kühn-2008-09-27T09:29:00.000Z-Andim-2008-09-26T15:37:00.000Z11

category (metadata)

Question about metadata in the translation page: is it category= (like on de.wiki) or category_001= (like on the other projects)? At the moment both are not working. Also, on en.wiki page there is a *[[]] instead our link to the translation page. Bye, and thanks for all the great work. ;) --Red Power Benutzer Diskussion:Stefan K%C3%BChn/Check Wikipedia/Archiv/2008/Sep#c-Red Power-2008-09-26T13:45:00.000Z-category (metadata)11

Oup´s I want category_001= for all. Please use this. In en and commons there no translation page. I will fix this *[[]]. sk Benutzer Diskussion:Stefan K%C3%BChn/Check Wikipedia/Archiv/2008/Sep#c-Stefan Kühn-2008-09-27T09:27:00.000Z-Red Power-2008-09-26T13:45:00.000Z11
ok. I have manually fixed he: and pl: interlinks. Also, in it.wiki we have the Template:Interprogetto that can add the commons interlink in a separate box just over the other interlinks on the left of the page. See the edit. I don't know if it'll be possible in every wiki. Finally, I'd like to have 2 category for the page, I hope this will not be a problem. Bye. --Red Power Benutzer Diskussion:Stefan K%C3%BChn/Check Wikipedia/Archiv/2008/Sep#c-Red Power-2008-09-27T09:55:00.000Z-Stefan Kühn-2008-09-27T09:27:00.000Z11

könntest du eine suche nach links und redirects mit sprungziel(#) zu nicht existierenden absätzen implementieren? --AwOc Benutzer Diskussion:Stefan K%C3%BChn/Check Wikipedia/Archiv/2008/Sep#c-AwOc-2008-09-28T02:33:00.000Z-feature-request: #links zu nicht vorhandenen absätzen11

Sorry, das kann ich leider nicht. Das Skript ist für solche Sachen nicht ausgelegt und kann nur einen Artikel betreffende Fehler ermitteln. Deshalb gehen Interwikilinks- oder Redirect- oder Link-Überprüfungen nicht. Frag mal Magnus, der bastelt solche Sachen immer mit Leichtigkeit. ( [3], Benutzer:Magnus Manske) -- sk Benutzer Diskussion:Stefan K%C3%BChn/Check Wikipedia/Archiv/2008/Sep#c-Stefan Kühn-2008-09-28T07:57:00.000Z-AwOc-2008-09-28T02:33:00.000Z11
schade. --AwOc Benutzer Diskussion:Stefan K%C3%BChn/Check Wikipedia/Archiv/2008/Sep#c-AwOc-2008-09-28T09:41:00.000Z-Stefan Kühn-2008-09-28T07:57:00.000Z11

<poem>-Umgebung und <ref>

Nach einer endlosen <poem>-Umgebung wird noch nicht gesucht, ebenso <ref> Andim Benutzer Diskussion:Stefan K%C3%BChn/Check Wikipedia/Archiv/2008/Sep#c-Andim-2008-09-25T10:06:00.000Z-<poem>-Umgebung und <ref>11

Steht jetzt auf meiner to-do-Liste. -- sk Benutzer Diskussion:Stefan K%C3%BChn/Check Wikipedia/Archiv/2008/Sep#c-Stefan Kühn-2008-09-27T09:46:00.000Z-Andim-2008-09-25T10:06:00.000Z11

Überschriften beginnen mit drei „=“

Man kann dies abändern zu Überschriften beginnen mit mindestens drei „=“. Andim Benutzer Diskussion:Stefan K%C3%BChn/Check Wikipedia/Archiv/2008/Sep#c-Andim-2008-09-25T10:08:00.000Z-Überschriften beginnen mit drei „=“11

In der polnischen Wikipedia ist das kein Fehler, wir benutzen Überschriften mit > 2 Gleichzeichen z.B. in den Gebieten Botanik und polnische Berge. Ginge es auch, den Scan um typische Rechtschreibfehler in der jeweiligen Sprache zu ergänzen? Eine Liste könnte ich erstellen. Ansonsten ist das Projekt eine sehr gute Idee und hilft bestimmt, Wikipedia sauber zu halten :) Viele Grüße ToSter Benutzer Diskussion:Stefan K%C3%BChn/Check Wikipedia/Archiv/2008/Sep#c-ToSter-2008-09-25T11:52:00.000Z-Andim-2008-09-25T10:08:00.000Z11
PS. Ach ja, und Tabellen-HTML zu finden wäre auch gut.
@Admin ja. @ToSter, ihr seit damit allein auf weiter Flur. Ich würde ungern das für pl ändern. Aber ich kann es natürlich umbiegen. Das mit der Rechtschreibung wäre eine Idee. Ich überleg mir mal wie man das Aufziehen kann. Am elegantesten wäre die Nutzung einer speziellen Seite (z.B. /Spellcheck ), um dort die einzelnen richtigen und falschen Wörter abzulegen. Die müssten aber durch ein Sonderzeichen z.B. @ gertrennt werden. Vorne und hinten müsste eins stehen, damit man auch auf "und" z.B. so prüfen kann @ und @ udn @. Gerade bei Wörtern die in anderen Wörtern vorkommen, haben wir sonst ein Problem. Ich würde auch die Suche und Ausgabe auf 200 begrenzen, da sonst bei einem fehlerhaften Input das Skript sich vielleicht ewig braucht.
 SPELLING_BEGIN
 #right, wrong
 @polnisch@polnisch@
 @polnisch@polnusch@
 @Rechtschreibung@Rechtsschreibung@
 @ und @ udn @
 SPELLING_END


Wenn du in der polnischen Wikipedia mal so eine Unterseite aufbaust, mit ein paar Fehlern (<100) dann können wir das mal testen. -- sk Benutzer Diskussion:Stefan K%C3%BChn/Check Wikipedia/Archiv/2008/Sep#c-Stefan Kühn-2008-09-27T09:45:00.000Z-Überschriften beginnen mit drei „=“11

Danke fuer die Antwort. Die Ueberschriften mit mehreren "=" sind im Moment etwa die Haelfte von allen Fehlern, die der Scan bei uns entdeckt, ich glaube nicht, dass irgendjemand das korrigieren wird. Aber ich werde darueber eine Diskussion bei uns anfangen. Fuer manche Artikel mit vielen kurzen Abschnitten sind "grosse" Ueberschriften einfach nicht geeignet, weil sie dann einfach haesslich aussehen, wie ein liniertes Heft :) Eine Seite mit Rechtschreibfehlern haben wir eigentlich schon, man muesste sie nur kuerzen und in eine Gestalt bringen, die der Computer mag - das werde ich in den naechsten Tagen machen. Viele Gruesse ToSter Benutzer Diskussion:Stefan K%C3%BChn/Check Wikipedia/Archiv/2008/Sep#c-ToSter-2008-09-28T20:06:00.000Z-Stefan Kühn-2008-09-27T09:45:00.000Z11

Abschnitt Bildunterschrift fehlt

Eine Bildunterschrift für in Vorlagen eingebundene Bilder, z.B. von Wappen, macht wenig Sinn. Beispiel Auernheim. Gruß -- @xqt Benutzer Diskussion:Stefan K%C3%BChn/Check Wikipedia/Archiv/2008/Sep#c-Xqt-2008-09-29T08:31:00.000Z-Abschnitt Bildunterschrift fehlt11

Das ist aber für dieses Bild im Abschnitt 5.2 Wappen! Und das hat keine Bildunterschrift -- sk Benutzer Diskussion:Stefan K%C3%BChn/Check Wikipedia/Archiv/2008/Sep#c-Stefan Kühn-2008-09-29T15:30:00.000Z-Xqt-2008-09-29T08:31:00.000Z11

.js-Seiten

Du solltest javascript-Quellcodes von einigen Suchen ausnehmen, da durch Escapen die Suche durcheinander kommt, z.B. hier: Wikipedia:WikiProject Check Wikipedia#Code mit undefiniertem Ende

--Steef 389 Benutzer Diskussion:Stefan K%C3%BChn/Check Wikipedia/Archiv/2008/Sep#c-Steef389-2008-09-27T12:57:00.000Z-.js-Seiten11

Dort geantwortet. -- sk Benutzer Diskussion:Stefan K%C3%BChn/Check Wikipedia/Archiv/2008/Sep#c-Stefan Kühn-2008-09-30T19:21:00.000Z-Steef389-2008-09-27T12:57:00.000Z11

error_011_desc bugfix

Current text of desc. for error 11:

 error_011_head_script=Break curly not currect END
 error_011_desc_script=Different number of [[ and ]] breaks END

Probably, should be

 error_011_desc_script=Different number of {{ and }} breaks. END

(as "[[" is an error 10)? Also needed "." in the end...--Kaganer Benutzer Diskussion:Stefan K%C3%BChn/Check Wikipedia/Archiv/2008/Sep#c-Kaganer-2008-09-29T17:23:00.000Z-error 011 desc bugfix11

 Ok. At the moment error 11 is deactivated. Because I don't scan the templates. In the future I will. -- sk Benutzer Diskussion:Stefan K%C3%BChn/Check Wikipedia/Archiv/2008/Sep#c-Stefan Kühn-2008-09-30T16:13:00.000Z-Kaganer-2008-09-29T17:23:00.000Z11

error_014_desc bugfix

Currently:

 error_014_head_script=Source not currect end END
 error_014_desc_script=Found a "<source" but no "</source>". END

Need

 error_014_desc_script=Found a "<source>" but no "</source>". END

--Kaganer Benutzer Diskussion:Stefan K%C3%BChn/Check Wikipedia/Archiv/2008/Sep#c-Kaganer-2008-09-29T17:40:00.000Z-error 014 desc bugfix11

Nein (no) . I scan also for <source lang="C"> and so I think better is <source ...>. -- sk Benutzer Diskussion:Stefan K%C3%BChn/Check Wikipedia/Archiv/2008/Sep#c-Stefan Kühn-2008-09-30T16:17:00.000Z-Kaganer-2008-09-29T17:40:00.000Z11
OK. Russian translate updated. --Kaganer Benutzer Diskussion:Stefan K%C3%BChn/Check Wikipedia/Archiv/2008/Sep#c-Kaganer-2008-09-30T16:30:00.000Z-Stefan Kühn-2008-09-30T16:17:00.000Z11

russian translation

Russian translation complete (alpha-version ;) See ru:Википедия:Страницы с ошибками в викитексте/Перевод. --Kaganer Benutzer Diskussion:Stefan K%C3%BChn/Check Wikipedia/Archiv/2008/Sep#c-Kaganer-2008-09-29T18:45:00.000Z-russian translation11

Thanks to the translators. Good job! -- sk Benutzer Diskussion:Stefan K%C3%BChn/Check Wikipedia/Archiv/2008/Sep#c-Stefan Kühn-2008-09-30T16:19:00.000Z-Kaganer-2008-09-29T18:45:00.000Z11

Errors 26 and 31

Hi Stefan, I've updated errors 26 and 31 on the translation pages for it.wiki and ru.wiki: if everything is ok I can do it for all the other projects. --Red Power Benutzer Diskussion:Stefan K%C3%BChn/Check Wikipedia/Archiv/2008/Sep#c-Red Power-2008-09-29T20:55:00.000Z-Errors 26 and 3111

ru-wiki translation done (and some misstypes fixed). Please add russian translate into ruwiki output. --Kaganer Benutzer Diskussion:Stefan K%C3%BChn/Check Wikipedia/Archiv/2008/Sep#c-Kaganer-2008-09-30T10:20:00.000Z-Red Power-2008-09-29T20:55:00.000Z11
Maybe, try to incorporate transslations of this script in Translatewiki ? --Kaganer Benutzer Diskussion:Stefan K%C3%BChn/Check Wikipedia/Archiv/2008/Sep#c-Kaganer-2008-09-30T10:26:00.000Z-Red Power-2008-09-29T20:55:00.000Z11

Neu angelegte Artikel

Planst Du, ähnlich wie bei der Fehlerliste für die Personendaten, in Zukunft täglich auch neu angelegte Artikel zu überprüfen? Bei den PD hat sich ja dies bewährt. Andim Benutzer Diskussion:Stefan K%C3%BChn/Check Wikipedia/Archiv/2008/Sep#c-Andim-2008-09-29T22:43:00.000Z-Neu angelegte Artikel11

Ja, ich plane das. Muss mal schauen, ob ich jeder Sprache die Info so abringen kann, wie ich es derzeit schon bei DE mache. -- sk Benutzer Diskussion:Stefan K%C3%BChn/Check Wikipedia/Archiv/2008/Sep#c-Stefan Kühn-2008-09-30T16:25:00.000Z-Andim-2008-09-29T22:43:00.000Z11

error 003 desc. bugfix

Current text:

 error_003_desc_script=This article has a <ref> and not a <refences />. This is not currect syntax. END

Needed:

 error_003_desc_script=This article has a <ref> and not a <references />. This is not currect syntax. END

--Kaganer Benutzer Diskussion:Stefan K%C3%BChn/Check Wikipedia/Archiv/2008/Sep#c-Kaganer-2008-09-30T10:14:00.000Z-error 003 desc. bugfix11

 Ok -- sk Benutzer Diskussion:Stefan K%C3%BChn/Check Wikipedia/Archiv/2008/Sep#c-Stefan Kühn-2008-09-30T15:56:00.000Z-Kaganer-2008-09-30T10:14:00.000Z11

"currect" vs "correct"

Who is "currect" - slang or misstype ? In my opinion, german "korrekt" (as in de-wiki) corresponding with eng. "correct", but no "currect". I am wrong ? --Kaganer Benutzer Diskussion:Stefan K%C3%BChn/Check Wikipedia/Archiv/2008/Sep#c-Kaganer-2008-09-30T10:31:00.000Z-"currect" vs "correct"11

I have change this last week. Where did you find this? At an old translation page? Then use a new one. The translation_infos will update also every day. (for example http://toolserver.org/~sk/checkwiki/ruwiki/ ) -- sk Benutzer Diskussion:Stefan K%C3%BChn/Check Wikipedia/Archiv/2008/Sep#c-Stefan Kühn-2008-09-30T16:29:00.000Z-Kaganer-2008-09-30T10:31:00.000Z11
OK, I synchronised translating file with ruwiki page (and added some bugfixes). And I wait for next update... ;)--Kaganer Benutzer Diskussion:Stefan K%C3%BChn/Check Wikipedia/Archiv/2008/Sep#c-Kaganer-2008-09-30T16:53:00.000Z-Stefan Kühn-2008-09-30T16:29:00.000Z11

Integration with Geographical coordinates WikiProject

I think this project could help to improve the project about Geographical coordinates.

For the correct visualization in Google Earth there are parameters that people forget, but are important. The script could search pages with coordinates template that miss:

  • The parameter "type".
  • The number of inhabitants into the parameter "type:city".
  • The number of meters into de parameter "type:mountain".
  • The parameter "region".


There is no answer to the proposal? 193.152.143.236 Benutzer Diskussion:Stefan K%C3%BChn/Check Wikipedia/Archiv/2008/Sep#c-193.152.143.236-2008-09-30T16:38:00.000Z-Integration with Geographical coordinates WikiProject11
Sorry, to much to do. - Do you know that I create the basis data for the project Wikipedia-World? I have this in my mind for the next future. I will use "Check Wikipedia" to check also templates. Do you know the project Templatetiger? If I have fusion both scripts than I can also check every template in every Wikipedia. And than I can control the parameters from coordinates. But I need time for this. -- sk Benutzer Diskussion:Stefan K%C3%BChn/Check Wikipedia/Archiv/2008/Sep#c-Stefan Kühn-2008-09-30T19:18:00.000Z-193.152.143.236-2008-09-30T16:38:00.000Z11
OK, I only wanted to know, if it was technically possible or considered a good idea. I wasn't demanding a date of implementation. 193.152.143.236 Benutzer Diskussion:Stefan K%C3%BChn/Check Wikipedia/Archiv/2008/Sep#c-193.152.143.236-2008-10-01T15:49:00.000Z-Stefan Kühn-2008-09-30T19:18:00.000Z11

Anzahl eckiger Klammern nicht korrekt/Leerzeichen am Zeilenanfang

fyi: Benutzer_Diskussion:Stefan_Birkner#Halteproblem --AwOc Benutzer Diskussion:Stefan K%C3%BChn/Check Wikipedia/Archiv/2008/Sep#c-AwOc-2008-09-28T11:07:00.000Z-Anzahl eckiger Klammern nicht korrekt/Leerzeichen am Zeilenanfang11

Dort geantwortet. -- sk Benutzer Diskussion:Stefan K%C3%BChn/Check Wikipedia/Archiv/2008/Sep#c-Stefan Kühn-2008-10-01T10:59:00.000Z-AwOc-2008-09-28T11:07:00.000Z11

Erkennungsfehler?

Hallo, in dieser Version wurde der HTML-Ausdruck für † nicht erkannt. Andim Benutzer Diskussion:Stefan K%C3%BChn/Check Wikipedia/Archiv/2008/Sep#c-Andim-2008-09-29T20:12:00.000Z-Erkennungsfehler?11

Ja, ich überprüfe das mal. -- sk Benutzer Diskussion:Stefan K%C3%BChn/Check Wikipedia/Archiv/2008/Sep#c-Stefan Kühn-2008-09-30T16:31:00.000Z-Andim-2008-09-29T20:12:00.000Z11
Dein Skript sucht nur nach &amp;dagger;. Es sollte vermutlich auch nach &dagger; suchen. Andim Benutzer Diskussion:Stefan K%C3%BChn/Check Wikipedia/Archiv/2008/Sep#c-Andim-2008-10-04T07:58:00.000Z-Stefan Kühn-2008-09-30T16:31:00.000Z11
Daran lag es. Muss ich bei der Programmierung wohl geschlafen haben. -- sk Benutzer Diskussion:Stefan K%C3%BChn/Check Wikipedia/Archiv/2008/Sep#c-Stefan Kühn-2008-10-04T13:35:00.000Z-Andim-2008-10-04T07:58:00.000Z11