„Common Voice“ – Versionsunterschied

aus Wikipedia, der freien Enzyklopädie
Zur Navigation springen Zur Suche springen
[gesichtete Version][ungesichtete Version]
Inhalt gelöscht Inhalt hinzugefügt
Echsel (Diskussion | Beiträge)
DeepSpeech ist nicht Thema dieses Artikels; Statistik stark verbessert
Zeile 15: Zeile 15:
| Status = aktiv
| Status = aktiv
}}
}}
'''Common Voice''' ist ein von [[Mozilla Foundation|Mozilla]] gestartetes [[Crowdsourcing]]-Projekt zur Sammlung von Tonaufnahmen in vielen Sprachen.
'''Common Voice''' ist ein von [[Mozilla Foundation|Mozilla]] gestartetes [[Crowdsourcing]]-Projekt zur Erstellung einer freien [[Datenbank]] für [[Spracherkennungssoftware|Spracherkennungs-Software]]. Das Projekt wird von Freiwilligen unterstützt, die Beispielsätze mit einem [[Mikrofon]] einsprechen und Aufnahmen anderer Nutzer überprüfen. Die transkribierten Sätze werden in einer Stimm-Datenbank gesammelt, die unter der [[Gemeinfreiheit|gemeinfreien]] Lizenz [[CC0]] verfügbar ist. Damit ist sichergestellt, dass Entwickler die Datenbank für Sprache-zu-Text-Anwendungen ohne Einschränkungen oder Kosten nutzen können. Common Voice erschien als Antwort auf die [[Intelligenter Persönlicher Assistent|Sprachassistenten]] der großen [[Unternehmen]], wie [[Amazon Echo]], [[Siri (Software)|Siri]] oder [[Google Assistant]].<ref>{{Internetquelle |url=https://voice.mozilla.org/faq |titel=Frequently Asked Questions |werk=Common Voice |sprache=en-US |abruf=2018-01-26}}</ref><ref>{{Internetquelle |autor=Wolfgang Reszel |url=https://www.heise.de/newsticker/meldung/Mozilla-sammelt-Stimmaufzeichnungen-fuer-offene-Spracherkennungs-Software-3780795.html |titel=Mozilla sammelt Stimmaufzeichnungen für offene Spracherkennungs-Software |werk=heise online |datum=2017-07-23 |sprache=de |abruf=2018-01-26}}</ref> Seit dem 6. Juni 2018 können auch deutsche Sätze eingesprochen und überprüft werden.<ref>{{Internetquelle |autor=Sebastian Grüner |url=https://www.golem.de/news/common-voice-mozillas-freie-sprachdatenbank-wird-mehrsprachig-1806-134824.html |titel=Common Voice: Mozillas freie Sprachdatenbank wird mehrsprachig |werk=Golem.de |datum=2018-06-07 |abruf=2018-06-07}}</ref> Es existiert eine inoffizielle Android-App.<ref>{{Internetquelle |url=https://play.google.com/store/apps/details?id=org.commonvoice.saverio&hl=de&gl=US |titel=Spende deine Stimme: CV Project – Apps bei Google Play |abruf=2021-03-10 |sprache=de}}</ref>


Freiwilligen sprechen dazu entweder Beispielsätze aus der Wikipedia ein und verifizieren die Aufnahmen anderer Nutzer. Die gesamten Daten sind [[Gemeinfreiheit|gemeinfrei]] ("[[CC0]]"). Common Voice erschien als Antwort auf die [[Intelligenter Persönlicher Assistent|Sprachassistenten]] der großen [[Unternehmen]], wie [[Amazon Echo]], [[Siri (Software)|Siri]] oder [[Google Assistant]].<ref>{{Internetquelle |url=https://voice.mozilla.org/faq |titel=Frequently Asked Questions |werk=Common Voice |sprache=en-US |abruf=2018-01-26}}</ref><ref>{{Internetquelle |autor=Wolfgang Reszel |url=https://www.heise.de/newsticker/meldung/Mozilla-sammelt-Stimmaufzeichnungen-fuer-offene-Spracherkennungs-Software-3780795.html |titel=Mozilla sammelt Stimmaufzeichnungen für offene Spracherkennungs-Software |werk=heise online |datum=2017-07-23 |sprache=de |abruf=2018-01-26}}</ref>
Seit 2021 unterstützen [[Nvidia]], die [[Bill & Melinda Gates Foundation]], die [[Deutsche Gesellschaft für Internationale Zusammenarbeit]] und das britische [[Foreign and Commonwealth Office]] das Projekt.<ref name="golem" /><ref>{{Internetquelle |url=https://foundation.mozilla.org/de/blog/mozilla-common-voice-receives-34-million-investment-to-democratize-and-diversify-voice-tech-in-east-africa/ |titel=Mozilla Common Voice Receives $3.4 Million Investment to Democratize and Diversify Voice Tech in East Africa |abruf=2021-08-06 |werk=mozilla.org |datum=2021-03-25 |sprache=en}}</ref><ref>{{Internetquelle |url=https://foundation.mozilla.org/de/blog/mozilla-partners-with-nvidia-to-democratize-and-diversify-voice-technology/ |titel=Mozilla partners with NVIDIA to democratize and diversify voice technology |abruf=2021-08-06 |werk=mozilla.org |datum=2021-04-12 |sprache=en}}</ref>


== Namensgebung ==
== Namensgebung ==
Der Name „Common Voice“ stammt aus dem [[Englische Sprache|Englischen]] und bedeutet übersetzt etwa „gemeinsame Stimme“. Mozilla hat den Namen in Anlehnung an [[Creative Commons]] gewählt, was auf den gemeinsamen Grundgedanken des Allgemeinguts zurückzuführen ist.<ref>{{Internetquelle |autor=Sebastian Grüner |url=https://www.golem.de/news/deep-speech-und-common-voice-mozilla-will-freie-spracherkennung-fuer-alle-1711-131414-2.html |titel=Mozilla bringt freie Spracherkennung für alle (Seite 2) |werk=Golem.de |datum=2017-11-30 |sprache=de |abruf=2018-01-26}}</ref>
Der Name „Common Voice“ stammt aus dem [[Englische Sprache|Englischen]] und bedeutet übersetzt etwa „gemeinsame Stimme“. Mozilla hat den Namen in Anlehnung an [[Creative Commons]] gewählt, was auf den gemeinsamen Grundgedanken des Allgemeinguts zurückzuführen ist.<ref>{{Internetquelle |autor=Sebastian Grüner |url=https://www.golem.de/news/deep-speech-und-common-voice-mozilla-will-freie-spracherkennung-fuer-alle-1711-131414-2.html |titel=Mozilla bringt freie Spracherkennung für alle (Seite 2) |werk=Golem.de |datum=2017-11-30 |sprache=de |abruf=2018-01-26}}</ref>


== Geschichte ==
== Verwendung in DeepSpeech ==
Seit dem 6. Juni 2018 können auch deutsche Sätze eingesprochen und überprüft werden.<ref>{{Internetquelle |autor=Sebastian Grüner |url=https://www.golem.de/news/common-voice-mozillas-freie-sprachdatenbank-wird-mehrsprachig-1806-134824.html |titel=Common Voice: Mozillas freie Sprachdatenbank wird mehrsprachig |werk=Golem.de |datum=2018-06-07 |abruf=2018-06-07}}</ref> Es existiert eine inoffizielle Android-App.<ref>{{Internetquelle |url=https://play.google.com/store/apps/details?id=org.commonvoice.saverio |titel=Spende deine Stimme: CV Project – Apps bei Google Play |abruf=2021-03-10 |sprache=de}}</ref>
Parallel zu Common Voice entwickelt Mozilla die Spracherkennungs-[[Engine]] DeepSpeech, eine [[TensorFlow]]-Implementierung der DeepSpeech-Architektur von [[Baidu]].<ref>{{Internetquelle |autor=Pascal Moll |url=https://www.heise.de/hintergrund/Mozilla-DeepSpeech-Speech-to-Text-Schritt-fuer-Schritt-6048698.html |titel=Mozilla DeepSpeech: Speech-to-Text Schritt für Schritt |werk=heise online |datum=2021-05-21 |sprache=de |abruf=2022-01-30}}</ref> Diese nutzt unter anderem die Daten von Common Voice. Der [[Quelltext]] des fertig trainierten [[Künstliches neuronales Netz|Neuralen Netzwerks]] ist auf [[GitHub]] verfügbar.<ref>{{Internetquelle |autor=Sebastian Grüner |url=https://www.golem.de/news/deep-speech-und-common-voice-mozilla-will-freie-spracherkennung-fuer-alle-1711-131414.html |titel=Mozilla bringt freie Spracherkennung für alle (Seite 1) |werk=Golem.de |datum=2017-11-30 |sprache=de |abruf=2018-01-26}}</ref><ref>{{Internetquelle |autor=Stefan Bordel |url=https://com-magazin.de/news/mozilla/mozilla-veroeffentlicht-riesigen-sprachdatensatz-1440194.html |titel=Mozilla veröffentlicht riesigen Sprachdatensatz |werk=com! Das Computer-Magazin |datum=2017-11-30 |sprache=de |abruf=2018-01-26}}</ref> DeepSpeech wird unter anderem von dem freien Sprachassistenten [[Mycroft (Sprachassistent)|Mycroft]] verwendet.<ref>{{Literatur |Autor=Steve Penrod |Hrsg=Mycroft |Titel=Why We're moving to DeepSpeech on March 31 |Sammelwerk=Mycroft |Band= |Nummer= |Ort= |Datum=2018-01-11 |ISBN= |Seiten= |Online=https://mycroft.ai/blog/mycroft-speech-to-text-and-balance/ |Abruf=2018-02-15}}</ref>


Seit 2021 unterstützen [[Nvidia]], die [[Bill & Melinda Gates Foundation]], die [[Deutsche Gesellschaft für Internationale Zusammenarbeit]] und das britische [[Foreign and Commonwealth Office]] das Projekt.<ref name="golem" /><ref>{{Internetquelle |url=https://foundation.mozilla.org/de/blog/mozilla-common-voice-receives-34-million-investment-to-democratize-and-diversify-voice-tech-in-east-africa/ |titel=Mozilla Common Voice Receives $3.4 Million Investment to Democratize and Diversify Voice Tech in East Africa |abruf=2021-08-06 |werk=mozilla.org |datum=2021-03-25 |sprache=en}}</ref><ref>{{Internetquelle |url=https://foundation.mozilla.org/de/blog/mozilla-partners-with-nvidia-to-democratize-and-diversify-voice-technology/ |titel=Mozilla partners with NVIDIA to democratize and diversify voice technology |abruf=2021-08-06 |werk=mozilla.org |datum=2021-04-12 |sprache=en}}</ref>
== Statistik ==
Die englische Datenbank von Common Voice ist mittlerweile die größte frei zugängliche Sprachdatenbank. Zur Veröffentlichung des letzten englischen Datensatzes im August 2021 sprachen weltweit über 75.000 Sprecher 2.600 Stunden ein.<ref name="datasets">{{Internetquelle |autor= |url=https://commonvoice.mozilla.org/de/datasets |titel=Common Voice - Datensätze |titelerg=Common Voice Corpus 7.0 |abruf=2021-08-06 |sprache=de}}</ref><ref name="golem">{{Internetquelle |url=https://www.golem.de/news/common-voice-mozilla-erweitert-freien-sprachdatensatz-massiv-2108-158729.html |titel=Mozilla erweitert freien Sprachdatensatz massiv |abruf=2021-08-06 |autor=Ulrich Bantle/Linux Magazin/Sebastian Grüner |werk=[[Golem.de]] |datum=2021-08-06}}</ref>


== Statistik ==
An der deutschen Datenbank beteiligten sich bisher mehr als 15.000 Sprecher. Die Summe der deutschen Sprachaufnahmen beläuft sich im Datensatz von August 2021 auf 1000 Stunden.<ref name="datasets" /><ref name="golem" />
Die englische Datenbank von Common Voice ist mittlerweile die größte frei zugängliche Sprachdatenbank.<ref name="golem">{{Internetquelle |url=https://www.golem.de/news/common-voice-mozilla-erweitert-freien-sprachdatensatz-massiv-2108-158729.html |titel=Mozilla erweitert freien Sprachdatensatz massiv |abruf=2021-08-06 |autor=Ulrich Bantle/Linux Magazin/Sebastian Grüner |werk=[[Golem.de]] |datum=2021-08-06}}</ref> Der Digitalisierungsfortschritt in den meisten Sprachen ebbte nach kurzer Zeit ab, nur in wenigen Fällen kam eine kritische Masse zustande:<ref>https://github.com/common-voice/cv-dataset/tree/main/datasets</ref>


{| class="wikitable sortable"
Insgesamt besteht das Projekt aus 76 Sprachen mit knapp 14.000 aufgenommenen Stunden.<ref>{{Internetquelle |url=https://www.neowin.net/news/nvidia-and-mozilla-release-the-latest-version-of-the-common-voice-dataset/ |titel=Nvidia and Mozilla release the latest version of the Common Voice Dataset |abruf=2021-08-06 |autor=Ather Fawaz |werk=Neowin |sprache=en}}</ref>
|+ Stand 2022-04-27 (9.0)
|-
! Sprache !! h validiert
|-
| Englisch || 2.224
|-
| [[Kinyarwanda]] || ~2.000
|-
| Esperanto (keine Standardaussprache) || 1.430
|-
| Katalanisch || 1.247
|-
| Deutsch || 1.093
|-
| Weißrussisch || 1.020
|-
| Französisch || 848
|-
| [[Kabylische Sprache|Kabylisch]] || 550
|}


== Verwandte Projekte ==
== Verwandte Projekte ==

Version vom 20. Juni 2022, 14:28 Uhr

Common Voice
„Maschinen beibringen, wie echte Menschen sprechen“
Sammlung von gesprochenen Sätzen für eine Spracherkennungs-Datenbank
Sprachen multilingual (Liste der Sprachen)
Betreiber Mozilla Foundation
Registrierung Optional
Online 19. Juni 2017[1]
https://commonvoice.mozilla.org/

Common Voice ist ein von Mozilla gestartetes Crowdsourcing-Projekt zur Sammlung von Tonaufnahmen in vielen Sprachen.

Freiwilligen sprechen dazu entweder Beispielsätze aus der Wikipedia ein und verifizieren die Aufnahmen anderer Nutzer. Die gesamten Daten sind gemeinfrei ("CC0"). Common Voice erschien als Antwort auf die Sprachassistenten der großen Unternehmen, wie Amazon Echo, Siri oder Google Assistant.[2][3]

Namensgebung

Der Name „Common Voice“ stammt aus dem Englischen und bedeutet übersetzt etwa „gemeinsame Stimme“. Mozilla hat den Namen in Anlehnung an Creative Commons gewählt, was auf den gemeinsamen Grundgedanken des Allgemeinguts zurückzuführen ist.[4]

Geschichte

Seit dem 6. Juni 2018 können auch deutsche Sätze eingesprochen und überprüft werden.[5] Es existiert eine inoffizielle Android-App.[6]

Seit 2021 unterstützen Nvidia, die Bill & Melinda Gates Foundation, die Deutsche Gesellschaft für Internationale Zusammenarbeit und das britische Foreign and Commonwealth Office das Projekt.[7][8][9]

Statistik

Die englische Datenbank von Common Voice ist mittlerweile die größte frei zugängliche Sprachdatenbank.[7] Der Digitalisierungsfortschritt in den meisten Sprachen ebbte nach kurzer Zeit ab, nur in wenigen Fällen kam eine kritische Masse zustande:[10]

Stand 2022-04-27 (9.0)
Sprache h validiert
Englisch 2.224
Kinyarwanda ~2.000
Esperanto (keine Standardaussprache) 1.430
Katalanisch 1.247
Deutsch 1.093
Weißrussisch 1.020
Französisch 848
Kabylisch 550

Verwandte Projekte

  • LibriSpeech: Sprachkorpus von ungefähr 1000 Stunden englischsprachiger Hörbücher aus LibriVox (CC BY 4.0).
  • TED-LIUM: Sprachkorpus von ungefähr 118 Stunden aus englischsprachigen TED-Talks (CC BY-NC-ND 3.0).
  • Tatoeba: Sammlung von (gesprochenen) Beispielsätzen in verschiedenen Sprachen mit Übersetzungen (Texte CC BY 2.0, Audio größtenteils CC BY-NC-ND 3.0).
  • VoxForge: Sprachkorpus in verschiedenen Sprachen, um freie Spracherkennungs-Engines, wie Julius zu unterstützen (GPL 3).
  • Thorsten (Stimme) deutscher Sprachkorpus einer Person für TTS-Sprachmodelle (CC0-Lizenz)
Commons: Common Voice – Sammlung von Bildern, Videos und Audiodateien

Einzelnachweise

  1. Daniel Kessler: Raising Our Common Voice For The Web. In: The Mozilla Blog. 19. Juni 2017, abgerufen am 26. Januar 2018 (amerikanisches Englisch).
  2. Frequently Asked Questions. In: Common Voice. Abgerufen am 26. Januar 2018 (amerikanisches Englisch).
  3. Wolfgang Reszel: Mozilla sammelt Stimmaufzeichnungen für offene Spracherkennungs-Software. In: heise online. 23. Juli 2017, abgerufen am 26. Januar 2018.
  4. Sebastian Grüner: Mozilla bringt freie Spracherkennung für alle (Seite 2). In: Golem.de. 30. November 2017, abgerufen am 26. Januar 2018.
  5. Sebastian Grüner: Common Voice: Mozillas freie Sprachdatenbank wird mehrsprachig. In: Golem.de. 7. Juni 2018, abgerufen am 7. Juni 2018.
  6. Spende deine Stimme: CV Project – Apps bei Google Play. Abgerufen am 10. März 2021.
  7. a b Ulrich Bantle/Linux Magazin/Sebastian Grüner: Mozilla erweitert freien Sprachdatensatz massiv. In: Golem.de. 6. August 2021, abgerufen am 6. August 2021.
  8. Mozilla Common Voice Receives $3.4 Million Investment to Democratize and Diversify Voice Tech in East Africa. In: mozilla.org. 25. März 2021, abgerufen am 6. August 2021 (englisch).
  9. Mozilla partners with NVIDIA to democratize and diversify voice technology. In: mozilla.org. 12. April 2021, abgerufen am 6. August 2021 (englisch).
  10. https://github.com/common-voice/cv-dataset/tree/main/datasets