Benutzer:Sigma^2/Prognosefehler

aus Wikipedia, der freien Enzyklopädie
Zur Navigation springen Zur Suche springen

Der Prognosefehler (auch Vorhersagefehler) bezeichnet im einfachsten Fall die Differenz zwischen dem prognostiziertem (vorhergesagtem) Wert und dem tatsächlich eingetretenen Wert. Ein andere Bezeichnung ist Prognoseabweichung. Bei der Prognose einer Zufallsvariable durch die Angabe einer Zufallsvariablen ist der Prognosefehler eine Zufallsvariable. Teilweise wird in diesem Zusammenhang auch die Standardabweichung der zufälligen Prognoseabweichung als Prognosefehler bezeichnet.


Mit sei der Prognosewert (oder Vorhersagewert) für einen Wert bezeichnet, der zum Zeitpunkt der Prognose noch nicht bekannt ist. Dann ist ex post, das heißt nach Vorliegen des beobachteten Wertes , die Differenz

der Ex-post-Prognosefehler.

Wenn zum Zeitpunkt der Abgabe der Prognose die Unsicherheit durch eine Wahrscheinlichkeitsverteilung für eine Zufallsvariable ausgedrückt ist, ist die Zufallsvariable

der Ex-ante-Prognosefehler. Eine Realisierung von ist der Ex-post-Prognosefehler . Im einfachsten Fall ist die Wahrscheinlichkeitsverteilung von bekannt und es stellt sich ex ante die Frage nach einem 'guten Prognosewert' im Sinn der Minimierung eines Fehlerkriteriums.

In einem allgemeineren Kontext stützt sich die Angabe eines Prognosewerte für auf die beobachteten Werte weitere Zufallsvariablen , die in diesem Zusammenhang Prädiktorvariablen heißen. In diesem Fall ist der Prognosewert ein Funktionswert . Für die Ex-ante-Beurteilung eines Prognoseverfahrens, das beschreibet, wie in systematischer Art aus Realisierungen der Prädiktorvariablen Prognosewerte gebildet werden, ist der Ex-ante Prognosefehler

von Interesse, wobei eine Zufallsvariable ist, die die Abhängigkeit des Prognosewertes von den Prädiktorvariablen bezeichnet. In diesem allgemeineren Kontext ist die Wahrscheinlichkeitsverteilung von durch die gemeinsame Wahrscheinlichkeitsverteilung von und bestimmt.

Ex-post-Prognosefehler und Gütemaße

[Bearbeiten | Quelltext bearbeiten]

Bei einer Ex-Post-Betrachtung sind der, vor Kenntnis von , abgegebene Prognosewert und der eingetretene Wert bekannt. Dann ist der (Ex-post-)Prognosefehler, ist der absolute Prognosefehler, ist der quadratische Prognosefehler und für ist der relative Prognosefehler.

Liegt eine endliche Folge von Paaren für vor, wobei jeweils der Prognosewert für ist, so ergeben sich Prognosefehler für vor. Zur Ex-Post-Beurteilung der Güte eines Prognoseverfahren ist es erforderlich, die Prognosefehler gemeinam zu beurteilen. Dazu werden verschiedene Gütemaße verwendet, z. B.

  • der mittlere quadratische Prognosefehler
,
  • die Quadratwurzel des mittleren absoluten Progosefehlers
,
  • der mittlere absolute Prognosefehler
,
  • der mittlere absolute relative (oder prozentuale) Prognosefehler
falls für .

Diese Gütemaße haben gemeinsam, dass sie nichtnegativ sind und den Wert Null genau dann annehmen, wenn für gilt. Eine hohe Güte bedeutet einen kleinen Wert des Gütemaßes. Das zweite und dritte Gütemaß haben dieselben Einheiten wie die -Werte. Das vierte Gütemaß ist einheitenfrei und kann als Prozentsatz angegeben werden.

Wenn ein Zeitindex ist und zeitlich aufeinanderfolgende Werte sind, die eine Zeitreihe bilden, kann die Güte von Prognosewerten durch den Ungeichheitskoeffizienten von Theil

beurteilt werden. Dieser beurteilt die Prognosewerte im Vergleich zur naiven Prognose mit den Prognosewerten für . Für einen Wert liegt eine Verbesserung gegenüber der naiven Prognose vor. Der Ungleichheitskoeffizient von Theil darf nicht mit dem Theil-Index verwechselt werden, der ebenfalls nach dem Ökonometriker Henri Theil benannt ist.

Ex-ante-Prognosefehler und Punktprognose ohne Prädiktorvariable

[Bearbeiten | Quelltext bearbeiten]

Ist die zu prognostizierende Größe eine reelle Zufallsvariable ist, deren Wahrscheinlichkeitsverteilung bekannt ist, dann heißt diese Wahrscheinlichkeitsverteilung Prognoseverteilung. Eine Punktprognose ist in diesem Zusammenhang die Angabe eines Wertes mit dem man versucht, die noch nicht bekannte Realisierung der reellen Zufallsvariablen möglichst gut zu treffen.

Prognosefehler und Prognoseverzerrung

[Bearbeiten | Quelltext bearbeiten]

Bei einer ex-ante-Betrachtung, also bevor der beobachtete Wert bekannt ist, heißt die Zufallsvariable

Prognosefehler oder ausführlicher zufälliger Prognosefehler, wenn betont werden soll, dass es sich um eine Zufallsvariable handelt. Bei der ex-post-Betrachtung, also nach Vorliegen der Realisierung , liegt der realisierte Wert des zufälligen Prognosefehlers vor.

Ex ante kann die Qualität einer Punktprognose mit Eigenschaften der Wahrscheinlichkeitsverteilung der Prognoseabweichung beschrieben werden, die auf elementare Art von und der Verteilung von abhängt.[1] Falls der Erwartungswert von endlich ist, hat der Prognosefehler den Erwartungswert

und falls die Varianz von endlich ist, ist die Varianz des Progonsefehlers

.

Für eine Zufallsvariable mit endlichem Erwartungswert heißt die Differenz Prognoseverzerrung der Punktprognose für die Zufallsvariable . Eine Punktprognose heißt unverzerrt, wenn die Prognoseverzerrung den Wert Null hat, anderenfalls verzerrt. Die Punktprognose ist genau dann unverzerrt, wenn der zufällige Prognosefehler den Erwartungswert Null hat, d. h. Im Kontext einer bekannten Wahrscheinlichkeitsverteilung von ist die einzige unverzerrte Prognose durch

gegeben.

Mittlerer quadratischer Prognosefehler

[Bearbeiten | Quelltext bearbeiten]

Die Zufallsvariable heißt quadratischer Prognosefehler. Wenn die Zufallsvariable eine endliche Varianz hat, hat der quadratische Prognosefehler einen endlichen Erwartungswert und die Zahl

heißt mittlerer quadratischer Prognosefehler. Für diesen gilt die Zerlegung

Dabei ist der erste Summand die quadrierte Prognoseverzerrung und der zweite Summand ist die vom prognostizierten Wert unabhängige Varianz der Zufallsvariablen . Der mittlere quadratische Prognosefehler wird minimiert, wenn die Prognoseverzerrung verschwindet. Der Erwartungswert als prognostizierter Wert ist also in diesem Kontext eine beste Prognose in dem Sinn, dass er den mittleren quadratischen Prognosefehler minimiert. Für den Prognosewert gilt also

Absoluter Prognosefehler

[Bearbeiten | Quelltext bearbeiten]

Die Zufallsvariable heißt absoluter Prognosefehler. Wenn die Zufallsvariable einen endlichem Erwartungswert hat, hat auch der absolute Prognosefehler einen endlichen Erwartungswert und die Zahl

heißt mittlerer absoluter Prognosefehler.

Relativer Prognosefehler

[Bearbeiten | Quelltext bearbeiten]

Für eine positive Zufallsvariable heißt

relativer Prognosefehler und

absoluter relativer Prognosefehler.

  • Wenn von der Wahrscheinlichkeitsverteilung der Zufallsvariablen nur die beiden Kennzahlen und bekannt sind, ist die beste Prognose im Sinn der Minimierung des mittleren quadratischen Fehlers, da dieser auf keine anderen Eigenschaften der Wahrscheinlichkeitsverteilung von Bezug nimmt.
  • Es gibt Fälle, in denen das Kriterium der Minimierung des mittleren quadratischen Prognosefehlers nicht angewendet werden kann, da die Varianz von nicht endlich ist. Falls dann aber der Erwartungswert endlich ist – wie beispielsweise bei einer t-Verteilung mit zwei Freiheitsgraden – kann das Kriterium der Minimierung des mittleren absoluten Prognosefehlers angewendet werden, dass dann einen Median der Verteilung als besten Prognosewert identifiziert. Die führt im Fall t-Verteilung mit zwei Freiheitsgraden zur Stelle Null, die der eindeutige Median ist.
  • In entscheidungstheoretischer Interpretation kann der mittlere quadratische Prognosefehler als Risikofunktion, d. h. als erwarteter Verlust, bezüglich der quadratischen Verlustfunktion , interpretiert werden. Dabei bewertet die Verlustfunktion mit das Zusammentreffen von Prognosewert und Realisierung mit dem Verlust . Die Risikofunktion ist die Funktion
Das minimale Risiko ergibt sich für .
  • Es gibt Zufallsvariablen, wie beispielsweise eine Cauchy-verteilte Zufallsvariable, für die weder Erwartungswert noch Varianz definiert sind, so dass weder das Kriterium der Minimierung des mittleren quadratischen Prognosefehlers noch das Kriterium der Minimierung des mittleren absoluten Prognosefehlers angewendet werden können. In diesem Fall kann eine Verlustfunktion der Art , mit bei der Risikominimierung verwendet werden.

Ex-ante-Prognosefehler und Punktprognose mit Hilfe von Prädiktorvariablen

[Bearbeiten | Quelltext bearbeiten]

Werden bei der Prognose der Variablen die Werte weiterer Zufallsvariablen verwendet, die Informationen über die zu prognostizierende Wahrscheinlichkeitsverteilung enthalten, so heißen diese Prädiktorvariablen. Die Prädiktorvariablen werden für die folgenden Ausführungen zu dem Zufallsvektor mit Realisierungen zusammengefasst. Die Problemstellung ist, eine Punktprognose für auf der Basis der gegebenen (beobachteten) Realisierung des Zufallsvektors vorzunehmen. Die Punktprognose ist eine Realisierung der Zufallsvariablen die für die Ex-ante-Bewertung eines Prognoseverfahrens relevant ist.

Prognosefehler und Prognoseverzerrung

[Bearbeiten | Quelltext bearbeiten]

Bei der ex-ante-Betrachtung, also bevor der beobachtete Wert bekannt ist, heißt die Zufallsvariable

Prognosefehler bei der Prognose von durch . Die Wahrscheinlichkeitsverteilung von hängt von der gemeinsamen Wahrscheinlichkeitsverteilung von ab. Falls die Varianzen aller Zufallsvariablenn endlich ist, hat der Prognosefehler den Erwartungswert

und die Varianz

.

Für eine Zufallsvariable mit endlichem Erwartungswert heißt die Differenz Prognoseverzerrung der Punktprognose . Eine Punktprognose heißt unverzerrt, wenn die Prognoseverzerrung den Wert Null hat, anderenfalls verzerrt. Die Punktprognose ist genau dann unverzerrt, wenn der zufällige Prognosefehler den Erwartungswert Null hat.

Mittlerer quadratischer Prognosefehler

[Bearbeiten | Quelltext bearbeiten]

Die Zufallsvariable heißt quadratischer Prognosefehler der zufälligen Prognose für die Zufallsvariable . Falls der Erwartungswert des quadratischen Prognosefehlers endlich ist, heißt die Zahl mittlerer quadratischer Prognosefehler. Die bedingte Erwartung als Prognose ist unverzerrt und eine beste Prognose in dem Sinn, dass sie den mittleren quadratischen Prognosefehler minimiert. Für gilt also

Entscheidungstheoretische Interpretation

[Bearbeiten | Quelltext bearbeiten]

Für die quadratischen Verlustfunktion , kann der mittlere quadratische Prognosefehler als Risikofunktion, d. h. als erwarteter Verlust, bezüglich der quadratischen Verlustfunktion interpretiert werden. Dabei bewertet die Verlustfunktion das Zusammentreffen der Prognosewertes mit der Realisierung mit dem Verlust . Die Risikofunktion ist die Funktion

Das minimale Risiko ergibt sich für .

Punktprognose bei bekannter gemeinsamer Wahrscheinlichkeitsverteilung

[Bearbeiten | Quelltext bearbeiten]

Wenn die gemeinsame ()-variate Wahrscheinlichkeitsverteilung von bekannt ist und die Realisierung des Zufallsvektors vorliegt, dann wird die bedingte Verteilung von gegeben als Prognoseverteilung (predictive distribution) bezeichnet. Als Punktprognose für – bei Kenntnis der Realisierung von – wird dann häufig der bedingte Erwartungswert

verwendet. Dieser ist ein realisierter Wert der zufälligen bedingten Erwartung

Der zugehörige mittlere quadratische Prognosefehler ist[2]

Diese Formel zeigt die Verminderung des Prognosefehlers durch die Nutzung der Prädiktorvariablen. Würde man die Prognose nur auf die bekannte Randverteilung von stützen, dann wäre die beste Punktprognose der Erwartungswert von und der mittlere quadratische Prognosefehler wäre . Durch die Nutzung der Prädiktorvariablen vermindert sich der Prognosefehler um .

Die Bedeutung des bedingten Erwartungswertes als Punktprognose ergibt sich daraus, dass dieser den mittleren quadratischen Prognosefehler minimiert.[3]

Der mittlere quadratische Prognosefehler kann als Risikofunktion im Sinn des erwarteten Verlustes bezüglich der quadratischen Verlustfunktion für , aufgefasst werden, das heißt

Die Minimierung eines empirischen Äquivalentes der Risikofunktion wird im Bereich des maschinellen Lernens als empirische Risikominimierung bezeichnet.

Punktprognose mit geschätzten Parametern

[Bearbeiten | Quelltext bearbeiten]

Wenn die gemeinsame Wahrscheinlichkeitsverteilung der zu prognostizierenden Variablen und des Vektors der Prädiktorvariablen nicht vollständig bekannt ist und unbekannte Parameter enthält, entsteht ein kombiniertes Schätz- und Prognoseproblem.

Erstes Beispiel

[Bearbeiten | Quelltext bearbeiten]

Die Zufallsvariablen seien stochastisch unabhängig und identisch normalverteilt mit unbekanntem Erwartungswert und der Varianz 1. Für den Vektor der Prädiktorvariablen liege die beobachtete Realisierung vor. Wegen der stochastischen Unabhängigkeit ist die bedingte Verteilung von gegeben die Randverteilung von und damit die Normalverteilung , die den unbekannten Parameter enthält, aber nicht von abhängt. Wäre bekannt, so wäre der beste Prognosewert im Sinn der Minimierung des mittleren quadratischen Prognosefehlers der Wert . Die mit der Realisierung vorliegende Information über den Parameter und damit über die Verteilung der Zufallsvariablen die Progoseverteilung wird also durch die Bildung der bedingten Verteilung nicht automatisch übertragen. Es ist daher erforderlich den unbekannten Parameter zu schätzen. Aus dem Vektor kann in einem ersten Schritt der Schätzwert für den Parameter berechnet werden. In einem zweiten Schritt kann dann die Punktprognose so gebildet werden, also ob der Parameter bekannt wäre.

Der Prognosefehler ist in diesem Fall die Zufallsvariable mit und Da und normalverteilt und stochastisch unabhängig sind, ist auch normalverteilt und es gilt .

Zweites Beispiel

[Bearbeiten | Quelltext bearbeiten]

In einem multiplen linearen Regressionsmodell mit nichtstochastischen Regressoren (erklärenden Variablen) gelte

mit den erklärten Variablen , den Werten der Regressoren , den stochastisch unabhängigen und identisch verteilten Störvariablen mit und , jeweils für , und mit dem unbekanntem Parametervektor . Der Index bezeichnet statistische Untersuchungseinheiten, dies können je nach inhaltlichem Kontext Personen, Zeitpunkte, Orte usw. sein. Aus den beobachteten Werten der Regressoren und der erklärten Variablen für sei der Schätzwert für den Parametervektor , beispielsweise mit der Methode der kleinsten Quadrate, ermittelt. Dabei bezeichnet den ()-Vektor der beobachteten Werte der erklärten Variablen und es gilt so dass die ()-Matrix der Regressorwerte ist. Der Schätzwert ist eine Realisierung der erwartungstreuen Schätzfunktion für den Parametervektor , wobei . Es gilt also . Die Kovarianzmatrix des Vektors ist .

Die in diesem Modellzusammanhang betrachtete Prognoseaufgabe ist, mithilfe eines beobachten oder hypothetisch unterstellten Vektors eine Punktprognose für abzugeben.

Da die Wahrscheinlichkeitsverteilung der Zufallsvariablen vom unbekannten Parameter abhängt, ist es naheliegend, diesen durch den Schätzwert zu ersetzen und den Prognosewert aus dem Ansatz zu bestimmen. Die Punktprognose für im Sinn der Minimierung des mittleren quadratische Prognosefehlers für ist dann .

Für den zufälligen Prognosefehler gilt in diesem Fall [4] und

.[5]

Einzelnachweise und Anmerkungen

[Bearbeiten | Quelltext bearbeiten]
  1. Es gilt
  2. Für zunächst fixierten Vektor gilt
    und daher durch Erwartungsbildung bezüglich der Prädiktorvariablen
    Wegen der, im Fall endlicher Varianzen allgemeingültigen Streuungszerlegung
    ergibt sich die angegebene Gleichung.
  3. Allgemein ist für eine Prognose von durch eine Funktion der Werte der Prädiktorvariablen der zufällige Prognosefehler durch die Differenz gegeben, wobei beide Terme Zufallsvariablen sind, die in der Regel nicht stochastisch unabhängig sind. Der mittlere quadratische Prognosefehler wird durch den bedingten Erwartungswert minimiert, es gilt also
    und für jede Realisierung gilt
    Dabei erfolgt die Minimierung über die Menge aller Funktionen, für die der zu berechnende Erwartungswerte exisiert.