Maximum-Likelihood-Methode: Parametrisches Schätzverfahren

Die Maximum-Likelihood-Methode, kurz ML-Methode, auch Maximum-Likelihood-Schätzung (maximum likelihood englisch für größte Plausibilität, daher auch Methode der größten Plausibilität), Methode der maximalen Mutmaßlichkeit, Größte-Dichte-Methode oder Methode der größten Dichte bezeichnet in der Statistik ein parametrisches Schätzverfahren.

Dabei wird – vereinfacht ausgedrückt – derjenige Parameter als Schätzung ausgewählt, gemäß dessen Verteilung die Realisierung der beobachteten Daten am plausibelsten erscheint.

Im Falle einer von einem Parameter abhängigen Wahrscheinlichkeitsfunktion

wird zu einem beobachteten Ausgang also die folgende Likelihood-Funktion für verschiedene Parameter betrachtet:

Dabei bezeichnet den Ergebnisraum und den Parameterraum (Raum aller möglichen Parameterwerte).

Für einen bestimmten Wert des Parameters entspricht die Likelihood-Funktion (Wahrscheinlichkeitsfunktion) der Wahrscheinlichkeit, das Ergebnis zu beobachten. Als Maximum-Likelihood-Schätzung wird entsprechend dasjenige bezeichnet, für das die Likelihood-Funktion maximal wird. Im Falle stetiger Verteilungen gilt eine analoge Definition, nur wird die Wahrscheinlichkeitsfunktion in dieser Situation durch die zugehörige Dichtefunktion ersetzt. Allgemein lassen sich Maximum-Likelihood-Methoden für beliebige statistische Modelle definieren, solange die entsprechende Verteilungsklasse eine dominierte Verteilungsklasse ist.

Motivation

Einfach gesprochen bedeutet die Maximum-Likelihood-Methode Folgendes: Wenn man statistische Untersuchungen durchführt, untersucht man in der Regel eine Stichprobe mit einer bestimmten Anzahl von Objekten einer Grundgesamtheit. Da die Untersuchung der gesamten Grundgesamtheit in den meisten Fällen hinsichtlich der Kosten und des Aufwandes unmöglich ist, sind die wichtigen Kennwerte der Grundgesamtheit unbekannt. Solche Kennwerte sind z. B. der Erwartungswert oder die Standardabweichung. Da man diese Kennwerte jedoch zu den statistischen Rechnungen, die man durchführen möchte, benötigt, muss man die unbekannten Kennwerte der Grundgesamtheit anhand der bekannten Stichprobe schätzen.

Die Maximum-Likelihood-Methode wird nun in Situationen benutzt, in denen die Elemente der Grundgesamtheit als Realisierung eines Zufallsexperiments interpretiert werden können, das von einem unbekannten Parameter abhängt, bis auf diesen aber eindeutig bestimmt und bekannt ist. Entsprechend hängen die interessanten Kennwerte ausschließlich von diesem unbekannten Parameter ab, lassen sich also als Funktion von ihm darstellen. Als Maximum-Likelihood-Schätzer wird nun derjenige Parameter bezeichnet, der die Wahrscheinlichkeit, die Stichprobe zu erhalten, maximiert.

Die Maximum-Likelihood-Methode ist aufgrund ihrer Vorteile gegenüber anderen Schätzverfahren (beispielsweise die Methode der kleinsten Quadrate und die Momentenmethode) das wichtigste Prinzip zur Gewinnung von Schätzfunktionen für die Parameter einer Verteilung.

Eine heuristische Herleitung

Es wird nun folgendes Beispiel betrachtet: Es gibt eine Urne mit einer großen Anzahl von Kugeln, die entweder schwarz oder rot sind. Da die Untersuchung aller Kugeln praktisch unmöglich erscheint, wird eine Stichprobe von zehn Kugeln (etwa mit Zurücklegen) gezogen. In dieser Stichprobe seien nun eine rote und neun schwarze Kugeln. Ausgehend von dieser einen Stichprobe soll nun die wahre Wahrscheinlichkeit, eine rote Kugel in der Gesamtpopulation (Urne) zu ziehen, geschätzt werden.

Maximum-Likelihood-Methode: Motivation, Eine heuristische Herleitung, Definition 
Drei Likelihood-Funktionen für Parameter p einer Binomialverteilung für verschiedene Anzahlen k von roten Kugeln in einer Stichprobe von n=10 Kugeln

Die Maximum-Likelihood-Methode versucht diese Schätzung nun so zu erstellen, dass das Auftreten unserer Stichprobe damit am wahrscheinlichsten wird. Dazu könnte man ausprobieren, bei welchem Schätzwert die Wahrscheinlichkeit für unser Stichprobenergebnis maximal wird.

Probiert man beispielsweise Maximum-Likelihood-Methode: Motivation, Eine heuristische Herleitung, Definition  als Schätzwert für die Wahrscheinlichkeit Maximum-Likelihood-Methode: Motivation, Eine heuristische Herleitung, Definition  einer roten Kugel, so kann man mit Hilfe der Binomialverteilung Maximum-Likelihood-Methode: Motivation, Eine heuristische Herleitung, Definition  die Wahrscheinlichkeit des beobachteten Ergebnisses (genau eine rote Kugel) berechnen: das Ergebnis ist Maximum-Likelihood-Methode: Motivation, Eine heuristische Herleitung, Definition .

Probiert man es mit Maximum-Likelihood-Methode: Motivation, Eine heuristische Herleitung, Definition  als Schätzwert für Maximum-Likelihood-Methode: Motivation, Eine heuristische Herleitung, Definition , berechnet also Maximum-Likelihood-Methode: Motivation, Eine heuristische Herleitung, Definition  für die Wahrscheinlichkeit, dass genau eine rote Kugel gezogen wird, ist das Ergebnis Maximum-Likelihood-Methode: Motivation, Eine heuristische Herleitung, Definition .

Mit Maximum-Likelihood-Methode: Motivation, Eine heuristische Herleitung, Definition  für Maximum-Likelihood-Methode: Motivation, Eine heuristische Herleitung, Definition  ist die Wahrscheinlichkeit, dass das beobachtete Ergebnis (genau eine rote Kugel) in der Stichprobe durch eine Populationswahrscheinlichkeit für rote Kugeln von Maximum-Likelihood-Methode: Motivation, Eine heuristische Herleitung, Definition  verursacht wurde, somit größer als bei Maximum-Likelihood-Methode: Motivation, Eine heuristische Herleitung, Definition . Damit wäre nach der Maximum-Likelihood-Methode Maximum-Likelihood-Methode: Motivation, Eine heuristische Herleitung, Definition  ein besserer Schätzwert für den Anteil Maximum-Likelihood-Methode: Motivation, Eine heuristische Herleitung, Definition  roter Kugeln in der Grundgesamtheit. Es erweist sich, dass für Maximum-Likelihood-Methode: Motivation, Eine heuristische Herleitung, Definition  (siehe rote Linie für Maximum-Likelihood-Methode: Motivation, Eine heuristische Herleitung, Definition  in der Grafik) die Wahrscheinlichkeit des beobachteten Ergebnisses am größten ist. Deshalb ist Maximum-Likelihood-Methode: Motivation, Eine heuristische Herleitung, Definition  die Maximum-Likelihood-Schätzung von Maximum-Likelihood-Methode: Motivation, Eine heuristische Herleitung, Definition . Man kann zeigen, dass sich allgemein bei Maximum-Likelihood-Methode: Motivation, Eine heuristische Herleitung, Definition  roten Kugeln in der Stichprobe Maximum-Likelihood-Methode: Motivation, Eine heuristische Herleitung, Definition  als Maximum-Likelihood-Schätzung von Maximum-Likelihood-Methode: Motivation, Eine heuristische Herleitung, Definition  ergibt.

Definition

Bei der Maximum-Likelihood-Methode wird von einer Zufallsvariablen Maximum-Likelihood-Methode: Motivation, Eine heuristische Herleitung, Definition  ausgegangen, deren Dichte- bzw. Wahrscheinlichkeitsfunktion Maximum-Likelihood-Methode: Motivation, Eine heuristische Herleitung, Definition  von einem unbekannten Parameter Maximum-Likelihood-Methode: Motivation, Eine heuristische Herleitung, Definition  abhängt. Liegt eine einfache Zufallsstichprobe mit Maximum-Likelihood-Methode: Motivation, Eine heuristische Herleitung, Definition  Realisierungen Maximum-Likelihood-Methode: Motivation, Eine heuristische Herleitung, Definition  von Maximum-Likelihood-Methode: Motivation, Eine heuristische Herleitung, Definition  unabhängig und identisch verteilten Zufallsvariablen Maximum-Likelihood-Methode: Motivation, Eine heuristische Herleitung, Definition  vor, so lässt sich die gemeinsame Dichtefunktion bzw. Wahrscheinlichkeitsfunktion wie folgt faktorisieren:

    Maximum-Likelihood-Methode: Motivation, Eine heuristische Herleitung, Definition .

Statt nun für einen festen Parameter Maximum-Likelihood-Methode: Motivation, Eine heuristische Herleitung, Definition  die Dichte für beliebige Werte Maximum-Likelihood-Methode: Motivation, Eine heuristische Herleitung, Definition  auszuwerten, kann umgekehrt für beobachtete und somit feste Realisierungen Maximum-Likelihood-Methode: Motivation, Eine heuristische Herleitung, Definition  die gemeinsame Dichte als Funktion von Maximum-Likelihood-Methode: Motivation, Eine heuristische Herleitung, Definition  interpretiert werden. Dies führt zur Likelihood-Funktion

    Maximum-Likelihood-Methode: Motivation, Eine heuristische Herleitung, Definition .

Die Likelihood-Funktion ist algebraisch identisch zur gemeinsamen Dichte Maximum-Likelihood-Methode: Motivation, Eine heuristische Herleitung, Definition . Wird diese Funktion in Abhängigkeit von Maximum-Likelihood-Methode: Motivation, Eine heuristische Herleitung, Definition  maximiert

    Maximum-Likelihood-Methode: Motivation, Eine heuristische Herleitung, Definition ,

so erhält man die Maximum-Likelihood-Schätzung für den unbekannten Parameter Maximum-Likelihood-Methode: Motivation, Eine heuristische Herleitung, Definition . Es wird also der Wert von Maximum-Likelihood-Methode: Motivation, Eine heuristische Herleitung, Definition  gesucht, bei dem die Stichprobenwerte Maximum-Likelihood-Methode: Motivation, Eine heuristische Herleitung, Definition  die größte Dichte- bzw. Wahrscheinlichkeitsfunktion haben. Es ist naheliegend, einen Parameterwert Maximum-Likelihood-Methode: Motivation, Eine heuristische Herleitung, Definition  als umso plausibler anzusehen je höher die Likelihood. Der Maximum-Likelihood-Schätzer ist in diesem Sinne der plausibelste Parameterwert für die Realisierungen Maximum-Likelihood-Methode: Motivation, Eine heuristische Herleitung, Definition  der Zufallsvariablen Maximum-Likelihood-Methode: Motivation, Eine heuristische Herleitung, Definition . Ist Maximum-Likelihood-Methode: Motivation, Eine heuristische Herleitung, Definition  differenzierbar, so kann das Maximum bestimmt werden, indem man die erste Ableitung nach Maximum-Likelihood-Methode: Motivation, Eine heuristische Herleitung, Definition  bildet und diese dann Null setzt. Da dieses bei Dichtefunktionen mit komplizierten Exponentenausdrücken sehr aufwändig werden kann, wird häufig die logarithmierte Likelihood-Funktion bzw. logarithmische Likelihood-Funktion (kurz: Log-Likelihood-Funktion) verwendet, da sie auf Grund der Monotonie des Logarithmus ihr Maximum an derselben Stelle wie die nichtlogarithmierte Dichtefunktion besitzt, jedoch einfacher zu berechnen ist:

    Maximum-Likelihood-Methode: Motivation, Eine heuristische Herleitung, Definition ,

wobei Maximum-Likelihood-Methode: Motivation, Eine heuristische Herleitung, Definition  die individuellen Beiträge zur Log-Likelihood-Funktion sind.

Nicht unabhängig verteilte Zufallsvariablen

Bei nicht unabhängig verteilten Zufallsvariablen (wie z. B. in Longitudinalstudien) faktorisiert die Likelihood-Funktion nur, falls unabhängige Blöcke von Zufallsvariablen vorliegen. In den jeweiligen Blöcken sind die (bedingten) Korrelationsfunktionen zu schätzen. Beispielsweise gilt für einen Zufallsvektor normalverteilter Zufallsvariablen Maximum-Likelihood-Methode: Motivation, Eine heuristische Herleitung, Definition :

    Maximum-Likelihood-Methode: Motivation, Eine heuristische Herleitung, Definition 

wobei Maximum-Likelihood-Methode: Motivation, Eine heuristische Herleitung, Definition  ein Vektor (bedingter) Erwartungswerte und Maximum-Likelihood-Methode: Motivation, Eine heuristische Herleitung, Definition  die Korrelationsmatrix ist, welche beide zu schätzen sind. Da die Zahl der Parameter von Maximum-Likelihood-Methode: Motivation, Eine heuristische Herleitung, Definition  gleich Maximum-Likelihood-Methode: Motivation, Eine heuristische Herleitung, Definition  ist und somit quadratisch in Maximum-Likelihood-Methode: Motivation, Eine heuristische Herleitung, Definition  steigt, kann es hilfreich sein, eine parametrische Form für Maximum-Likelihood-Methode: Motivation, Eine heuristische Herleitung, Definition  anzunehmen.

Beispiele

Diskrete Verteilung, kontinuierlicher Parameterraum

Die Anzahl der Anrufe bei zwei Telefonisten in einer Stunde in einem Call-Center kann mit einer Poisson-Verteilung

    Maximum-Likelihood-Methode: Motivation, Eine heuristische Herleitung, Definition  und Maximum-Likelihood-Methode: Motivation, Eine heuristische Herleitung, Definition 

modelliert werden. Beim ersten Telefonisten gehen drei und beim zweiten fünf Anrufe pro Stunde unabhängig voneinander ein. Die Likelihood-Funktion für den unbekannten Parameter Maximum-Likelihood-Methode: Motivation, Eine heuristische Herleitung, Definition  ergibt sich als

    Maximum-Likelihood-Methode: Motivation, Eine heuristische Herleitung, Definition 
Maximum-Likelihood-Methode: Motivation, Eine heuristische Herleitung, Definition 
Likelihood-Funktion im nebenstehenden Beispiel

Setzt man die Werte in die Wahrscheinlichkeitsfunktion

    Maximum-Likelihood-Methode: Motivation, Eine heuristische Herleitung, Definition 

ein, so folgt

    Maximum-Likelihood-Methode: Motivation, Eine heuristische Herleitung, Definition .

Die erste Ableitung der Likelihood-Funktion ergibt sich zu

    Maximum-Likelihood-Methode: Motivation, Eine heuristische Herleitung, Definition 

und die Nullstellen sind offenbar Maximum-Likelihood-Methode: Motivation, Eine heuristische Herleitung, Definition  und Maximum-Likelihood-Methode: Motivation, Eine heuristische Herleitung, Definition . Nur für Maximum-Likelihood-Methode: Motivation, Eine heuristische Herleitung, Definition  hat die Likelihood-Funktion ein Maximum und dies ist der Maximum-Likelihood-Schätzwert.

Im allgemeinen Fall, mit Maximum-Likelihood-Methode: Motivation, Eine heuristische Herleitung, Definition  Telefonisten, die jeweils Maximum-Likelihood-Methode: Motivation, Eine heuristische Herleitung, Definition  Anrufe pro Stunde erhalten, ergibt sich die Likelihood-Funktion als

    Maximum-Likelihood-Methode: Motivation, Eine heuristische Herleitung, Definition 

und die Log-Likelihood-Funktion als

    Maximum-Likelihood-Methode: Motivation, Eine heuristische Herleitung, Definition 

Die Ableitung nach Maximum-Likelihood-Methode: Motivation, Eine heuristische Herleitung, Definition  ergibt

    Maximum-Likelihood-Methode: Motivation, Eine heuristische Herleitung, Definition 

und nach Umformen ergibt sich der Maximum-Likelihood-Schätzer als

    Maximum-Likelihood-Methode: Motivation, Eine heuristische Herleitung, Definition 

und die zugehörige Schätzfunktion als

    Maximum-Likelihood-Methode: Motivation, Eine heuristische Herleitung, Definition 

Diskrete Verteilung, endlicher Parameterraum

Eine Urne enthält Maximum-Likelihood-Methode: Motivation, Eine heuristische Herleitung, Definition  Kugeln, die entweder rot oder schwarz sind. Die genaue Anzahl Maximum-Likelihood-Methode: Motivation, Eine heuristische Herleitung, Definition  der roten Kugeln ist nicht bekannt. Nacheinander werden Maximum-Likelihood-Methode: Motivation, Eine heuristische Herleitung, Definition  Kugeln gezogen und jeweils wieder zurück in die Urne gelegt. Beobachtet werden Maximum-Likelihood-Methode: Motivation, Eine heuristische Herleitung, Definition  (erste Kugel ist rot), Maximum-Likelihood-Methode: Motivation, Eine heuristische Herleitung, Definition  (zweite Kugel ist rot), Maximum-Likelihood-Methode: Motivation, Eine heuristische Herleitung, Definition  (dritte Kugel ist schwarz) und Maximum-Likelihood-Methode: Motivation, Eine heuristische Herleitung, Definition  (vierte Kugel ist rot).

Gesucht ist nun die nach dem Maximum-Likelihood-Prinzip plausibelste Zusammensetzung der Kugeln in der Urne.

In jedem Zug ist die Wahrscheinlichkeit, eine rote Kugel zu ziehen, gleich Maximum-Likelihood-Methode: Motivation, Eine heuristische Herleitung, Definition . Wegen der Unabhängigkeit der Ziehungen ist die Wahrscheinlichkeit des beobachteten Ergebnisses und damit die zugehörige Likelihood-Funktion in Abhängigkeit vom unbekannten Parameter Maximum-Likelihood-Methode: Motivation, Eine heuristische Herleitung, Definition  gegeben durch

    Maximum-Likelihood-Methode: Motivation, Eine heuristische Herleitung, Definition 

Es ergeben sich folgende Funktionswerte:

Maximum-Likelihood-Methode: Motivation, Eine heuristische Herleitung, Definition  Maximum-Likelihood-Methode: Motivation, Eine heuristische Herleitung, Definition  Maximum-Likelihood-Methode: Motivation, Eine heuristische Herleitung, Definition  Maximum-Likelihood-Methode: Motivation, Eine heuristische Herleitung, Definition  Maximum-Likelihood-Methode: Motivation, Eine heuristische Herleitung, Definition  Maximum-Likelihood-Methode: Motivation, Eine heuristische Herleitung, Definition  Maximum-Likelihood-Methode: Motivation, Eine heuristische Herleitung, Definition  Maximum-Likelihood-Methode: Motivation, Eine heuristische Herleitung, Definition  Maximum-Likelihood-Methode: Motivation, Eine heuristische Herleitung, Definition  Maximum-Likelihood-Methode: Motivation, Eine heuristische Herleitung, Definition 
Maximum-Likelihood-Methode: Motivation, Eine heuristische Herleitung, Definition  0 0,002 0,012 0,033 0,063 0,092 0,105 0,084 0

Daraus ergibt sich, dass die Likelihood-Funktion Maximum-Likelihood-Methode: Motivation, Eine heuristische Herleitung, Definition  maximal ist für Maximum-Likelihood-Methode: Motivation, Eine heuristische Herleitung, Definition . Damit ist Maximum-Likelihood-Methode: Motivation, Eine heuristische Herleitung, Definition  der plausibelste Parameterwert für die Realisierung drei roter Kugeln bei vier Ziehungen und somit der Schätzwert nach der Maximum-Likelihood-Methode.

Stetige Verteilung, kontinuierlicher Parameterraum

Seien Maximum-Likelihood-Methode: Motivation, Eine heuristische Herleitung, Definition  Realisierungen einer Zufallsstichprobe Maximum-Likelihood-Methode: Motivation, Eine heuristische Herleitung, Definition  einer Normalverteilung Maximum-Likelihood-Methode: Motivation, Eine heuristische Herleitung, Definition  mit unbekanntem Erwartungswert Maximum-Likelihood-Methode: Motivation, Eine heuristische Herleitung, Definition  und unbekannter Varianz Maximum-Likelihood-Methode: Motivation, Eine heuristische Herleitung, Definition . Die Dichtefunktion für jede einzelne Realisierung ist dann gegeben durch

    Maximum-Likelihood-Methode: Motivation, Eine heuristische Herleitung, Definition .

Dann ist

    Maximum-Likelihood-Methode: Motivation, Eine heuristische Herleitung, Definition .

die Likelihood-Funktion von Maximum-Likelihood-Methode: Motivation, Eine heuristische Herleitung, Definition . Als Log-Likelihood-Funktion (auch logarithmische Plausibilitätsfunktion genannt) ergibt sich

    Maximum-Likelihood-Methode: Motivation, Eine heuristische Herleitung, Definition .

Bildet man die partiellen Ableitungen von Maximum-Likelihood-Methode: Motivation, Eine heuristische Herleitung, Definition  nach Maximum-Likelihood-Methode: Motivation, Eine heuristische Herleitung, Definition  und Maximum-Likelihood-Methode: Motivation, Eine heuristische Herleitung, Definition  (bildet man also die Score-Funktionen) und setzt man beide Ausdrücke gleich null, dann erhält man die beiden Likelihood-Gleichungen

    Maximum-Likelihood-Methode: Motivation, Eine heuristische Herleitung, Definition 

und

    Maximum-Likelihood-Methode: Motivation, Eine heuristische Herleitung, Definition .

Löst man nun nach Maximum-Likelihood-Methode: Motivation, Eine heuristische Herleitung, Definition  und Maximum-Likelihood-Methode: Motivation, Eine heuristische Herleitung, Definition  dann erhält man die beiden Maximum-Likelihood-Schätzungen

    Maximum-Likelihood-Methode: Motivation, Eine heuristische Herleitung, Definition 

und

    Maximum-Likelihood-Methode: Motivation, Eine heuristische Herleitung, Definition .

Geht man von den Zufallsvariablen Maximum-Likelihood-Methode: Motivation, Eine heuristische Herleitung, Definition  und nicht von ihren Realisierungen Maximum-Likelihood-Methode: Motivation, Eine heuristische Herleitung, Definition  aus, erhält man den Stichprobenmittelwert

    Maximum-Likelihood-Methode: Motivation, Eine heuristische Herleitung, Definition 

und die Stichprobenvarianz

    Maximum-Likelihood-Methode: Motivation, Eine heuristische Herleitung, Definition 

als Maximum-Likelihood-Schätzer.

Tatsächlich hat die Funktion Maximum-Likelihood-Methode: Motivation, Eine heuristische Herleitung, Definition  an dieser Stelle ihr Maximum (siehe Schätzung der Varianz der Grundgesamtheit).

Für den Erwartungswert von Maximum-Likelihood-Methode: Motivation, Eine heuristische Herleitung, Definition  ergibt sich

    Maximum-Likelihood-Methode: Motivation, Eine heuristische Herleitung, Definition ,

das heißt, der Maximum-Likelihood-Schätzer Maximum-Likelihood-Methode: Motivation, Eine heuristische Herleitung, Definition  ist erwartungstreu für den unbekannten Parameter Maximum-Likelihood-Methode: Motivation, Eine heuristische Herleitung, Definition .

Man kann zeigen, dass für den Erwartungswert von Maximum-Likelihood-Methode: Motivation, Eine heuristische Herleitung, Definition 

    Maximum-Likelihood-Methode: Motivation, Eine heuristische Herleitung, Definition 

gilt (siehe unbekannter Erwartungswert). Der Maximum-Likelihood-Schätzer Maximum-Likelihood-Methode: Motivation, Eine heuristische Herleitung, Definition  für die unbekannte skalare Störgrößenvarianz Maximum-Likelihood-Methode: Motivation, Eine heuristische Herleitung, Definition  ist also nicht erwartungstreu. Allerdings kann man zeigen, dass der Maximum-Likelihood-Schätzer Maximum-Likelihood-Methode: Motivation, Eine heuristische Herleitung, Definition  asymptotisch erwartungstreu für Maximum-Likelihood-Methode: Motivation, Eine heuristische Herleitung, Definition  ist.

Historische Entwicklung

Die Maximum-Likelihood-Methode geht auf Ronald Aylmer Fisher zurück, der sie zunächst in relativer Unkenntnis von Vorarbeiten durch Gauß in Arbeiten von 1912, 1921 und schließlich 1922 unter dem später bekannten Namen entwickelte. Die Hauptergebnisse wurden auch bereits 1908 von Francis Ysidro Edgeworth hergeleitet.

Maximum-Likelihood-Schätzung

Als Maximum-Likelihood-Schätzung, kurz MLS bezeichnet man in der Statistik eine Parameterschätzung, die nach der Maximum-Likelihood-Methode berechnet wurde. In der englischen Fachliteratur ist die Abkürzung MLE (für maximum likelihood estimation oder maximum likelihood estimator) dafür sehr verbreitet. Eine Schätzung, bei der Vorwissen in Form einer A-priori-Wahrscheinlichkeit einfließt, wird Maximum-a-posteriori-Schätzung (kurz MAP) genannt.

Eigenschaften von Maximum-Likelihood-Schätzern

Die besondere Qualität von Maximum-Likelihood-Schätzern äußert sich darin, dass sie in der Regel die effizienteste Methode zur Schätzung bestimmter Parameter darstellt.

Existenz

Unter bestimmten Regularitätsbedingungen lässt sich beweisen, dass Maximum-Likelihood-Schätzer existieren, was aufgrund ihrer impliziten Definition als eindeutiger Maximalstelle einer nicht näher bestimmten Wahrscheinlichkeitsfunktion nicht offensichtlich ist. Die für diesen Beweis benötigten Voraussetzungen bestehen im Prinzip ausschließlich aus Annahmen zur Vertauschbarkeit von Integration und Differentiation, was in den meisten betrachteten Modellen erfüllt ist.

Asymptotische Normalität

Wenn Maximum-Likelihood-Schätzer existieren und gewisse Regularitätsbedingungen erfüllt sind, dann sind sie asymptotisch normalverteilt. Formal gesprochen sei Maximum-Likelihood-Methode: Motivation, Eine heuristische Herleitung, Definition  der Maximum-Likelihood-Schätzer für einen Parameter Maximum-Likelihood-Methode: Motivation, Eine heuristische Herleitung, Definition  und Maximum-Likelihood-Methode: Motivation, Eine heuristische Herleitung, Definition  erwartete Fisher-Information. Dann gilt unter bestimmten Annahmen

    Maximum-Likelihood-Methode: Motivation, Eine heuristische Herleitung, Definition 

bzw.

    Maximum-Likelihood-Methode: Motivation, Eine heuristische Herleitung, Definition .

Allgemeine Tests

Maximum-Likelihood-Methode: Motivation, Eine heuristische Herleitung, Definition 
Arbeitsweise der drei Tests im Rahmen der Maximum-Likelihood-Methode.

Die Konvergenz der Maximum-Likelihood-Schätzfunktion Maximum-Likelihood-Methode: Motivation, Eine heuristische Herleitung, Definition  gegen eine Normalverteilung erlaubt die Ableitung allgemeiner Tests zur Prüfung von Modellen und Koeffizienten:

Die Grafik rechts zeigt die Arbeitsweise der Tests auf: Der Likelihood-Quotienten-Test vergleicht die Werte der Likelihood-Funktionen miteinander, der Wald-Test prüft den Abstand zwischen dem geschätzten Parameter und dem vorgegebenen Parameter und der Score-Test, ob die Ableitung der Likelihood-Funktion Null ist.

Da diese Tests nur asymptotisch gültig sind, gibt es für „kleine“ Stichprobenumfänge oft Tests mit besseren Optimalitätseigenschaften.

Likelihood-Quotienten-Test

Im Likelihood-Quotienten-Test wird geprüft, ob sich zwei hierarchisch geschachtelte Modelle (englisch nested models) signifikant voneinander unterscheiden. Ist Maximum-Likelihood-Methode: Motivation, Eine heuristische Herleitung, Definition  ein Parametervektor, sind Maximum-Likelihood-Methode: Motivation, Eine heuristische Herleitung, Definition  zwei Parameterräume (Maximum-Likelihood-Methode: Motivation, Eine heuristische Herleitung, Definition  reduziertes Modell, Maximum-Likelihood-Methode: Motivation, Eine heuristische Herleitung, Definition  volles Modell) sowie Maximum-Likelihood-Methode: Motivation, Eine heuristische Herleitung, Definition  die Likelihood-Funktion, dann gilt unter der Nullhypothese (Maximum-Likelihood-Methode: Motivation, Eine heuristische Herleitung, Definition  vs. Maximum-Likelihood-Methode: Motivation, Eine heuristische Herleitung, Definition )

    Maximum-Likelihood-Methode: Motivation, Eine heuristische Herleitung, Definition .

Eine Ablehnung der Nullhypothese bedeutet, dass das „volle Modell“ (das Modell unter der Alternativhypothese) eine signifikant bessere Erklärung liefert als das „reduzierte Modell“ (das Modell unter der Nullhypothese bzw. Nullmodell) .

Wald-Test

Während der Likelihood-Quotienten-Test Modelle vergleicht, zielt der Wald-Test auf einzelne Koeffizienten (univariat) oder Koeffizientengruppen (multivariat). Asymptotisch und unter der Nullhypothese Maximum-Likelihood-Methode: Motivation, Eine heuristische Herleitung, Definition  folgt

    Maximum-Likelihood-Methode: Motivation, Eine heuristische Herleitung, Definition .

D.h. die Wald-Teststatistik ist unter o. g. Voraussetzungen standardnormalverteilt. Hierbei bezeichnet Maximum-Likelihood-Methode: Motivation, Eine heuristische Herleitung, Definition  die Fisher-Information.

Akaike-Informationskriterium

Die Maximum-Likelihood-Methode ist auch eng mit dem Akaike-Informationskriterium (AIC) verknüpft. Hirotsugu Akaike zeigte, dass das Maximum der Likelihood-Funktion ein verzerrter Schätzer für die Kullback-Leibler-Divergenz, der Abstand zwischen dem wahren Modell und dem Maximum-Likelihood-Modell, ist. Je größer der Wert der Likelihood-Funktion ist, desto näher liegt das Modell am wahren Modell, gewählt wird das Modell, das den geringsten AIC-Wert aufweist. Die asymptotische erwartungstreue ist gerade die Anzahl der zu schätzenden Parameter. Mit dem Akaike-Informationskriterium kann man, im Gegensatz zum Likelihood-Quotienten-, Wald- und Score-Test, auch nichtgeschachtelte ML-Modelle vergleichen.

Anpassungsgüte

Die Anpassungsgüte kann mithilfe der Pseudo-Bestimmtheitsmaße beurteilt werden.

Nachteile der Methode

Die wünschenswerten Eigenschaften des Maximum-Likelihood-Ansatzes beruhen auf der entscheidenden Annahme über den datenerzeugenden Prozess, das heißt auf der unterstellten Dichtefunktion der untersuchten Zufallsvariable. Der Nachteil der Maximum-Likelihood-Methode besteht darin, dass eine konkrete Annahme über die gesamte Verteilung der Zufallsvariable getroffen werden muss. Wenn diese jedoch verletzt ist, kann es sein, dass die Maximum-Likelihood-Schätzer inkonsistent sind.

Nur in einigen Fällen ist es unerheblich, ob die Zufallsvariable tatsächlich der unterstellten Verteilung gehorcht, allerdings gilt dies nicht im Allgemeinen. Per Maximum-Likelihood gewonnene Schätzer, die konsistent sind, auch wenn die zu Grunde gelegte Verteilungsannahme verletzt wird, sind sogenannte Pseudo-Maximum-Likelihood-Schätzer.

Maximum-Likelihood-Schätzer können Effizienzprobleme und systematische Fehler in kleinen Stichproben aufweisen.

Sind die Daten nicht zufällig, kann man mit anderen Methoden oft bessere Parameter ermitteln. Das kann beispielsweise bei Quasi-Monte-Carlo-Analysen eine Rolle spielen, oder wenn die Daten bereits gemittelt sind.

Erweiterungen

Die empirische Likelihood erlaubt es den Nachteil einer zwingenden Verteilungsannahme zu beseitigen und eine nichtparametrische Maximum-Likelihood-Methode zu definieren.

Anwendungsbeispiel: Maximum-Likelihood in der molekularen Phylogenie

Das Maximum-Likelihood-Kriterium gilt als eine der Standardmethoden zur Berechnung von phylogenetischen Bäumen, um Verwandtschaftsbeziehungen zwischen Organismen – meist anhand von DNA- oder Proteinsequenzen – zu erforschen. Als explizite Methode ermöglicht Maximum-Likelihood die Anwendung verschiedener Evolutionsmodelle, die in Form von Substitutionsmatrizen in die Stammbaumberechnungen einfließen. Entweder werden empirische Modelle verwendet (Proteinsequenzen) oder die Wahrscheinlichkeiten für Punktmutationen zwischen den verschiedenen Nukleotiden werden anhand des Datensatzes geschätzt und hinsichtlich des Likelihood-Wertes (Maximum-Likelihood-Methode: Motivation, Eine heuristische Herleitung, Definition ) optimiert (DNA-Sequenzen). Allgemein gilt ML als die zuverlässigste und am wenigsten Artefakt-anfällige Methode unter den phylogenetischen Baumkonstruktionsmethoden. Dies erfordert jedoch ein sorgfältiges Taxon-„Sampling“ und meist ein komplexes Evolutionsmodell.

Siehe auch

Literatur

  • Schwarze, Jochen: Grundlagen der Statistik – Band 2: Wahrscheinlichkeitsrechnung und induktive Statistik, 6. Auflage, Berlin; Herne: Verlag Neue Wirtschaftsbriefe, 1997
  • Blobel, Volker und Lohrmann, Erich: Statistische und numerische Methoden der Datenanalyse. Teubner Studienbücher, Stuttgart; Leipzig 1998, ISBN 978-3-519-03243-4.

Einzelnachweise

Tags:

Maximum-Likelihood-Methode MotivationMaximum-Likelihood-Methode Eine heuristische HerleitungMaximum-Likelihood-Methode DefinitionMaximum-Likelihood-Methode BeispieleMaximum-Likelihood-Methode Historische EntwicklungMaximum-Likelihood-Methode Maximum-Likelihood-SchätzungMaximum-Likelihood-Methode Eigenschaften von Maximum-Likelihood-SchätzernMaximum-Likelihood-Methode Nachteile der MethodeMaximum-Likelihood-Methode ErweiterungenMaximum-Likelihood-Methode Anwendungsbeispiel: Maximum-Likelihood in der molekularen PhylogenieMaximum-Likelihood-Methode Siehe auchMaximum-Likelihood-Methode LiteraturMaximum-Likelihood-Methode EinzelnachweiseMaximum-Likelihood-MethodeEnglische SprachePlausibilitätRealisierung (Stochastik)StatistikStatistisches Schätzverfahren

🔥 Trending searches on Wiki Deutsch:

Elisabeth I.Im Westen nichts Neues (2022)Matthew MacfadyenSteven SeagalSebastian StröbelDienstgrade der BundeswehrTV MainfrankenSilicon Valley BankJom-Kippur-KriegSatoshi NakamotoDer Kater mit Hut (Kinderbuch)Schleswig-HolsteinListe der Kfz-Kennzeichen in DeutschlandOperation Market GardenMichael JordanThierry LhermitteThomas HeinzeZDFStranger ThingsRoy BlackBud SpencerEverything Everywhere All at OnceSchönes SchlamasselAlexis ArquetteLuna SchweigerBrooke ShieldsKeanu ReevesFifty Shades of Grey (Film)Stefanie HeinzmannDalianNikolaus II. (Russland)Kevin DansoT-55JapanEin Mann namens OttoSimone MenneChristopher WalkenSylvester StalloneChester BenningtonArbeitslosenstatistikAm TurmeKalifornienBaden-WürttembergDeutsches KaiserreichARDCredit SuisseJennifer LawrenceLet’s Dance (Fernsehsendung)Tom TykwerJitzchak HerzogRheinDagmar BerghoffAlex BrendemühlRamadanSankt JavelinNadja Abd el FarragBrendan FraserKlaus BarkowskyScott AdkinsUngarnListe der Präsidenten der Vereinigten StaatenMadeiraUma ThurmanArmenienKylian MbappéMartin LutherStar TrekManta, MantaEmpire State IndexVerona PoothFußball-Ligasystem in DeutschlandManta – Der FilmJohann Wolfgang von GoetheBashir Ahmad (Politiker)Erling HaalandManfred von RichthofenGwyneth PaltrowWladimir Wladimirowitsch Putin🡆 More