Thursday 23 November 2017

Natürliche Log Transformation In Stata Forex


Für schnelle Fragen email dataprinceton. edu. Keine appts. Notwendig während der begehbaren Stunden. Hinweis: Das DSS-Labor ist geöffnet, solange Firestone geöffnet ist, keine Termine erforderlich, um die Labor-Computer für Ihre eigene Analyse zu verwenden. Protokolltransformationen Wenn die Verteilung einer Variablen einen positiven Schiefeffekt aufweist, hilft ein natürlicher Logarithmus der Variablen manchmal, die Variable in ein Modell zu integrieren. Log-Transformationen machen eine positiv geneigte Verteilung normaler. Wenn eine Änderung der abhängigen Variablen mit einer prozentualen Änderung in einer unabhängigen Variablen oder umgekehrt zusammenhängt, wird die Beziehung besser modelliert, indem das natürliche Protokoll von einer oder beiden Variablen genommen wird. Zum Beispiel schätze ich, dass Personen auf Grund von Bildung, Erfahrung und Region des Wohnsitzes anhand von Statas-Stichprobendaten nlsw88, einem Auszug aus 1988 National Logitudinal Study of Young Women, schätzen. Es sieht ok aus, aber wenn ich mir die Verteilung des Besitzes anschaue, sieht es etwas schief aus. So berechne ich ein natürliches Protokoll der Amtszeit. Es scheint ein wenig übersprungen zu sein, sieht aber etwas normal aus. Ich versuche eine Regression mit dem angemeldeten tenure. Der R-squared hat ein wenig höher, so dass die natürlichen Logarithmus zu haben scheint geholfen, um es das Modell besser passen. Wenn die unabhängige Variable, aber nicht die abhängige Variable protokolliert wird, wird eine prozentuale Änderung der unabhängigen Variablen dem 1100-fachen der Koeffizientenänderung in der abhängigen Variablen zugeordnet. Vorhergesagter Lohn -1.6390.681GRADE0.774LNTENURE-1.134SOUTH So ein Prozent Zunahme der Amtszeit ist mit einem Anstieg des Lohnes von 0,01 x 0,774 oder etwa 0,0077 verbunden. Jetzt untersuche ich den Lohn und finde, daß er sehr schief ist. So nehme ich ein natürliches Protokoll des Lohnes, und betrachten Sie die Verteilung der eingelösten Lohn. Die Verteilung sieht viel normaler aus. Nun führe ich die gleiche Regression mit dem geloggen Lohn als abhängige Variable. Wenn die abhängige Variable, aber keine unabhängige Variable protokolliert wird, wird eine einheitliche Änderung in der unabhängigen Variablen mit einem 100-fachen der Koeffizientenprozentänderung in der abhängigen Variablen assoziiert. In diesen Daten, tenure ist in Jahren gemessen: so, erhöht ein Jahr Erhöhung der Besitz erhöht den Lohn um 100x0.026 oder etwa 2,6. Wenn wir sowohl die abhängigen als auch die unabhängigen Variablen loggen, dann suchen wir die Elastizität: Prozentuale Veränderung in X ergibt eine prozentuale Veränderung in Y. vorhergesagte lnwage 0.659 0.084GRADE0.136LNTENURE-0.151SOUTH Ein Prozent Anstieg der Tenure wird geschätzt, um etwa zu ergeben 0.136 Erhöhung des Lohnes. Kopie 2007 Die Truestees der Princeton Universität. Alle Rechte vorbehalten. Dataprinceton. edu Diese Seite wurde zuletzt aktualisiert am 28. August 2008NOTICE: Die IDRE Statistical Consulting-Gruppe wird die Migration der Website, um die WordPress CMS im Februar zu erleichtern Wartung und Erstellung neuer Inhalte. Einige unserer älteren Seiten werden entfernt oder archiviert, so dass sie nicht länger erhalten bleiben. Wir werden versuchen, die Weiterleitungen so zu halten, dass die alten URLs weiterhin so gut funktionieren, wie wir können. Willkommen beim Institut für Digitale Forschung und Bildung Helfen Sie der Stat Consulting Group, indem Sie ein Geschenk geben FAQ Wie interpretiere ich ein Regressionsmodell, wenn einige Variablen logarithmiert werden Einleitung Auf dieser Seite wird diskutiert, wie ein Regressionsmodell interpretiert wird, wenn einige Variablen in Das Modell wurden log-transformiert. Die Beispieldaten können hier heruntergeladen werden (die Datei befindet sich im. csv-Format). Die Variablen in dem Datensatz sind Schreib-, Lese - und Mathematikwerte (Lese - und Schreibberechtigung). Das logarithmisch transformierte Schreiben (lgwrite) und logarithmisch transformierte mathematische Werte (lgmath) und weiblich. Für diese Beispiele haben wir das natürliche log (ln) genommen. Alle Beispiele werden in Stata durchgeführt, aber sie können leicht in jedem statistischen Paket generiert werden. In den folgenden Beispielen wird die Variable write oder ihre log-transformierte Version als Ergebnisvariable verwendet. Die Beispiele dienen der Veranschaulichung und sollen keinen substantiellen Sinn ergeben. Hier ist eine Tabelle von verschiedenen Arten von Mitteln für Variable schreiben. Ergebnisvariable ist logarithmiert Sehr häufig wird eine lineare Beziehung zwischen einer logarithmisch transformierten Ergebnisvariable und einer Gruppe von Prädiktorvariablen hypothetisiert. Mathematisch geschrieben folgt die Beziehung der Gleichung, wobei y die Ergebnisvariable und x1 ist. Xk die Prädiktorvariablen sind. Mit anderen Worten, wir nehmen an, daß log (y) - x 946 normal verteilt ist (oder y log-normal an alle Kovariaten gebunden ist). Da es sich nur um eine gewöhnliche kleinste Quadrate-Regression handelt, können wir leicht einen Regressionskoeffizienten interpretieren, Z. B. 946 1, als die erwartete Änderung in log von y in Bezug auf eine Ein-Einheitszunahme in x1, die alle anderen Variablen bei einem beliebigen festen Wert hält, wobei angenommen wird, daß x1 nur als Haupteffekt in das Modell eintritt. Aber was ist, wenn wir wissen wollen, was mit der Ergebnisvariablen y selbst geschieht, um eine einheitliche Zunahme von x1 zu erreichen? Die natürliche Weise, dies zu tun, besteht darin, die exponentierten Regressionskoeffizienten exp (946) zu interpretieren. Da Potenzierung die Umkehrung der Logarithmusfunktion ist. Beginnen wir mit dem Intercept-only-Modell, log (write) 946 0. Wir können sagen, dass 3.95 der unbedingte erwartete Mittelwert des Protokolls des Schreibens ist. Daher ist der exponentifizierte Wert exp (3.948347) 51.85. Dies ist das geometrische Mittel des Schreibens. Der Schwerpunkt liegt hierbei, dass es das geometrische Mittel statt des arithmetischen Mittels ist. OLS-Regression der ursprünglichen Variablen y wird verwendet, um das erwartete arithmetische Mittel zu schätzen, und die OLS-Regression der logarithmierten Ergebnisvariablen ist das geschätzte erwartete geometrische Mittel der ursprünglichen Variablen. Nun können Sie zu einem Modell mit einer einzigen binären Prädiktorvariable wechseln. Vor dem Tauchen in die Interpretation dieser Parameter, können wir die Mittel unserer abhängigen Variablen, schreiben. Nach Geschlecht. Nun können wir die Parameterschätzungen den geometrischen Mitteln für die beiden Gruppen zuordnen. Der Schnitt von 3.89 ist der logarithmische geometrische Mittelwert des Schreibens, wenn weiblich 0, d. h. für Männer. Daher ist der exponentierte Wert des geometrischen Mittels für die männliche Gruppe: exp (3.892) 49.01. Was können wir über den Koeffizienten für Frauen sagen. In der logarithmischen Skala ist es der Unterschied in der erwarteten geometrischen Mittel des Protokolls des Schreibens zwischen den weiblichen Studenten und männlichen Studenten. In der ursprünglichen Skala der Variable schreiben. Es ist das Verhältnis des geometrischen Mittels des Schreibens für Schülerinnen über das geometrische Mittel des Schreibens für männliche Studenten, exp (.1032614) 54.3438349.01222 1.11. In Bezug auf die prozentuale Veränderung, können wir sagen, dass die Umstellung von männlichen Studenten zu weiblichen Studenten, erwarten wir zu sehen, über 11 Erhöhung der geometrischen Mittel der schriftlichen Punktzahlen. Zuletzt können Sie ein Modell mit mehreren Prädiktorvariablen betrachten. Der exponentiierte Koeffizient exp (946 1) für weiblich ist das Verhältnis des erwarteten geometrischen Mittels für die Schülerinnengruppe über das erwartete geometrische Mittel für die männliche Studentengruppe, wenn das Lesen und das Mathemma mit einem festen Wert gehalten werden. Natürlich werden die erwarteten geometrischen Mittel für die männliche und weibliche Studenten-Gruppe für verschiedene Werte von Lesen und Mathematik unterschiedlich sein. Ihr Verhältnis ist jedoch eine Konstante: exp (946 1). In unserem Beispiel exp (946 1) exp (.114718) 1,12. Wir können sagen, dass das Schreiben von Noten 12 höher für die weiblichen Studenten als für die männlichen Studenten. Für die Variable lesen. Können wir sagen, dass für eine einheitliche Erhöhung der Lese-. Wir erwarten, um eine 0.7 Anstieg der schriftlichen Gäste zu sehen, da exp (.0066305) 1,006653. Für eine zehnfache Erhöhung des Lesens. Wir erwarten, um eine 6,9 ​​Anstieg der Schreibleistung zu sehen, da exp (.006630510) 1,0685526. Der Intercept wird weniger interessant, wenn die Prädiktorvariablen nicht zentriert und stetig sind. In diesem speziellen Modell ist das Intercept das erwartete Mittel für log (write) für männlich (female 0), wenn read und math gleich null sind. Zusammenfassend lässt sich sagen, dass, wenn die Ergebnisvariable logarithmiert wird, es natürlich ist, die exponentierten Regressionskoeffizienten zu interpretieren. Diese Werte entsprechen Änderungen im Verhältnis der erwarteten geometrischen Mittel der ursprünglichen Ergebnisvariablen. Einige (nicht alle) Prädiktorvariablen werden logarithmiert. Gelegentlich haben wir auch einige Prädiktorvariablen, die logarithmiert werden. In diesem Abschnitt werden wir einen Blick auf ein Beispiel werfen, in dem einige Prädiktorvariablen log-transformiert werden, aber die Ergebnisvariable in ihrer ursprünglichen Skala ist. Wir haben in der Gleichung geschrieben, Da es sich um eine OLS-Regression handelt, ist die Interpretation der Regressionskoeffizienten für die nicht transformierten Variablen unverändert gegenüber einer OLS-Regression ohne transformierte Variablen. Zum Beispiel beträgt die erwartete mittlere Differenz beim Schreiben von Scores zwischen den weiblichen und männlichen Schülern etwa 5,4 Punkte, wobei die anderen Prädiktorvariablen konstant gehalten werden. Andererseits sind aufgrund der logarithmierten Transformation die abgeschätzten Effekte von Mathematik und Lesen nicht mehr linear, obwohl die Wirkung von lgmath und lgread linear ist. Das Diagramm unten zeigt die Kurve der vorhergesagten Werte gegen die Lese-Scores für die weibliche Studenten-Gruppe Holding mathematische Punktzahl konstant. Wie interpretieren wir den Koeffizienten von 16.85218 für die Variable der Logarithmen des Lesepunkts, können wir zwei Werte des Lesespiegels, r1 und r2, verwenden. Der erwartete mittlere Unterschied bei der Schreibbewertung bei r1 und r2, bei dem die anderen Prädiktorvariablen konstant gehalten werden, ist schreiben (r2) - schreiben (r1) 946 3 (log (r2) - log (r1)) 946 3 log (r2r1). Dies bedeutet, dass, solange die prozentuale Zunahme des Lesens (die Prädiktorvariable) fest ist, wir die gleiche Differenz in der Schreibbewertung sehen werden, unabhängig davon, wo die Baseline-Leserate ist. Zum Beispiel können wir sagen, dass für eine 10 Erhöhung der Lese-Score, die Differenz in der erwarteten durchschnittlichen Schreibergebnisse immer 946 3 log (1,10) 16,85218log (1,1) 1,61. Sowohl die Ergebnisvariable als auch einige Prädiktorvariablen werden logarithmiert. Was geschieht, wenn sowohl die Ergebnisvariable als auch die Prädiktorvariablen logarithmiert werden, können wir die beiden zuvor beschriebenen Situationen zu einem kombinieren. Hier ist ein Beispiel für ein solches Modell. Als Gleichung beschrieben, können wir das Modell beschreiben: Für Variablen, die nicht transformiert werden, wie z. B. weiblich. Ihr exponentierter Koeffizient ist das Verhältnis des geometrischen Mittels für das weibliche zu dem geometrischen Mittel für die männliche Studentengruppe. Zum Beispiel können wir in unserem Beispiel sagen, dass die erwartete prozentuale Zunahme des geometrischen Mittels von der männlichen Schülergruppe zur weiblichen Schülergruppe etwa 12 ist, die andere Variablen konstant hält, da exp (.1142399) 1,12. Für das Lesen der Partitur können wir sagen, dass für eine einheitliche Zunahme des Lesungsergebnisses eine Zunahme des geometrischen Mittels der Schreibbewertung von 0,7 erwartet wird, da exp (0,0066086) 1,007. Nun, konzentriert sich auf die Wirkung der Mathematik. Nehmen Sie zwei Werte der Mathematik. M1 und m2 und halten die anderen Prädiktorvariablen bei jedem festen Wert. Die obige Gleichung kann vereinfacht werden, um log (write (m2) write (m1)) 946 2 (log (m2m1)) zu loggen. Dies führt dazu, dass, solange das Verhältnis der beiden Mathe-Scores, m2m1 bleibt das gleiche, das erwartete Verhältnis der Ausgang Variable, schreiben. bleibt gleich. Zum Beispiel können wir sagen, dass für jede 10 Erhöhung der Mathematik Partitur, das erwartete Verhältnis der beiden geometrischen Mitteln für das Schreiben der Gäste wird 1.10946 2 1.10.4085369 1.0397057. Mit anderen Worten, wir erwarten etwa 4 Anstieg der schriftlichen Punktzahl, wenn Mathe Punktzahl um 10 erhöht. Der Inhalt dieser Website sollte nicht als eine Bestätigung für eine bestimmte Website, Buch oder Software-Produkt von der Universität von Kalifornien ausgelegt werden.

No comments:

Post a Comment