Über das Badezimmer – Decke. Badezimmer. Fliese. Ausrüstung. Reparatur. Installation

Die Analyse experimenteller Daten erfolgt anhand der Methode der kleinsten Quadrate. Methode der kleinsten Quadrate in Excel. Regressionsanalyse. Aktivieren des Find Solution-Add-ons

Methode kleinsten Quadrate Wird zur Schätzung der Parameter der Regressionsgleichung verwendet.

Eine der Methoden zur Untersuchung stochastischer Beziehungen zwischen Merkmalen ist die Regressionsanalyse.
Unter Regressionsanalyse versteht man die Ableitung einer Regressionsgleichung, mit deren Hilfe der Durchschnittswert einer Zufallsvariablen (Ergebnisattribut) ermittelt wird, wenn der Wert einer anderen (oder anderer) Variablen (Faktorattribute) bekannt ist. Es umfasst die folgenden Schritte:

  1. Auswahl der Verbindungsform (Art der analytischen Regressionsgleichung);
  2. Schätzung von Gleichungsparametern;
  3. Beurteilung der Qualität der analytischen Regressionsgleichung.
Am häufigsten wird eine lineare Form verwendet, um die statistische Beziehung von Merkmalen zu beschreiben. Der Fokus auf lineare Beziehungen erklärt sich aus der klaren ökonomischen Interpretation ihrer Parameter, der begrenzten Variation von Variablen und der Tatsache, dass in den meisten Fällen nichtlineare Beziehungsformen (durch Logarithmus oder Substitution von Variablen) in eine lineare Form umgewandelt werden, um Berechnungen durchzuführen .
Im Fall einer linearen paarweisen Beziehung nimmt die Regressionsgleichung die Form an: y i =a+b·x i +u i . Die Parameter a und b dieser Gleichung werden aus den Daten geschätzt statistische Beobachtung x und y. Das Ergebnis einer solchen Bewertung ist die Gleichung: , wobei , Schätzungen der Parameter a und b sind, der Wert des resultierenden Attributs (der Variablen) ist, das aus der Regressionsgleichung erhalten wird (berechneter Wert).

Wird am häufigsten zum Schätzen von Parametern verwendet Methode der kleinsten Quadrate (LSM).
Die Methode der kleinsten Quadrate liefert die besten (konsistenten, effizienten und unvoreingenommenen) Schätzungen der Parameter der Regressionsgleichung. Allerdings nur, wenn bestimmte Annahmen bezüglich des Zufallsterms (u) und der unabhängigen Variablen (x) erfüllt sind (siehe OLS-Annahmen).

Das Problem der Schätzung der Parameter einer linearen Paargleichung mithilfe der Methode der kleinsten Quadrate ist wie folgt: um solche Schätzungen von Parametern zu erhalten , , bei denen die Summe der quadratischen Abweichungen der tatsächlichen Werte des resultierenden Merkmals – y i von den berechneten Werten – minimal ist.
Formal OLS-Test kann so geschrieben werden: .

Klassifizierung der Methode der kleinsten Quadrate

  1. Methode der kleinsten Quadrate.
  2. Maximum-Likelihood-Methode (für ein normales klassisches lineares Regressionsmodell wird Normalität der Regressionsresiduen postuliert).
  3. Bei der Autokorrelation von Fehlern und bei Heteroskedastizität wird die verallgemeinerte Methode der kleinsten Quadrate OLS verwendet.
  4. Gewichtete Methode der kleinsten Quadrate (ein Sonderfall von OLS mit heteroskedastischen Residuen).

Lassen Sie uns den Punkt veranschaulichen klassische Methode der kleinsten Quadrate grafisch. Dazu erstellen wir ein Streudiagramm basierend auf Beobachtungsdaten (x i, y i, i=1;n) in einem rechteckigen Koordinatensystem (ein solches Streudiagramm wird als Korrelationsfeld bezeichnet). Versuchen wir, eine Gerade auszuwählen, die den Punkten des Korrelationsfelds am nächsten liegt. Nach der Methode der kleinsten Quadrate wird die Gerade so gewählt, dass die Summe der Quadrate der vertikalen Abstände zwischen den Punkten des Korrelationsfeldes und dieser Geraden minimal ist.

Mathematische Notation für dieses Problem: .
Die Werte von y i und x i =1...n sind uns bekannt, es handelt sich um Beobachtungsdaten. In der S-Funktion stellen sie Konstanten dar. Die Variablen in dieser Funktion sind die erforderlichen Schätzungen der Parameter - , . Um das Minimum einer Funktion zweier Variablen zu finden, ist es notwendig, die partiellen Ableitungen dieser Funktion für jeden der Parameter zu berechnen und sie mit Null gleichzusetzen, d.h. .
Als Ergebnis erhalten wir ein System aus 2 normalen linearen Gleichungen:
Wenn wir dieses System lösen, finden wir die erforderlichen Parameterschätzungen:

Die Richtigkeit der Berechnung der Parameter der Regressionsgleichung kann durch Vergleich der Beträge überprüft werden (durch Rundung der Berechnungen kann es zu Abweichungen kommen).
Um Parameterschätzungen zu berechnen, können Sie Tabelle 1 erstellen.
Das Vorzeichen des Regressionskoeffizienten b gibt die Richtung der Beziehung an (wenn b > 0, ist die Beziehung direkt, wenn b<0, то связь обратная). Величина b показывает на сколько единиц изменится в среднем признак-результат -y при изменении признака-фактора - х на 1 единицу своего измерения.
Formal ist der Wert des Parameters a der Durchschnittswert von y, wobei x gleich Null ist. Wenn der Attributfaktor keinen Nullwert hat und haben kann, dann ist die obige Interpretation des Parameters a nicht sinnvoll.

Beurteilung der Nähe der Beziehung zwischen Merkmalen durchgeführt unter Verwendung des linearen Paarkorrelationskoeffizienten - r x,y. Es kann mit der Formel berechnet werden: . Darüber hinaus kann der lineare Paarkorrelationskoeffizient durch den Regressionskoeffizienten b bestimmt werden: .
Der Bereich akzeptabler Werte des linearen Paarkorrelationskoeffizienten liegt zwischen –1 und +1. Das Vorzeichen des Korrelationskoeffizienten gibt die Richtung der Beziehung an. Wenn r x, y >0, dann ist die Verbindung direkt; wenn r x, y<0, то связь обратная.
Liegt dieser Koeffizient betragsmäßig nahe bei eins, kann die Beziehung zwischen den Merkmalen als ziemlich eng linear interpretiert werden. Wenn sein Modul gleich eins ê r x , y ê =1 ist, dann ist die Beziehung zwischen den Merkmalen funktional linear. Wenn die Merkmale x und y linear unabhängig sind, liegt r x,y nahe bei 0.
Zur Berechnung von r x,y können Sie auch Tabelle 1 verwenden.

Um die Qualität der resultierenden Regressionsgleichung zu beurteilen, berechnen Sie das theoretische Bestimmtheitsmaß - R 2 yx:

,
wobei d 2 die Varianz von y ist, die durch die Regressionsgleichung erklärt wird;
e 2 – Restvarianz (nicht durch die Regressionsgleichung erklärt) von y;
s 2 y - Gesamtvarianz von y.
Das Bestimmtheitsmaß charakterisiert den Anteil der durch Regression erklärten Variation (Streuung) des resultierenden Attributs y (und damit des Faktors x) an der Gesamtvariation (Streuung) y. Das Bestimmtheitsmaß R 2 yx nimmt Werte von 0 bis 1 an. Dementsprechend charakterisiert der Wert 1-R 2 yx den Anteil der Varianz y, der durch den Einfluss anderer im Modell nicht berücksichtigter Faktoren und Spezifikationsfehler verursacht wird.
Bei gepaarter linearer Regression ist R 2 yx =r 2 yx.

Methode der kleinsten Quadrate (LSM)

Ein System von m linearen Gleichungen mit n Unbekannten hat die Form:

Drei Fälle sind möglich: m N. Der Fall m=n wurde in den vorherigen Absätzen betrachtet. Als m

Wenn m>n und das System konsistent ist, dann hat Matrix A mindestens m - n linear abhängige Zeilen. Hier kann die Lösung erhalten werden, indem man n beliebige linear unabhängige Gleichungen (falls vorhanden) auswählt und die Formel X = A -1 CV anwendet, also das Problem auf ein zuvor gelöstes Problem reduziert. In diesem Fall erfüllt die resultierende Lösung immer die verbleibenden m - n Gleichungen.

Wenn Sie jedoch einen Computer verwenden, ist es bequemer, einen allgemeineren Ansatz zu verwenden – die Methode der kleinsten Quadrate.

Algebraische Methode der kleinsten Quadrate

Die algebraische Methode der kleinsten Quadrate ist eine Methode zur Lösung linearer Gleichungssysteme

durch Minimierung der euklidischen Norm

Axt? B? >inf. (1.2)

Analyse experimenteller Daten

Betrachten wir ein Experiment, das zu bestimmten Zeitpunkten durchgeführt wird

Beispielsweise wird die Temperatur Q(t) gemessen. Lassen Sie die Messergebnisse durch ein Array spezifizieren

Nehmen wir an, dass die experimentellen Bedingungen so sind, dass Messungen mit einem bekannten Fehler durchgeführt werden. In diesen Fällen wird das Gesetz der Temperaturänderung Q(t) mithilfe eines bestimmten Polynoms gesucht

P(t) = + + + ... +,

Bestimmen der unbekannten Koeffizienten ... aus den Überlegungen, dass der Wert E(, ...,) durch die Gleichheit definiert ist

Gauß algebraische Exel-Näherung

nahm den Mindestwert an. Da die Summe der Quadrate minimiert wird, wird diese Methode als Approximation der kleinsten Quadrate für Daten bezeichnet.

Wenn wir P(t) durch seinen Ausdruck ersetzen, erhalten wir

Stellen wir uns die Aufgabe, ein Array so zu definieren, dass der Wert minimal ist, d.h. Definieren wir das Array mit der Methode der kleinsten Quadrate. Dazu setzen wir die partiellen Ableitungen mit Null gleich:

Wenn Sie die m × n-Matrix A = (), i = 1, 2..., m; j = 1, 2, ..., n, wobei

I = 1, 2..., m; j = 1, 2, ..., n,

dann wird die schriftliche Gleichheit die Form annehmen

Schreiben wir die geschriebene Gleichheit im Hinblick auf Operationen mit Matrizen um. Durch die Definition der Multiplikation einer Matrix mit einer Spalte haben wir

Für eine transponierte Matrix sieht eine ähnliche Beziehung wie folgt aus

Führen wir die Notation ein: Wir bezeichnen die i-te Komponente des Vektors Ax. Gemäß den geschriebenen Matrixgleichungen haben wir

In Matrixform kann diese Gleichheit umgeschrieben werden als

A T x=A T B (1.3)

Hier ist A eine rechteckige m×n-Matrix. Darüber hinaus gilt bei Datennäherungsproblemen in der Regel m > n. Gleichung (1.3) heißt Normalgleichung.

Mit der euklidischen Vektornorm war es von Anfang an möglich, das Problem in äquivalenter Matrixform zu schreiben:

Unser Ziel ist es, diese Funktion in x zu minimieren. Damit an einem Lösungspunkt ein Minimum erreicht wird, müssen die ersten Ableitungen nach x an diesem Punkt gleich Null sein. Die Ableitungen dieser Funktion sind

2A T B + 2A T Ax

und daher muss die Lösung das System linearer Gleichungen erfüllen

(A T A)x = (A T B).

Diese Gleichungen werden Normalgleichungen genannt. Wenn A eine m×n-Matrix ist, dann ist A>A – n×n eine Matrix, d.h. Die Matrix einer Normalgleichung ist immer eine quadratisch symmetrische Matrix. Darüber hinaus hat es die Eigenschaft positiver Definitheit in dem Sinne, dass (A>Ax, x) = (Ax, Ax) ? 0.

Kommentar. Manchmal wird die Lösung einer Gleichung der Form (1.3) als Lösung des Systems Ax = B bezeichnet, wobei A eine rechteckige m × n (m > n)-Matrix unter Verwendung der Methode der kleinsten Quadrate ist.

Das Problem der kleinsten Quadrate kann grafisch als Minimierung der vertikalen Abstände von Datenpunkten zu einer Modellkurve interpretiert werden (siehe Abbildung 1.1). Diese Idee basiert auf der Annahme, dass alle Fehler in der Näherung Fehlern in den Beobachtungen entsprechen. Wenn auch Fehler in den unabhängigen Variablen vorliegen, ist es möglicherweise sinnvoller, den euklidischen Abstand zwischen den Daten und dem Modell zu minimieren.

MNC in Excel

Der folgende Algorithmus zur Implementierung von OLS in Excel geht davon aus, dass alle Ausgangsdaten bereits bekannt sind. Wir multiplizieren beide Seiten der Matrixgleichung AЧX=B des Systems links mit der transponierten Matrix des Systems А Т:

A T AX = A T B

Dann multiplizieren wir beide Seiten der Gleichung links mit der Matrix (A T A) -1. Wenn diese Matrix existiert, ist das System definiert. Bedenkt, dass

(A T A) -1 *(A T A)=E, wir erhalten

X=(A T A) -1 A T B.

Die resultierende Matrixgleichung ist eine Lösung für ein System von m linearen Gleichungen mit n Unbekannten für m>n.

Betrachten wir die Anwendung des obigen Algorithmus anhand eines konkreten Beispiels.

Beispiel. Lassen Sie es notwendig sein, das System zu lösen

In Excel sieht das Lösungsblatt im Formelanzeigemodus für dieses Problem so aus:


Berechnungsergebnisse:

Der benötigte Vektor X liegt im Bereich E11:E12.

Bei der Lösung eines gegebenen linearen Gleichungssystems wurden die folgenden Funktionen verwendet:

1. MOBR – gibt die inverse Matrix für die im Array gespeicherte Matrix zurück.

Syntax: MOBR(Array).

Array ist ein numerisches Array mit einer gleichen Anzahl von Zeilen und Spalten.

2. MULTIPULT – gibt das Produkt von Matrizen zurück (Matrizen werden in Arrays gespeichert). Das Ergebnis ist ein Array mit der gleichen Anzahl an Zeilen wie Array1 und der gleichen Anzahl an Spalten wie Array2.

Syntax: MULTIPLE(array1, array2).

Array1, Array2 sind multiplizierbare Arrays.

Nachdem Sie eine Funktion in die obere linke Zelle eines Array-Bereichs eingegeben haben, wählen Sie das Array aus, beginnend mit der Zelle, die die Formel enthält, drücken Sie F2 und drücken Sie dann STRG+UMSCHALT+EINGABETASTE.

3. TRANSPORT – wandelt einen vertikalen Zellensatz in einen horizontalen um oder umgekehrt. Als Ergebnis der Verwendung dieser Funktion erscheint ein Array, dessen Anzahl an Zeilen der Anzahl an Spalten des ursprünglichen Arrays entspricht und dessen Anzahl an Spalten der Anzahl an Zeilen des ursprünglichen Arrays entspricht.

Was die breiteste Anwendung in verschiedenen Bereichen der Wissenschaft und der praktischen Tätigkeit findet. Das können Physik, Chemie, Biologie, Wirtschaftswissenschaften, Soziologie, Psychologie usw. sein. Durch den Willen des Schicksals muss ich mich oft mit der Wirtschaft auseinandersetzen, und deshalb werde ich heute für Sie eine Reise in ein erstaunliches Land namens arrangieren Ökonometrie=) ...Wie kann man es nicht wollen?! Es ist dort sehr gut – man muss sich nur entscheiden! ...Aber was Sie wahrscheinlich auf jeden Fall wollen, ist zu lernen, wie man Probleme löst Methode der kleinsten Quadrate. Und besonders fleißige Leser werden lernen, sie nicht nur präzise, ​​sondern auch SEHR SCHNELL zu lösen ;-) Aber zuerst allgemeine Darstellung des Problems+ begleitendes Beispiel:

Lassen Sie uns Indikatoren in einem bestimmten Themenbereich untersuchen, die einen quantitativen Ausdruck haben. Gleichzeitig gibt es allen Grund zu der Annahme, dass der Indikator vom Indikator abhängt. Diese Annahme kann entweder eine wissenschaftliche Hypothese sein oder auf dem gesunden Menschenverstand basieren. Lassen wir die Wissenschaft jedoch beiseite und erkunden appetitlichere Bereiche – nämlich Lebensmittelgeschäfte. Bezeichnen wir mit:

– Verkaufsfläche eines Lebensmittelgeschäfts, qm,
– Jahresumsatz eines Lebensmittelgeschäfts, Millionen Rubel.

Es ist völlig klar, dass der Umsatz in den meisten Fällen umso größer ist, je größer die Ladenfläche ist.

Nehmen wir an, dass uns nach der Durchführung von Beobachtungen/Experimenten/Berechnungen/Tänzen mit einem Tamburin numerische Daten zur Verfügung stehen:

Bei Lebensmittelgeschäften ist meiner Meinung nach alles klar: - das ist die Fläche des 1. Ladens, - sein Jahresumsatz, - die Fläche des 2. Ladens, - sein Jahresumsatz usw. Übrigens ist es überhaupt nicht notwendig, Zugang zu geheimen Materialien zu haben – eine ziemlich genaue Einschätzung des Handelsumsatzes kann dadurch erhalten werden mathematische Statistik. Aber lassen wir uns nicht ablenken, der Wirtschaftsspionagekurs ist bereits bezahlt =)

Tabellarische Daten können auch in Form von Punkten geschrieben und in der bekannten Form dargestellt werden Kartesisches System .

Beantworten wir eine wichtige Frage: Wie viele Punkte werden für eine qualitative Studie benötigt?

Je mehr desto besser. Der akzeptable Mindestsatz besteht aus 5-6 Punkten. Darüber hinaus können „anomale“ Ergebnisse nicht in die Stichprobe aufgenommen werden, wenn die Datenmenge gering ist. So kann beispielsweise ein kleiner Elite-Laden um Größenordnungen mehr verdienen als „seine Kollegen“, wodurch das allgemeine Muster, das Sie finden müssen, verzerrt wird!

Um es ganz einfach auszudrücken: Wir müssen eine Funktion auswählen, Zeitplan die so nah wie möglich an den Punkten vorbeiführt . Diese Funktion wird aufgerufen annähernd (Näherung - Näherung) oder theoretische Funktion . Im Allgemeinen taucht hier sofort ein offensichtlicher „Anwärter“ auf – ein Polynom höheren Grades, dessen Graph durch ALLE Punkte verläuft. Diese Option ist jedoch kompliziert und oft einfach falsch. (da die Grafik ständig eine „Schleife“ durchläuft und den Haupttrend schlecht widerspiegelt).

Die gesuchte Funktion muss also recht einfach sein und gleichzeitig die Abhängigkeit angemessen widerspiegeln. Wie Sie vielleicht erraten haben, heißt eine der Methoden zum Finden solcher Funktionen aufgerufen Methode der kleinsten Quadrate. Schauen wir uns zunächst das Wesentliche an Gesamtansicht. Lassen Sie einige Funktionen experimentelle Daten annähern:


Wie lässt sich die Genauigkeit dieser Näherung beurteilen? Berechnen wir auch die Unterschiede (Abweichungen) zwischen den experimentellen und funktionalen Werten (wir studieren die Zeichnung). Der erste Gedanke, der mir in den Sinn kommt, ist, abzuschätzen, wie groß die Summe ist, aber das Problem besteht darin, dass die Unterschiede negativ sein können (Zum Beispiel, ) und Abweichungen als Ergebnis einer solchen Summierung heben sich gegenseitig auf. Um die Genauigkeit der Näherung abzuschätzen, muss daher die Summe herangezogen werden Module Abweichungen:

oder zusammengebrochen: (Falls es jemand nicht weiß: – das ist das Summensymbol und – eine Hilfsvariable „Zähler“, die Werte von 1 bis annimmt).

Indem wir experimentelle Punkte mit unterschiedlichen Funktionen approximieren, erhalten wir unterschiedliche Werte, und offensichtlich ist diese Funktion genauer, wenn diese Summe kleiner ist.

Eine solche Methode existiert und wird aufgerufen Methode des kleinsten Moduls. In der Praxis hat es jedoch eine viel größere Verbreitung gefunden Methode der kleinsten Quadrate, bei dem mögliche negative Werte nicht durch den Modul, sondern durch Quadrieren der Abweichungen eliminiert werden:

Danach zielen die Bemühungen darauf ab, eine Funktion auszuwählen, die die Summe der quadrierten Abweichungen darstellt war so klein wie möglich. Daher stammt eigentlich auch der Name der Methode.

Und jetzt kehren wir zu etwas anderem zurück wichtiger Punkt: Wie oben erwähnt, sollte die ausgewählte Funktion recht einfach sein – es gibt aber auch viele solcher Funktionen: linear , hyperbolisch, exponentiell, logarithmisch, quadratisch usw. Und natürlich möchte ich hier gleich „das Tätigkeitsfeld reduzieren“. Welche Funktionsklasse sollte ich für die Forschung wählen? Eine primitive, aber effektive Technik:

– Der einfachste Weg ist die Darstellung von Punkten auf der Zeichnung und analysieren Sie ihre Position. Wenn sie dazu neigen, in einer geraden Linie zu verlaufen, dann sollten Sie danach suchen Gleichung einer Geraden mit optimalen Werten und . Mit anderen Worten besteht die Aufgabe darin, SOLCHE Koeffizienten zu finden, sodass die Summe der quadratischen Abweichungen am kleinsten ist.

Wenn die Punkte beispielsweise entlang liegen Hyperbel, dann ist offensichtlich klar, dass die lineare Funktion eine schlechte Näherung liefert. In diesem Fall suchen wir nach den „günstigsten“ Koeffizienten für die Hyperbelgleichung – diejenigen, die die minimale Quadratsumme ergeben .

Beachten Sie nun, dass wir in beiden Fällen darüber sprechen Funktionen zweier Variablen, deren Argumente sind gesuchte Abhängigkeitsparameter:

Und im Wesentlichen müssen wir ein Standardproblem lösen – finden Minimalfunktion zweier Variablen.

Erinnern wir uns an unser Beispiel: Nehmen wir an, dass „Laden“-Punkte in der Regel auf einer geraden Linie liegen, und es gibt allen Grund, dies anzunehmen lineare Abhängigkeit Umsatz aus Verkaufsflächen. Finden wir SOLCHE Koeffizienten „a“ und „be“, sodass die Summe der quadrierten Abweichungen entsteht war der Kleinste. Alles ist wie immer – zunächst einmal Partielle Ableitungen 1. Ordnung. Entsprechend Linearitätsregel Direkt unter dem Summensymbol können Sie unterscheiden:

Wenn Sie diese Informationen für einen Aufsatz oder eine Hausarbeit nutzen möchten, bin ich für den Link im Quellenverzeichnis sehr dankbar; solch detaillierte Berechnungen finden Sie an wenigen Stellen:

Lassen Sie uns ein Standardsystem erstellen:

Wir reduzieren jede Gleichung um „zwei“ und „brechen“ zusätzlich die Summen auf:

Notiz : Analysieren Sie unabhängig, warum „a“ und „be“ über das Summensymbol hinaus entfernt werden können. Formal lässt sich das übrigens mit der Summe machen

Schreiben wir das System in „angewandter“ Form um:

Danach beginnt sich der Algorithmus zur Lösung unseres Problems abzuzeichnen:

Kennen wir die Koordinaten der Punkte? Wir wissen. Beträge Können wir es finden? Leicht. Machen wir es am einfachsten System zweier linearer Gleichungen in zwei Unbekannten(„a“ und „sein“). Wir lösen das System zum Beispiel, Cramers Methode, wodurch wir einen stationären Punkt erhalten. Überprüfung ausreichende Bedingung für ein Extremum, können wir an dieser Stelle die Funktion überprüfen erreicht genau Minimum. Die Prüfung erfordert zusätzliche Berechnungen und wird daher nicht durchgeführt (Bei Bedarf kann der fehlende Rahmen eingesehen werden). Wir ziehen das abschließende Fazit:

Funktion der beste Weg (zumindest im Vergleich zu jeder anderen linearen Funktion) bringt experimentelle Punkte näher . Grob gesagt verläuft sein Graph so nah wie möglich an diesen Punkten. In Tradition Ökonometrie die resultierende Näherungsfunktion wird auch aufgerufen gepaarte lineare Regressionsgleichung .

Das betrachtete Problem ist von großer praktischer Bedeutung. In unserer Beispielsituation gilt Gl. ermöglicht es Ihnen, den Handelsumsatz vorherzusagen („Igrek“) Der Laden wird den einen oder anderen Wert der Verkaufsfläche haben (die eine oder andere Bedeutung von „x“). Ja, die resultierende Prognose wird nur eine Prognose sein, aber in vielen Fällen wird sie sich als recht genau erweisen.

Ich werde nur ein Problem mit „echten“ Zahlen analysieren, da es keine Schwierigkeiten bereitet – alle Berechnungen erfolgen auf dem Niveau des Lehrplans der 7. bis 8. Klasse. In 95 Prozent der Fälle werden Sie aufgefordert, nur eine lineare Funktion zu finden, aber ganz am Ende des Artikels werde ich zeigen, dass es nicht schwieriger ist, die Gleichungen der optimalen Hyperbel-, Exponential- und einiger anderer Funktionen zu finden.

Tatsächlich müssen nur noch die versprochenen Leckereien verteilt werden – damit Sie lernen, solche Beispiele nicht nur genau, sondern auch schnell zu lösen. Wir studieren den Standard sorgfältig:

Aufgabe

Als Ergebnis der Untersuchung der Beziehung zwischen zwei Indikatoren wurden die folgenden Zahlenpaare erhalten:

Finden Sie mithilfe der Methode der kleinsten Quadrate die lineare Funktion, die der empirischen Funktion am besten entspricht (erfahren) Daten. Erstellen Sie eine Zeichnung, auf der Sie experimentelle Punkte und einen Graphen der Näherungsfunktion in einem kartesischen rechtwinkligen Koordinatensystem konstruieren . Ermitteln Sie die Summe der quadratischen Abweichungen zwischen den empirischen und theoretischen Werten. Finden Sie heraus, ob die Funktion besser wäre (aus Sicht der Methode der kleinsten Quadrate) Bringen Sie experimentelle Punkte näher.

Bitte beachten Sie, dass die „x“-Bedeutungen natürlich sind und eine charakteristische Bedeutung haben, auf die ich etwas später eingehen werde; aber sie können natürlich auch gebrochen sein. Darüber hinaus können je nach Inhalt einer bestimmten Aufgabe sowohl die Werte „X“ als auch „Spiel“ ganz oder teilweise negativ sein. Nun, uns wurde eine „gesichtslose“ Aufgabe gegeben, und wir beginnen damit Lösung:

Wir finden die Koeffizienten der optimalen Funktion als Lösung des Systems:

Zwecks kompakterer Aufzeichnung kann die Variable „Zähler“ weggelassen werden, da bereits klar ist, dass die Summierung von 1 bis erfolgt.

Bequemer ist es, die benötigten Beträge tabellarisch zu berechnen:


Berechnungen können mit einem Mikrorechner durchgeführt werden, viel besser ist jedoch die Verwendung von Excel – sowohl schneller als auch fehlerfrei; Sehen Sie sich ein kurzes Video an:

Somit erhalten wir Folgendes System:

Hier können Sie die zweite Gleichung mit 3 multiplizieren und Subtrahieren Sie Term für Term den 2. von der 1. Gleichung. Aber das ist Glück – in der Praxis sind Systeme oft kein Geschenk, und in solchen Fällen spart es Cramers Methode:
, was bedeutet, dass das System über eine einzigartige Lösung verfügt.

Lass uns das Prüfen. Ich verstehe, dass Sie das nicht möchten, aber warum sollten Sie Fehler überspringen, wenn sie absolut nicht übersehen werden können? Setzen wir die gefundene Lösung in die linke Seite jeder Gleichung des Systems ein:

Man erhält die rechten Seiten der entsprechenden Gleichungen, was bedeutet, dass das System korrekt gelöst ist.

Somit ist die gewünschte Näherungsfunktion: – von alle linearen Funktionen Sie ist es, die die experimentellen Daten am besten annähert.

Im Gegensatz zu gerade Abhängigkeit des Umsatzes des Ladens von seiner Fläche, die gefundene Abhängigkeit ist umkehren (Prinzip „Je mehr, desto weniger“), und diese Tatsache wird durch das Negativ sofort offenbart Neigung. Funktion sagt uns, dass mit einer Erhöhung eines bestimmten Indikators um 1 Einheit der Wert des abhängigen Indikators abnimmt im mittleren um 0,65 Einheiten. Man sagt: Je höher der Buchweizenpreis, desto weniger wird er verkauft.

Um den Graphen der Näherungsfunktion darzustellen, ermitteln wir ihre beiden Werte:

und führen Sie die Zeichnung aus:


Die konstruierte Gerade heißt Trendlinie (nämlich eine lineare Trendlinie, d. h. im Allgemeinen ist ein Trend nicht unbedingt eine gerade Linie). Jeder kennt den Ausdruck „im Trend sein“, und ich denke, dieser Begriff bedarf keiner weiteren Kommentare.

Berechnen wir die Summe der quadratischen Abweichungen zwischen empirischen und theoretischen Werten. Geometrisch gesehen ist dies die Summe der Quadrate der Längen der „Himbeer“-Segmente (zwei davon sind so klein, dass sie nicht einmal sichtbar sind).

Fassen wir die Berechnungen in einer Tabelle zusammen:


Auch hier können sie manuell durchgeführt werden; für den Fall der Fälle gebe ich ein Beispiel für den ersten Punkt:

aber es ist viel effektiver, es auf die bereits bekannte Weise zu tun:

Wir wiederholen noch einmal: Welche Bedeutung hat das erhaltene Ergebnis? Aus alle linearen Funktionen y-Funktion Der Indikator ist der kleinste, d. h. in seiner Familie ist er die beste Näherung. Und hier ist übrigens die letzte Frage des Problems nicht zufällig: Was wäre, wenn die vorgeschlagene Exponentialfunktion wäre? Wäre es besser, die experimentellen Punkte näher zusammenzubringen?

Finden wir die entsprechende Summe der quadratischen Abweichungen – zur Unterscheidung bezeichne ich sie mit dem Buchstaben „Epsilon“. Die Technik ist genau die gleiche:


Und zur Sicherheit noch einmal die Berechnungen zum 1. Punkt:

In Excel verwenden wir die Standardfunktion EXP (Syntax finden Sie in der Excel-Hilfe).

Abschluss: , was bedeutet, dass die Exponentialfunktion die experimentellen Punkte schlechter annähert als eine Gerade .

Aber hier ist zu beachten, dass es „schlimmer“ ist bedeutet noch nicht, Was ist falsch. Jetzt habe ich einen Graphen dieser Exponentialfunktion erstellt – und er verläuft auch in der Nähe der Punkte - so sehr, dass es ohne analytische Forschung schwierig ist zu sagen, welche Funktion genauer ist.

Damit ist die Lösung abgeschlossen und ich kehre zur Frage nach den natürlichen Werten des Arguments zurück. In verschiedenen Studien, meist wirtschaftlicher oder soziologischer Art, werden natürliche „X“ zur Nummerierung von Monaten, Jahren oder anderen gleichen Zeitintervallen verwendet. Betrachten Sie zum Beispiel das folgende Problem.

Nun, bei der Arbeit haben wir uns bei der Inspektion gemeldet, der Artikel wurde zu Hause für die Konferenz geschrieben – jetzt können wir auf dem Blog schreiben. Während ich meine Daten verarbeitete, wurde mir klar, dass ich nicht anders konnte, als über ein sehr cooles und notwendiges Add-In in Excel namens zu schreiben. Deshalb wird der Artikel diesem speziellen Add-on gewidmet sein und ich werde Ihnen anhand eines Anwendungsbeispiels davon erzählen Methode der kleinsten Quadrate(LSM) zur Suche nach unbekannten Gleichungskoeffizienten bei der Beschreibung experimenteller Daten.

So aktivieren Sie das Add-on „Lösung suchen“.

Lassen Sie uns zunächst herausfinden, wie Sie dieses Add-on aktivieren.

1. Gehen Sie zum Menü „Datei“ und wählen Sie „Excel-Optionen“

2. Wählen Sie im angezeigten Fenster „Nach einer Lösung suchen“ und klicken Sie auf „Los“.

3. Aktivieren Sie im nächsten Fenster das Kontrollkästchen neben „Nach einer Lösung suchen“ und klicken Sie auf „OK“.

4. Das Add-In ist aktiviert – nun ist es im Menüpunkt „Daten“ zu finden.

Methode der kleinsten Quadrate

Jetzt kurz darüber Methode der kleinsten Quadrate (LSM) und wo es verwendet werden kann.

Nehmen wir an, wir haben einen Datensatz, nachdem wir ein Experiment durchgeführt haben, bei dem wir den Einfluss des Werts X auf den Wert Y untersucht haben.

Wir wollen diesen Einfluss mathematisch beschreiben, damit wir dann diese Formel verwenden können und wissen, dass wir, wenn wir den Wert von X um so viel ändern, den Wert von Y so und so erhalten ...

Ich nehme ein supereinfaches Beispiel (siehe Abbildung).

Es versteht sich von selbst, dass die Punkte hintereinander wie auf einer geraden Linie liegen, und daher gehen wir sicher davon aus, dass unsere Abhängigkeit durch eine lineare Funktion y=kx+b beschrieben wird. Gleichzeitig sind wir absolut sicher, dass, wenn X gleich Null ist, auch der Wert von Y gleich Null ist. Das bedeutet, dass die Funktion, die die Abhängigkeit beschreibt, noch einfacher wird: y=kx (denken Sie an den Lehrplan).

Im Allgemeinen müssen wir den Koeffizienten k finden. Das ist es, was wir damit machen werden MNC mit dem Add-on „Lösungssuche“.

Die Methode besteht darin, dass (hier - Achtung: Sie müssen darüber nachdenken) die Summe der Quadrate der Differenzen zwischen den experimentell erhaltenen und den entsprechenden berechneten Werten minimal ist. Wenn also 2=0,36 . Das Gleiche gilt auch für Folgendes: Wenn X2=2, der tatsächlich gemessene Wert von Y2=8,1 und das berechnete y2 8 ist, beträgt das Quadrat der Differenz (y2-Y2)^2=(8-8,1)^2 =0,01. Und die Summe aller dieser Quadrate sollte möglichst klein sein.

Beginnen wir also mit dem Training zur Verwendung von LSM und Excel-Add-Ins „Lösung suchen“ .

Anwenden des Add-Ins, um eine Lösung zu finden

1. Wenn Sie das Add-on „Lösung suchen“ nicht aktiviert haben, kehren Sie zum Punkt zurück So aktivieren und aktivieren Sie das Add-on „Lösung suchen“. 🙂

2. Geben Sie in Zelle A1 den Wert „1“ ein. Diese Einheit ist die erste Näherung an den realen Wert des Koeffizienten (k) unserer funktionalen Beziehung y=kx.

3. In Spalte B haben wir die Werte des Parameters X, in Spalte C haben wir die Werte des Parameters Y. In die Zellen von Spalte D geben wir die Formel ein: „Koeffizient k multipliziert mit dem Wert X.“ ” Beispielsweise geben wir in Zelle D1 „=A1*B1“ ein, in Zelle D2 „=A1*B2“ usw.

4. Wir glauben, dass der Koeffizient k gleich eins ist und die Funktion f (x)=y=1*x die erste Näherung für unsere Lösung ist. Wir können die Summe der quadrierten Differenzen zwischen den gemessenen Werten von Y und denen berechnen, die mit der Formel y=1*x berechnet wurden. Wir können dies alles manuell tun, indem wir die entsprechenden Zellbezüge in die Formel eingeben: „=(D2-C2)^2+(D3-C3)^2+(D4-C4)^2... usw. Am Ende haben wir Machen Sie einen Fehler und stellen Sie fest, dass wir viel Zeit verschwendet haben. In Excel gibt es zur Berechnung der Summe der quadrierten Differenzen eine spezielle Formel, „SUMQUARRENT“, die alles für uns erledigt. Geben Sie sie in Zelle A2 ein und legen Sie fest Ausgangsdaten: der Bereich der gemessenen Y-Werte (Spalte C) und der Bereich der berechneten Y-Werte (Spalte D).

4. Die Summe der Quadratdifferenzen wurde berechnet – gehen Sie nun zur Registerkarte „Daten“ und wählen Sie „Nach einer Lösung suchen“.

5. Wählen Sie im angezeigten Menü Zelle A1 (die mit dem Koeffizienten k) als zu ändernde Zelle aus.

6. Wählen Sie Zelle A2 als Ziel und stellen Sie die Bedingung „auf den Mindestwert setzen“ ein. Wir erinnern uns, dass dies die Zelle ist, in der wir die Summe der Quadrate der Differenzen zwischen den berechneten und den gemessenen Werten berechnen, und diese Summe sollte minimal sein. Klicken Sie auf „Ausführen“.

7. Der Koeffizient k wurde ausgewählt. Jetzt können Sie überprüfen, ob die berechneten Werte nun sehr nahe an den gemessenen liegen.

P.S.

Im Allgemeinen gibt es natürlich zur Approximation experimenteller Daten in Excel spezielle Tools, mit denen Sie Daten mit linearen, exponentiellen, Potenz- und Polynomfunktionen beschreiben können, sodass Sie oft darauf verzichten können „Lösungssuche“-Add-ons. Ich habe in meinem Fall über all diese Näherungsmethoden gesprochen. Wenn Sie also interessiert sind, schauen Sie sich das an. Aber wenn es um eine exotische Funktion geht mit einem unbekannten Koeffizienten oder Optimierungsprobleme, dann hier Überbau Es könnte zu keinem besseren Zeitpunkt kommen.

Add-on zur Lösungssuche kann für andere Aufgaben verwendet werden, die Hauptsache ist, das Wesentliche zu verstehen: Es gibt eine Zelle, in der wir einen Wert auswählen, und es gibt eine Zielzelle, in der die Bedingung für die Auswahl eines unbekannten Parameters angegeben wird.
Das ist alles! Im nächsten Artikel erzähle ich Ihnen ein Märchen über einen Urlaub. Um die Veröffentlichung des Artikels nicht zu verpassen,



Hat Ihnen der Artikel gefallen? Teile mit deinen Freunden!
War dieser Artikel hilfreich?
Ja
Nein
Vielen Dank für Ihr Feedback!
Es ist ein Fehler aufgetreten und Ihre Stimme wurde nicht gezählt.
Danke. Ihre Nachricht wurde gesendet
Haben Sie einen Fehler im Text gefunden?
Wählen Sie es aus und klicken Sie Strg + Eingabetaste und wir werden alles reparieren!