Cum se calculează suma de pătrate pentru eroare (sse)

Suma erorilor pătrate sau a SSE este un calcul statistic preliminar care duce la alte valori ale datelor. Când aveți un set de valori ale datelor, este util să găsiți cât de strâns legați aceste valori sunt. Trebuie să vă organizați datele organizate într-o masă și apoi să efectuați câteva calcule destul de simple. Odată ce găsiți SSE pentru un set de date, puteți continua să găsiți varianța și deviația standard.

Pași

Metoda 1 din 3:
Calculul SSE cu mâna
  1. Imagine intitulată Calculați suma pătratelor pentru eroare (SSE) Pasul 1
1. Creați o masă cu trei coloane. Cea mai clară modalitate de calculare a sumei erorilor pătrate este începe cu o masă cu trei coloane. Etichetați cele trei coloane ca Valoare{ displaystyle { Text {valoare}}}}{ Text {valoare}}, Deviere{ DisplayStyle { Text {deviation}}}{ text {deviation}}, și Deviere2{ DisplayStyle { Text {deviation}} ^ {2}}{ text {deviation}} ^ {2}.
  • Imagine intitulată Calculați suma pătratelor pentru eroare (SSE) Pasul 2
    2. Completați datele. Prima coloană va conține valorile măsurătorilor dvs. Completați-l Valoare{ displaystyle { Text {valoare}}}}{ Text {valoare}} Coloana cu valorile măsurătorilor dvs. Acestea pot fi rezultatele unui anumit experiment, un studiu statistic sau doar date furnizate pentru o problemă de matematică.
  • În acest caz, să presupunem că lucrați cu unele date medicale și aveți o listă a temperaturilor corpului de zece pacienți. Temperatura normală a corpului așteptată este de 98.6 grade. Temperaturile de zece pacienți sunt măsurate și dau valorile 99.0, 98.6, 98.5, 101.1, 98.3, 98.6, 97.9, 98.4, 99.2 și 99.1. Scrieți aceste valori în prima coloană.
  • Imagine intitulată Calculați suma pătratelor pentru eroare (SSE) Pasul 3
    3. Calculați media. Înainte de a putea calcula eroarea pentru fiecare măsurătoare, trebuie să calculați media setului de date complet.
  • Amintiți-vă că media oricăror set de date este suma valorilor, împărțită la numărul de valori din set. Acest lucru poate fi reprezentat simbolic, cu variabila μ{ displaystyle mu} mu reprezentând media, ca:
  • μ=ΣXn{ displaystyle mu = { frac { sigma x} {n}}}} MU = { frac { sigma x} {n}}
  • Pentru aceste date, media se calculează ca:
  • μ=99.0+98.6+98.5+101.1+98.3+98.6+97.9+98.4+99.2+99.110{ displaystyle mu = { frac {99.0 + 98.6 + 98.5 + 101.1 + 98.3 + 98.6 + 97.9 + 98.4 + 99.2 + 99.1} {10}}}}{99.0 + 98.9 + 98.6 + 97.9 + 98.4 + 99.2 + 99.1}}}}} {10}}
  • μ=988.710{ displaystyle mu = { frac {988.7} {10}}} u = { frac {988.7} {10}}
  • μ=98.87{ displaystyle mu = 98.87} mu = 98,87
  • Imagine intitulată Calculați suma pătratelor pentru eroare (SSE) Pasul 4
    4. Calculați măsurătorile individuale de eroare. În cea de-a doua coloană a mesei dvs., trebuie să completați măsurătorile de eroare pentru fiecare valoare a datelor. Eroarea este diferența dintre măsurarea și media.
  • Pentru setul de date dat, scade media, 98.87, din fiecare valoare măsurată și completați cea de-a doua coloană cu rezultatele. Aceste zece calcule sunt după cum urmează:
  • 99.0-98.87=0.13{ displaystyle 99.0-98.87 = 0.13}99.0-98.87 = 0,13
  • 98.6-98.87=-0.27{ displaystyle 98.6-98.87 = -0.27}98.6-98.87 = -0,27
  • 98.5-98.87=-0.37{ displaystyle 98.5-98.87 = -0.37}98.5-98.87 = -0,37
  • 101.1-98.87=2.23{ displaystyle 101.1-98.87 = 2.23}101.1-98.87 = 2.23
  • 98.3-98.87=-0.57{ displaystyle 98.3-98.87 = -0.57}98.3-98.87 = -0,57
  • 98.6-98.87=-0.27{ displaystyle 98.6-98.87 = -0.27}98.6-98.87 = -0,27
  • 97.9-98.87=-0.97{ displaystyle 97.9-98.87 = -0.97}97.9-98.87 = -0,97
  • 98.4-98.87=-0.47{ displaystyle 98.4-98.87 = -0.47}98.4-98.87 = -0,47
  • 99.2-98.87=0.33{ displaystyle 99.2-98.87 = 0.33}99.2-98.87 = 0,33
  • 99.1-98.87=0.23{ displaystyle 99.1-98.87 = 0.23}99.1-98.87 = 0,23
  • Imagine intitulată Calculați suma pătratelor pentru eroare (SSE) Pasul 5
    5. Calculați pătratele erorilor. În cea de-a treia coloană a mesei, găsiți pătratul fiecărei valori rezultate din coloana de mijloc. Acestea reprezintă pătratele abaterii de la media pentru fiecare valoare măsurată a datelor.
  • Pentru fiecare valoare din coloana de mijloc, utilizați calculatorul dvs. și găsiți pătratul. Înregistrați rezultatele în coloana a treia, după cum urmează:
  • 0.132=0.0169{ displaystyle 0.13 ^ {2} = 0.0169}0.13 ^ {2} = 0.0169
  • (-0.27)2=0.0729{ displaystyle (-0.27) ^ {2} = 0.0729}(-0.27) ^ {2} = 0,0729
  • (-0.37)2=0.1369{ displaystyle (-0.37) ^ {2} = 0.1369}(-0.37) ^ {2} = 0,1369
  • 2.232=4.9729{ displaystyle 2.23 ^ {2} = 4.9729}2.23 ^ {2} = 4.9729
  • (-0.57)2=0.3249{ displaystyle (-0.57) ^ {2} = 0.3249}(-0.57) ^ {2} = 0,3249
  • (-0.27)2=0.0729{ displaystyle (-0.27) ^ {2} = 0.0729}(-0.27) ^ {2} = 0,0729
  • (-0.97)2=0.9409{ displaystyle (-0.97) ^ {2} = 0.9409}(-0.97) ^ {2} = 0.9409
  • (-0.47)2=0.2209{ displaystyle (-0.47) ^ {2} = 0.2209}(-0.47) ^ {2} = 0.2209
  • 0.332=0.1089{ displaystyle 0.33 ^ {2} = 0.1089}0.33 ^ {2} = 0,1089
  • 0.232=0.0529{ displaystyle 0.23 ^ {2} = 0.0529}0.23 ^ {2} = 0.0529
  • Imaginea intitulată Calculați suma pătratelor pentru eroare (SSE) Pasul 6
    6. Adăugați împreună pătratele de erori. Pasul final este de a găsi suma valorilor din coloana a treia. Rezultatul dorit este SSE sau suma erorilor pătrate.
  • Pentru acest set de date, SSE se calculează prin adăugarea celor zece valori din coloana a treia:
  • SSE=6.921{ displaystyle sse = 6.921}SSE = 6.921
  • Metoda 2 din 3:
    Crearea unei foi de calcul Excel pentru a calcula SSE
    1. Imagine intitulată Calculați suma pătratelor pentru eroare (SSE) Pasul 7
    1. Etichetați coloanele de foaie de calcul. Veți crea o masă cu trei coloane în Excel, cu aceleași trei titluri ca mai sus.
    • În celula A1, introduceți valoarea "Valoarea"."
    • În celula B1, introduceți capul "deviația."
    • În celula C1, intrați la rubrica "Deviația pătrată."
  • Imagine intitulată Calculați suma pătratelor pentru eroare (SSE) Pasul 8
    2. Introdu-ti datele. În prima coloană, trebuie să introduceți valorile măsurătorilor dvs. Dacă setul este mic, puteți să le introduceți manual. Dacă aveți un set de date mare, este posibil să fie necesar să copiați și să lipiți datele în coloană.
  • Imaginea intitulată Calculați suma pătratelor pentru eroare (SSE) Pasul 9
    3. Găsiți media punctelor de date. Excel are o funcție care va calcula media pentru dvs. În unele celule vacante sub tabelul dvs. de date (într-adevăr nu contează ce celule alegeți), introduceți următoarele:
  • = Medie (A2: ___)
  • Nu introduceți de fapt un spațiu gol. Completați acel martor cu numele celular al ultimului dvs. punct de date. De exemplu, dacă aveți 100 de puncte de date, veți utiliza funcția:
  • = Media (A2: A101)
  • Această funcție include date de la A2 până la A101, deoarece rândul de sus conține titlurile coloanelor.
  • Când apăsați pe Enter sau când faceți clic pe orice altă celulă de pe masă, media valorilor datelor dvs. va umple automat celula pe care tocmai ați programat-o.
  • Imaginea intitulată Calculați suma pătratelor pentru eroare (SSE) Pasul 10
    4. Introduceți funcția pentru măsurătorile de eroare. În prima celulă goală din coloana "Deviation", trebuie să introduceți o funcție pentru a calcula diferența dintre fiecare punct de date și media. Pentru a face acest lucru, trebuie să utilizați numele celulei în care media locuiește. Să presupunem acum că ați folosit celula A104.
  • Funcția pentru calcularea erorilor, pe care o introduceți în celula B2, va fi:
  • = A2- $ A $ 104.Semnele de dolar sunt necesare pentru a vă asigura că blocați în celula A104 pentru fiecare calcul.
  • Imaginea intitulată Calculați suma pătratelor pentru eroare (SSE) Pasul 11
    5. Introduceți funcția pentru pătratele de eroare. În cea de-a treia coloană, puteți direcționa Excel pentru a calcula pătratul de care aveți nevoie.
  • În celula C2, introduceți funcția
  • = B2 ^ 2
  • Imagine intitulată Calculați suma pătratelor pentru eroare (SSE) Pasul 12
    6. Copiați funcțiile pentru a umple întreaga masă. După ce ați introdus funcțiile din celula superioară a fiecărei coloane, respectiv B2 și C2, trebuie să completați tabelul complet. Ați putea reintroduce funcția în fiecare linie a mesei, dar acest lucru ar dura mult prea mult. Utilizați mouse-ul, evidențiați celulele B2 și C2 împreună și fără a lăsa să mergeți la butonul mouse-ului, trageți până la celula de jos a fiecărei coloane.
  • Dacă presupunem că aveți 100 de puncte de date în tabelul dvs., veți trage mouse-ul până la celulele B101 și C101.
  • Când eliberați apoi butonul mouse-ului, formulele vor fi copiate în toate celulele tabelului. Tabelul trebuie populat automat cu valorile calculate.
  • Imagine intitulată Calculați suma pătratelor pentru eroare (SSE) Pasul 13
    7. Găsiți SSE. Coloana C din tabelul dvs. conține toate valorile de eroare pătrate. Pasul final este de a avea Excel Calculați suma acestor valori.
  • Într-o celulă sub masă, probabil C102 pentru acest exemplu, introduceți funcția:
  • = Suma (C2: C101)
  • Când faceți clic pe Enter sau faceți clic pe orice altă celulă a tabelului, trebuie să aveți valoarea SSE pentru datele dvs.
  • Metoda 3 din 3:
    Referitoare la SSE la alte date statistice
    1. Imagine intitulată Calculați suma pătratelor pentru eroare (SSE) Pasul 14
    1. Calculați variația de la SSE. Găsirea SSE pentru un set de date este, în general, un bloc de construcție pentru găsirea altor valori, valori mai utile. Primul dintre acestea este variația. Varianța este o măsurătoare care indică cât de mult datele măsurate variază de la media. Este de fapt media diferențelor pătrate din mijloc.
    • Deoarece SSE este suma erorilor pătrate, puteți găsi media (care este variația), doar prin împărțirea numărului de valori. Cu toate acestea, dacă calculați varianța unui set de eșantioane, mai degrabă decât o populație completă, vă veți împărți prin (n-1) în loc de n. Prin urmare:
    • Varianța = sse / n, dacă calculați varianța unei populații complete.
    • Varianța = sse / (n-1), dacă calculați varianța unui set de date de probă.
  • Pentru problema eșantionului temperaturilor pacienților, putem presupune că 10 pacienți reprezintă doar un set de eșantioane. Prin urmare, variația ar fi calculată ca:
  • Varianța=SSE(n-1){ DisplayStyle { Text {varianta}} = { frac {{{sse}} {(n-1)}}}{ text {varianta}} = { frac {{ text {sse}}} {(n-1)}}
  • Varianța=6.9219{ displaystyle { text {varianta}} = { frac {6.921} {9}}}{ text {varianta}} = { frac {6.921} {9}}
  • Varianța=0.769{ AfișăriStyle { Text {varianță}} = 0.769}{ text {varianta}} = 0.769
  • Imagine intitulată Calculați suma pătratelor pentru eroare (SSE) Pasul 15
    2. Calculați abaterea standard de la SSE. Abaterea standard este o valoare utilizată în mod obișnuit care indică cât de mult se abate valorile oricărui set de date. Deviația standard este rădăcina pătrată a varianței. Amintiți-vă că variația este media măsurătorilor de eroare pătrată.
  • Prin urmare, după ce ați calculat SSE, puteți găsi abaterea standard după cum urmează:
  • Deviație standard=SSEn-1{ Displaystyle { text {Abaterea standard}} = { sqrt { frac { text {} SSE} {n-1}}}}{ Text {Abaterea standard}} = { sqrt {{ frac {{ text {}}} SSE {n-1}}}}
  • Pentru proba de date a măsurătorilor de temperatură, puteți găsi abaterea standard, după cum urmează:
  • Deviație standard=SSEn-1{ Displaystyle { text {Abaterea standard}} = { sqrt { frac { text {} SSE} {n-1}}}}{ Text {Abaterea standard}} = { sqrt {{ frac {{ text {}}} SSE {n-1}}}}
  • Deviație standard=6.9219{ DisplayStyle { Text {deviația standard}} = { sqrt { frac { text {6.921}} {9}}}}{ Text {deviația standard}} = { sqrt {{ frac {{{{}}} {9}}} {9}}}}
  • Deviație standard=.769{ DisplayStyle { Text {deviația standard}} = { sqrt {.769}}}{ text {deviația standard}} = { sqrt {.769}}
  • Deviație standard=0.877{ displayStyle { text {deviația standard}} = 0.877}{ Text {Deviația standard}} = 0,877
  • Image cu denumirea Calculați suma pătratelor pentru eroare (SSE) Etapa 16
    3. Utilizați SSE pentru a măsura covarianță. Acest articol sa concentrat pe seturi de date care măsoară doar o singură valoare la un moment dat. Cu toate acestea, în multe studii, este posibil să comparați două valori separate. Ați dori să știți cum se raportează cele două valori, nu numai la media setului de date. Această valoare este covarianță.
  • Calculele pentru covariance sunt prea implicate în detalii aici, altele decât pentru a observa că veți folosi SSE pentru fiecare tip de date și apoi veți compara acest lucru. Pentru o descriere mai detaliată a covarianței și a calculelor implicate, a se vedea Calculați covarianța.
  • Ca un exemplu de utilizare a covarianță, ați putea dori să compare de vârsta pacienților într-un studiu medical la eficacitatea unui medicament în scăderea temperaturilor febră. Apoi, veți avea un set de date de vârstă și un al doilea set de date de temperaturi. Ați găsi SSE pentru fiecare set de date și apoi de la găsirea varianței, deviațiile standard și covarianță.
  • sfaturi

    Partajați pe rețeaua socială:
    Similar