Què és la suma dels quadrats?
La suma de quadrats és una tècnica estadística utilitzada en l'anàlisi de regressió per determinar la dispersió de punts de dades. En una anàlisi de regressió, l’objectiu és determinar el bé que es pot adaptar una sèrie de dades a una funció que pot ajudar a explicar com es va generar la sèrie de dades. La suma de quadrats s’utilitza com a forma matemàtica per trobar la funció que s’adapta millor (varia menys) a partir de les dades.
La fórmula per a la suma dels quadrats és
Per a un conjunt X de n ítems: suma de quadrats = i = 0∑n (Xi −X) 2where: Xi = El ith ítem del conjuntX = La mitjana de tots els ítems del conjunt (Xi −X) = La desviació de cada element de la mitjana
La suma dels quadrats també es coneix com a variació.
Què et diu la suma dels quadrats?
La suma dels quadrats és una mesura de la desviació de la mitjana. En estadístiques, la mitjana és la mitjana d’un conjunt de nombres i és la mesura més utilitzada de tendència central. La mitjana aritmètica es calcula simplement sumant els valors del conjunt de dades i dividint pel nombre de valors.
Diguem que els preus de tancament de Microsoft (MSFT) en els darrers cinc dies van ser de 74, 01, 74, 77, 73, 94, 73, 61 i 73, 40 en dòlars americans. La suma dels preus totals és de 369, 73 dòlars i el preu mitjà o mitjà del llibre de text seria, per tant, 369, 73 USD / 5 = 73, 95 dòlars.
Però no sempre és suficient conèixer la mitjana d’un conjunt de mesuraments. De vegades, és útil saber quanta variació hi ha en un conjunt de mesures. A quina distància es diferencien els valors individuals de la mitjana pot donar una mica de coneixement de la forma en què s’adeqüen les observacions o els valors al model de regressió que es crea.
Per exemple, si un analista volia saber si el preu de les accions de MSFT es mou en conjunt amb el preu d’Apple (AAPL), pot enumerar el conjunt d’observacions del procés d’ambdues accions durant un període determinat, per exemple, 1, 2., o 10 anys, i creeu un model lineal amb cadascuna de les observacions o mesures registrades. Si la relació entre ambdues variables (és a dir, el preu d’AAPL i el preu de MSFT) no és una línia recta, hi ha variacions en el conjunt de dades que cal examinar.
Segons les estadístiques, si la línia del model lineal creat no passa per tots els mesuraments de valor, no s’explica part de la variabilitat que s’ha observat en els preus de les accions. La suma de quadrats s'utilitza per calcular si existeix una relació lineal entre dues variables, i qualsevol variació no explicada es coneix com la suma residual de quadrats.
La suma dels quadrats és la suma del quadrat de variació, on la definició de la variació és la distribució entre cada valor individual i la mitjana. Per determinar la suma dels quadrats, es quadra la distància entre cada punt de dades i la línia de millor adaptació i es resumeix a continuació. La línia de millor ajustat minimitzarà aquest valor.
Com calcular la suma dels quadrats
Ara podeu veure per què la mesura s’anomena suma de desviacions quadrades o la suma de quadrats per escurçar. Utilitzant el nostre exemple MSFT anterior, la suma de quadrats es pot calcular com:
- SS = (74, 01 - 73, 95) 2 + (74, 77 - 73, 95) 2 + (73, 94 - 73, 95) 2 + (73, 61 - 73, 95) 2 + (73, 40 - 73, 95) 2 SS = (0, 06) 2 + (0, 82) 2 + (- 0, 01) 2 + (-0, 34) 2 + (-0, 55) 2 SS = 1, 0942
Si s’afegeix la suma de les desviacions soles sense quadrar, es produirà un nombre igual o proper a zero, ja que les desviacions negatives compensaran gairebé perfectament les desviacions positives. Per obtenir un nombre més realista, cal calcular la suma de les desviacions. La suma dels quadrats sempre serà un nombre positiu perquè el quadrat de qualsevol nombre, sigui positiu o negatiu, sempre és positiu.
Exemple de com utilitzar la suma de quadrats
A partir dels resultats del càlcul MSFT, una quantitat elevada de quadrats indica que la majoria dels valors estan més lluny de la mitjana i, per tant, hi ha una gran variabilitat en les dades. Una suma baixa de quadrats fa referència a una baixa variabilitat en el conjunt d’observacions.
A l’exemple anterior, 1.0942 mostra que la variabilitat del preu de les accions de MSFT dels últims cinc dies és molt baixa i els inversors que busquen invertir en accions caracteritzades per l’estabilitat de preus i la baixa volatilitat poden optar per MSFT.
Punts clau
- La suma de quadrats mesura la desviació de punts de dades respecte al valor mitjà. Un resultat de suma de quadrats més gran indica un gran grau de variabilitat dins del conjunt de dades, mentre que un resultat inferior indica que les dades varien considerablement del valor mitjà..
Limitacions de l'ús de la suma dels quadrats
Per prendre una decisió d’inversió sobre quines accions es necessiten moltes més observacions que les que s’enumeren aquí. Pot ser que un analista hagi de treballar amb anys de dades per saber amb més seguretat la variabilitat d’un actiu alta o baixa. A mesura que s’afegeixen més punts de dades al conjunt, la suma de quadrats es fa més gran a mesura que els valors s’escamparan.
Les mesures de variació més utilitzades són la desviació estàndard i la variància. Tanmateix, per calcular qualsevol de les dues mètriques, primer cal calcular la suma dels quadrats. La variància és la mitjana de la suma dels quadrats (és a dir, la suma dels quadrats dividida pel nombre d’observacions). La desviació estàndard és l’arrel quadrada de la variància.
Hi ha dos mètodes d’anàlisi de regressió que utilitzen la suma de quadrats: el mètode lineal de mínims quadrats i el mètode de mínims quadrats no lineals. El mètode de menys quadrats es refereix al fet que la funció de regressió minimitza la suma dels quadrats de la variància dels punts de dades reals. D’aquesta manera, és possible dibuixar una funció que proporciona estadísticament el millor ajustament per a les dades. Tingueu en compte que una funció de regressió pot ser lineal (una línia recta) o no lineal (una línia de corba).
