Taula de continguts
- Què és un test T?
- Explicar la prova T
- Resultats de proves ambigus
- Supòsits de prova T
- Càlcul de Tests
- Prova T relacionada (o vinculada)
- T-Test de variància igualada (agrupada)
- T-Test de variància desigual
- Determinació de quina prova T s'ha d'utilitzar
- Exemple de prova de variància desigual
Què és un test T?
Una prova t és un tipus d’estadística inferencial usada per determinar si hi ha una diferència significativa entre els mitjans de dos grups, que poden estar relacionats en determinades característiques. S'utilitza principalment quan els conjunts de dades, com el conjunt de dades registrat com el resultat de volar una moneda 100 vegades, seguirien una distribució normal i poden tenir variacions desconegudes. Un test t s’utilitza com a eina de prova d’hipòtesis, que permet la prova d’un supòsit aplicable a una població.
Un test t analitza l'estadística t, els valors de distribució t i els graus de llibertat per determinar la probabilitat de diferència entre dos conjunts de dades. Per realitzar un test amb tres o més variables, cal utilitzar una anàlisi de la variància.
Prova de T
Explicar la prova T
Essencialment, un test t ens permet comparar els valors mitjans dels dos conjunts de dades i determinar si provenien de la mateixa població. En els exemples anteriors, si prenguéssim una mostra d’alumnes de la classe A i una altra mostra d’estudiants de la classe B, no esperem que tinguessin exactament la mateixa mitjana i desviació estàndard. De la mateixa manera, les mostres preses del grup de control alimentat amb placebo i les preses del grup prescrit amb el medicament haurien de tenir una mitjana i una desviació estàndard diferent.
Matemàticament, la prova t pren una mostra de cadascun dels dos conjunts i estableix la declaració del problema assumint una hipòtesi nul·la que els dos mitjans són iguals. A partir de les fórmules aplicables, es calculen i es comparen determinats valors en comparació amb els valors estàndards i s'accepta o es rebutja la hipòtesi nul·la assumida.
Si la hipòtesi nul·la es qualifica de ser rebutjada, indica que les lectures de dades són fortes i no són per casualitat. La prova t és només una de les moltes proves utilitzades per a aquest propòsit. Els estadístics han d'utilitzar addicionalment proves diferents del test t per examinar més variables i proves amb mides de mostra més grans. Per a una mida de mostra gran, els estadístics utilitzen una prova z. Altres opcions de prova inclouen la prova de chi-quadrat i la prova f.
Hi ha tres tipus de proves t, i es classifiquen en proves t dependents i independents.
Punts clau
- Una prova t és un tipus d’estadística inferencial que s’utilitza per determinar si hi ha una diferència significativa entre els mitjans de dos grups, que poden estar relacionats en determinades característiques. La prova t és una de moltes proves utilitzades per a la prova d’hipòtesis. en estadístiques. Calcular una prova t requereix tres valors clau de dades. Inclouen la diferència entre els valors mitjans de cada conjunt de dades (anomenada diferència mitjana), la desviació estàndard de cada grup i el nombre de valors de dades de cada grup. Hi ha diversos tipus de prova t que es poden realitzar depenent sobre les dades i el tipus d’anàlisi necessaris.
Resultats de proves ambigus
Penseu que un fabricant de medicaments vol provar un medicament recentment inventat. Segueix el procediment estàndard de provar el fàrmac en un grup de pacients i donar un placebo a un altre grup, anomenat grup control. El placebo que es dóna al grup control és una substància sense cap valor terapèutic previst i serveix com a punt de referència per mesurar com respon l’altre grup, al qual se l’administra el medicament real.
Després de la prova de drogues, els membres del grup de control alimentat amb placebo van informar d’un augment de l’esperança de vida mitjana de tres anys, mentre que els membres del grup que se’ls prescriu el nou medicament reporten un augment de l’esperança de vida mitjana de quatre anys. L’observació instantània pot indicar que el fàrmac està funcionant, ja que els resultats són millors per al grup que l’utilitza. Tot i això, també és possible que l'observació es pugui deure a una casualitat, especialment una sorprenent peça de sort. Un test t és útil per concloure si els resultats són realment correctes i aplicables a tota la població.
En una escola, 100 estudiants de la classe A van anotar una mitjana del 85% amb una desviació estàndard del 3%. Uns altres 100 estudiants de la classe B van anotar una mitjana del 87% amb una desviació estàndard del 4%. Si bé la mitjana de la classe B és millor que la de la classe A, potser no és correcte saltar a la conclusió que el rendiment global dels estudiants de la classe B és millor que el dels estudiants de la classe A. Això és així perquè, juntament amb la mitjana, la desviació estàndard de la classe B també és superior a la de la classe A. Indica que els seus percentatges extrems, als costats inferiors i superiors, estaven molt més repartits en comparació amb el de la classe A. Una prova t pot ajudar a determinar quina classe va sortir millor.
Supòsits de prova T
- El primer supòsit que es fa sobre proves t fa referència a l'escala de mesurament. El supòsit d’un test t és que l’escala de mesura aplicada a les dades recollides segueix una escala contínua o ordinal, com les puntuacions d’un test d’IQ. La segona suposició que es fa és la d’una simple mostra aleatòria, que les dades són recollida d'una part representativa, seleccionada aleatòriament de la població total. El tercer supòsit és que les dades, quan es dibuixen, donen com a resultat una corba de distribució normal, amb forma de campana. La quarta suposició és una mida raonablement gran de la mostra. La mida de mostra més gran significa que la distribució dels resultats ha d'aproximar-se a una corba normal en forma de campana. L'assumpció final és l'homogeneïtat de la variància. Existeix una variació homogènia o igual quan les desviacions estàndard de les mostres són aproximadament iguals.
Càlcul de Tests
Per calcular una prova t necessita tres valors clau de dades. Inclouen la diferència entre els valors mitjans de cada conjunt de dades (anomenada diferència mitjana), la desviació estàndard de cada grup i el nombre de valors de dades de cada grup.
El resultat de la prova t produeix el valor t. Aquest valor t calculat es compara després amb un valor obtingut d'una taula de valors crítics (anomenada taula de distribució en T). Aquesta comparació ajuda a determinar quina probabilitat es produeix per casualitat la diferència entre els mitjans o si els conjunts de dades tenen realment diferències intrínseques. El test t pregunta sobre si la diferència entre els grups representa una veritable diferència en l'estudi o si és probable que sigui una diferència estadística sense sentit.
Taules de distribució de T
La taula de distribució en T està disponible en formats d'una cua i de dues cues. El primer s'utilitza per avaluar casos que tenen un valor fix o un rang amb una direcció clara (positiva o negativa). Per exemple, quina és la probabilitat de que el valor de sortida es mantingui per sota de -3 o que es superin més de set quan es tira un parell de daus? Aquest darrer s’utilitza per a l’anàlisi de límit d’interval, com ara preguntar si les coordenades se situen entre -2 i +2.
Els càlculs es poden realitzar amb programes de programari estàndard que admetin les funcions estadístiques necessàries, com les que es troben a MS Excel.
T-Valors i graus de llibertat
La prova t produeix dos valors com a sortida: el valor t i els graus de llibertat. El valor t és una relació de la diferència entre la mitjana dels dos conjunts de mostres i la diferència que hi ha dins dels conjunts de mostres. Si bé el valor del numerador (la diferència entre la mitjana dels dos conjunts d’exemple) és senzill de calcular, el denominador (la diferència que hi ha dins dels conjunts de mostres) es pot complicar una mica segons el tipus de valors de dades implicats. El denominador de la relació és una mesura de la dispersió o de la variabilitat. Valors més alts del valor t, també anomenat t-score, indiquen que existeix una gran diferència entre els dos conjunts de mostres. Com més petit sigui el valor t, més semblança existeix entre els dos conjunts d'exemple.
- Una puntuació t gran indica que els grups són diferents. Una puntuació t petita indica que els grups són similars.
Els graus de llibertat es refereixen als valors en un estudi que té la llibertat de variar i que són essencials per valorar la importància i la validesa de la nul·la hipòtesi. El càlcul d'aquests valors depèn generalment del nombre de registres de dades disponibles al conjunt de mostres.
Prova T relacionada (o vinculada)
El test t correlat es realitza quan les mostres consisteixen normalment en parells d'unitats similars o quan hi ha casos de mesures repetides. Per exemple, hi pot haver casos de mateixos pacients que s’estan provant repetidament, abans i després de rebre un tractament particular. En aquests casos, cada pacient s’utilitza com a mostra de control contra ells mateixos.
Aquest mètode també s'aplica als casos en què les mostres estan relacionades d'alguna manera o presenten característiques coincidents, com una anàlisi comparativa que implica nens, pares o germans. Les proves t correlacionades o aparellades són de tipus dependent, ja que es tracta de casos en què es relacionen els dos conjunts de mostres.
La fórmula per calcular el valor t i els graus de llibertat per a una prova t combinada és:
- La mitjana 1 i la mitjana2 són els valors mitjans de cadascun dels conjunts de mostres, mentre que var1 i var2 representen la variància de cadascun dels conjunts de mostres.
Els dos tipus restants pertanyen a les proves t independents. Les mostres d’aquest tipus es seleccionen independentment les unes de les altres, és a dir, els conjunts de dades dels dos grups no fan referència als mateixos valors. Inclouen casos com un grup de 100 pacients dividits en dos conjunts de 50 pacients cadascun. Un dels grups es converteix en el grup control i se li dóna un placebo, mentre que l’altre grup rep el tractament prescrit. Es tracta de dos grups de mostres independents que no estan separats entre ells.
Prova T amb variació igual (o agrupada)
La prova t igual a la variància s’utilitza quan el nombre de mostres de cada grup és el mateix, o la variància dels dos conjunts de dades és similar. La fórmula següent s'utilitza per calcular el valor t i els graus de llibertat per a proves de t de variància iguals:
Valor T = n1 + n2−2 (n1−1) × var12 + (n2−1) × var22 × n11 + n21 mitjana1 − mitjana2 on: mitjana1 i mitjana2 = valors mitjans de cada conjunt de la mostravar1 i var2 = Varància de cadascun dels exemples de mostresn1 i n2 = Nombre de registres de cada conjunt de mostres
i, Graus de llibertat = n1 + n2−2 on: n1 i n2 = Nombre de registres en cada conjunt de mostres
T-Test de variància desigual
La prova t de la variància desigual s'utilitza quan el nombre de mostres de cada grup és diferent i la variació dels dos conjunts de dades també és diferent. Aquesta prova també s’anomena prova t de Welch. La fórmula següent s'utilitza per calcular el valor t i els graus de llibertat per a un test de variància desigual:
Valor T = n1var12 + n2var22 mitjana1 − mitjana2 on: mitjana1 i mitjana2 = valors mitjans de cadascun dels conjunts de mostra1 i var2 = Varància de cadascun dels conjunts de mostra1 i n2 = Nombre de registres de cada conjunt de mostres
i, Graus de llibertat = n1−1 (n1var12) 2 + n2−1 (n2var22) 2 (n1var12 + n2var22) 2 on: var1 i var2 = Varància de cadascun dels exemplars de mostresn1 i n2 = nombre de registres a cada conjunt de mostres
Determinació de la prova T adequada
El següent diagrama de flux es pot utilitzar per determinar quin test t s'ha d'utilitzar en funció de les característiques dels conjunts de mostres. Els ítems clau a considerar són si els registres de mostra són similars, el nombre de registres de dades de cada conjunt de mostres i la variació de cada conjunt de mostres.
Imatge de Julie Bang © Investopedia 2019
Exemple de prova de variància desigual
Suposem que realitzem una mesura en diagonal de les pintures rebudes en una galeria d’art. Un grup de mostres inclou 10 pintures, mentre que l’altre inclou 20 pintures. Els conjunts de dades, amb els valors corresponents de mitjana i variació, són els següents:
Conjunt 1 | Conjunt 2 | |
19.7 | 28.3 | |
20.4 | 26.7 | |
19.6 | 20.1 | |
17.8 | 23.3 | |
18, 5 | 25.2 | |
18.9 | 22.1 | |
18.3 | 17.7 | |
18.9 | 27.6 | |
19, 5 | 20.6 | |
21, 95 | 13.7 | |
23.2 | ||
17, 5 | ||
20.6 | ||
18 | ||
23.9 | ||
21.6 | ||
24.3 | ||
20.4 | ||
23.9 | ||
13.3 | ||
Significar | 19.4 | 21.6 |
Desacord | 1.4 | 17.1 |
Tot i que la mitjana del conjunt 2 és superior a la del conjunt 1, no podem concloure que totes les pintures tinguin una longitud mitjana al voltant de 21, 6 unitats, ja que la variació del conjunt 2 és significativament superior a la set 1. És per casualitat o existeixen realment diferències. a la població de tots els quadres rebuts a la galeria d’art? Determinem el problema assumint la hipòtesi nul·la que la mitjana és la mateixa entre els dos conjunts de mostres i realitzem un test t per confirmar si la hipòtesi és certa.
Com que el nombre de registres de dades és diferent (n1 = 10 i n2 = 20) i la variància també és diferent, es calcula el valor t i els graus de llibertat per al conjunt de dades anterior mitjançant la fórmula esmentada en el T-Test de variància desigual. secció
El valor t és -2.24787. Com que es pot ignorar el signe menys quan es comparen els dos valors t, el valor computat és 2.24787.
El valor de graus de llibertat és de 24, 38 i es redueix a 24, a causa de la definició de fórmula que requereix arrodonir el valor al mínim valor enter possible.
Sempre que s’assumeix una distribució normal, es pot especificar un nivell de probabilitat (nivell alfa, nivell de significació, p ) com a criteri d’acceptació. En la majoria dels casos, es pot suposar un valor del 5%.
Utilitzant el valor de llibertat com a 24 i un nivell de significació del 5%, una ullada a la taula de distribució de valors t ofereix un valor de 2, 064. Si es compara aquest valor amb el valor calculat de 2.247, s'indica que el valor t calculat és superior al valor de la taula a un nivell de significació del 5%. Per tant, és segur rebutjar la hipòtesi nul·la que no hi ha diferència entre mitjans. El conjunt poblacional té diferències intrínseques i no són per casualitat.
Comparació de comptes d'inversió × Les ofertes que apareixen a aquesta taula provenen de col·laboracions per les quals Investopedia rep una compensació. Nom del proveïdorTermes relacionats
Funcionament de l'anàlisi de la variància (ANOVA) L'anàlisi de la variància (ANOVA) és una eina d'anàlisi estadística que separa la variabilitat total que es troba dins d'un conjunt de dades en dos components: factors aleatoris i sistemàtics. més Definició de test Z Una prova z és una prova estadística que s’utilitza per determinar si dos mitjans de població són diferents quan es coneixen les variacions i la mida de la mostra és gran. més Graus de llibertat Definició Els graus de llibertat fan referència al nombre màxim de valors lògicament independents, que són valors amb llibertat de variació, a la mostra de dades. més Comprensió de la distribució T La distribució AT és un tipus de funció de probabilitat adequada per a estimar paràmetres de població per a mides de mostra petites o variències desconegudes. més Quines mesures de semi-desviació La semi-desviació és un mètode per avaluar les fluctuacions inferiors a la mitjana dels resultats de la inversió. S'utilitza com a alternativa a la desviació estàndard. més Bonferroni Test Un test Bonferroni és un tipus de prova de comparació múltiple usat en anàlisis estadístiques. més Enllaços de socisArticles relacionats
Economia
Quins supòsits es fan quan es realitza una prova t?
Gestió de riscos
Utilitzar la volatilitat històrica per avaluar el risc futur
Estratègia i educació borsària
Com utilitzar Excel per simular preus
Ràtios financers
Com calcula la TIR a Excel?
Matemàtiques i estadístiques
Què és un error estàndard relatiu
Ràtios financers
Quina és la fórmula per calcular el valor actual net (NPV) a Excel?
