Teste T De Student: Método estatístico

O teste t de Student ou somente teste t é um teste de hipótese que usa conceitos estatísticos para rejeitar ou não uma hipótese nula quando a estatística de teste ( t ) segue uma distribuição t de Student.

Essa premissa é normalmente usada quando a estatística de teste, na verdade, segue uma distribuição normal, mas a variância da população 2 é desconhecida. Nesse caso, é usada a variância amostral 2 e, com esse ajuste, a estatística de teste passa a seguir uma distribuição t de Student.

História

A estatística t foi introduzida em 1908 por William Sealy Gosset, químico da cervejaria Guinness em Dublin, Irlanda ("student" era seu pseudônimo). Gosset havia sido contratado devido à política inovadora de Claude Guinness de recrutar os melhores graduados de Oxford e Cambridge para os cargos de bioquímico e estatístico da indústria Guinness. Gosset desenvolveu o Teste t como um modo barato de monitorar a qualidade da cerveja tipo stout. Ele publicou o Teste t na revista acadêmica Biometrika em 1908, mas foi forçado a usar seu pseudônimo pelo seu empregador, que acreditava que o fato de usar estatística era um segredo industrial. De fato, a identidade de Gosset não foi reconhecida por seus colegas estatísticos.

Conceito

Teste T De Student: História, Conceito, Teste t para média de uma amostra 
Função Densidade de Probabilidade para t de Student, indicando o p-valor unicaudal para determinado t
Teste T De Student: História, Conceito, Teste t para média de uma amostra 
Função Densidade de Probabilidade para t de Student, indicando o nível de confiança Teste T De Student: História, Conceito, Teste t para média de uma amostra  e o p-valor bicaudal para determinado t

Se forem feitas inúmeras amostras de tamanho Teste T De Student: História, Conceito, Teste t para média de uma amostra  a partir da mesma população e se fossem tiradas as médias de uma variável dessa população que possui uma distribuição normal, a distribuição dessas inúmeras médias seguiria uma distribuição t de Student. Por exemplo, imaginemos que a altura das pessoas segue uma distribuição normal. Se selecionarmos diversas amostras aleatórias de 100 pessoas e calculássemos a média da altura das pessoas de cada amostra, essa média da altura das pessoas seguirá uma distribuição t de Student.

Perceba que, na distribuição t de Student, valores muito baixos ou muito altos tem menor probabilidade de ocorrer, indicando que é menos provável que a média de uma amostra apresente valores muito distantes da média da população.

O formato da distribuição t de Student depende do número de graus de liberdade. Quanto maior o número de graus de liberdade, mais "concentrada" é a distribuição. Para valores muito grandes de graus de liberdade, a distribuição t de Student se aproxima da distribuição normal.

O Teste t consiste em formular uma hipótese nula e consequentemente uma hipótese alternativa, calcular o valor de Teste T De Student: História, Conceito, Teste t para média de uma amostra  conforme a fórmula apropriada (abaixo) e aplicá-lo à função densidade de probabilidade da distribuição t de Student medindo o tamanho da área abaixo dessa função para valores maiores ou iguais a Teste T De Student: História, Conceito, Teste t para média de uma amostra . Essa área representa a probabilidade da média dessa(s) amostra(s) em questão ter(em) apresentado o(s) valor(es) observado(s) ou algo mais extremo. Se a probabilidade desse resultado ter ocorrido for muito pequena, podemos concluir que o resultado observado é estatisticamente relevante. Essa probabilidade também é chamada de p-valor ou valor p. Consequentemente, o nível de confiança Teste T De Student: História, Conceito, Teste t para média de uma amostra  é igual a 1 - p-valor.

Normalmente é usado um "ponto de corte" para o p-valor ou para o nível de confiança para definir se a hipótese nula deve ser rejeitada ou não. Se o p-valor for menor que esse "ponto de corte", a hipótese nula é rejeitada. Caso contrário, a hipótese nula não é rejeitada.

É comum que sejam usados os "pontos de corte" para p-valor 0,1%, 0,5%, 1%, 2% ou 5%, fazendo com que os níveis de confiança sejam, respectivamente, 99,9%, 99,5%, 99%, 98% ou 95%. Caso seja usado o p-valor 5% como "ponto de corte" e a área abaixo da função densidade de probabilidade da distribuição t de Student seja menor do que 5%, pode-se afirmar que a hipótese nula é rejeitada com nível de confiança de 95%.

Note que não rejeitar a hipótese nula não é a mesma coisa que afirmar que a hipótese alternativa é válida com o mesmo nível de confiança. Isso seria uma interpretação incorreta do teste.

Unicaudal vs. Bicaudal

Dependendo da definição da hipótese nula, deve ser usado uma ou duas caudas da distribuição t de Student na avaliação do teste. Por exemplo, se a hipótese nula for Teste T De Student: História, Conceito, Teste t para média de uma amostra  e a hipótese alternativa Teste T De Student: História, Conceito, Teste t para média de uma amostra , o teste deve ser feito somente para valores maiores do que Teste T De Student: História, Conceito, Teste t para média de uma amostra  e, portanto, ao consultar a função densidade de probabilidade da distribuição t de Student, deve-se considerar somente a área superior a Teste T De Student: História, Conceito, Teste t para média de uma amostra , ou seja, somente uma das "caudas" da distribuição.

Por outro lado, se a hipótese nula for Teste T De Student: História, Conceito, Teste t para média de uma amostra  e, consequentemente, a hipótese alternativa Teste T De Student: História, Conceito, Teste t para média de uma amostra , teríamos que avaliar ao mesmo tempo a possibilidade de Teste T De Student: História, Conceito, Teste t para média de uma amostra  e de Teste T De Student: História, Conceito, Teste t para média de uma amostra . Para isso, ao consultar a função densidade de probabilidade da distribuição t de Student, devem ser consideradas as áreas abaixo da curva para valores superiores a Teste T De Student: História, Conceito, Teste t para média de uma amostra  e inferiores a Teste T De Student: História, Conceito, Teste t para média de uma amostra , ou seja, as duas "caudas" da distribuição. Como a distribuição é simétrica, os tamanhos dessas áreas são iguais.

Teste t para média de uma amostra

O teste t para média de uma amostra consiste em medir a probabilidade da média da amostra em questão ter apresentado o valor observado Teste T De Student: História, Conceito, Teste t para média de uma amostra  ou algo mais extremo, dada a média da população Teste T De Student: História, Conceito, Teste t para média de uma amostra .

Para fazer isso, estipulamos, por exemplo, que a hipótese nula é Teste T De Student: História, Conceito, Teste t para média de uma amostra  e que, por consequência, a hipótese alternativa é Teste T De Student: História, Conceito, Teste t para média de uma amostra . Usamos a seguinte fórmula para o cálculo da estatística t:

    Teste T De Student: História, Conceito, Teste t para média de uma amostra 

Em que:

  • Teste T De Student: História, Conceito, Teste t para média de uma amostra : Média da amostra;
  • Teste T De Student: História, Conceito, Teste t para média de uma amostra : Valor fixo usado para comparação com a média da amostra;
  • Teste T De Student: História, Conceito, Teste t para média de uma amostra : Desvio padrão amostral;
  • Teste T De Student: História, Conceito, Teste t para média de uma amostra : Tamanho da amostra.

Quanto maior Teste T De Student: História, Conceito, Teste t para média de uma amostra , mais confiança temos ao rejeitar a hipótese nula, ou seja, mais certeza temos ao afirmar que Teste T De Student: História, Conceito, Teste t para média de uma amostra  não é verdadeiro.

Note que, na fórmula acima, quanto maior Teste T De Student: História, Conceito, Teste t para média de uma amostra , maior será Teste T De Student: História, Conceito, Teste t para média de uma amostra . Ou seja, quanto maior a distância dos valores observados ao valor que estamos comparando, mais certeza teremos em afirmar que eles são diferentes. Do mesmo modo, Teste T De Student: História, Conceito, Teste t para média de uma amostra  aumenta quando o tamanho da amostra Teste T De Student: História, Conceito, Teste t para média de uma amostra  é maior ou quando o desvio padrão Teste T De Student: História, Conceito, Teste t para média de uma amostra  é menor. Teoricamente, o desvio padrão a ser usado deveria ser o da população (normalmente identificado com o símbolo Teste T De Student: História, Conceito, Teste t para média de uma amostra ), mas em muitos casos práticos esse valor é desconhecido, sendo necessário aproximá-lo pelo desvio padrão amostral Teste T De Student: História, Conceito, Teste t para média de uma amostra :

    Teste T De Student: História, Conceito, Teste t para média de uma amostra 

Exemplo prático

Determinado carro consegue percorrer 15 km a cada litro de combustível gasto em uma estrada plana e de boas condições, mas essa distância pode variar devido a diversos fatores. Digamos que a distância percorrida por litro de combustível tenha uma distribuição normal com média 15 km e desvio padrão de 2 km.

Suponhamos que seja feita uma modificação no motor desse carro com o objetivo de aumentar a distância percorrida por litro de combustível. Depois da modificação, foram realizados 10 testes. Nesses testes, a média das distâncias percorridas por litro de combustível foi de 16,6 km.

A princípio, como 16,6 km é uma distância superior a 15 km, parece que a modificação no motor aumentou a distância percorrida por litro de combustível. Mas, para comprovar esse efeito de forma estatística, definimos a hipótese nula Teste T De Student: História, Conceito, Teste t para média de uma amostra  e calculamos o valor de Teste T De Student: História, Conceito, Teste t para média de uma amostra .

Neste caso, temos:

    Teste T De Student: História, Conceito, Teste t para média de uma amostra 
    Teste T De Student: História, Conceito, Teste t para média de uma amostra 
    Teste T De Student: História, Conceito, Teste t para média de uma amostra 
    Teste T De Student: História, Conceito, Teste t para média de uma amostra 

Assim,

    Teste T De Student: História, Conceito, Teste t para média de uma amostra 

Conforme a função de densidade de probabilidade da distribuição t de Student com 9 (10-1) graus de liberdade, existe 1,61% de probabilidade de valores superiores a 2,53 terem sido obtidos caso a distância percorrida por litro de combustível não ter sido alterada. Se estivermos usando nível de confiança de 95%, rejeitaríamos a hipótese nula Teste T De Student: História, Conceito, Teste t para média de uma amostra . Isso pode ser explicado de duas formas:

  • A probabilidade obtida com o t calculado (1,61%) é inferior ao "ponto de corte" do p-valor (5%), ou
  • O valor t do "ponto de corte" escolhido (95% de confiança, que corresponde ao t de 1,833), é inferior ao t calculado (2,53).

Na primeira explicação, é necessário calcular a área abaixo da função densidade de probabilidade da distribuição t de Student com 9 graus de liberdade para valores superiores a 2,53 usando algum software estatístico ou planilha de cálculo. Na segunda explicação, além dos softwares estatísticos ou planilhas de cálculo, também poderia-se chegar no valor 1,833 usando uma tabela de valores para distribuição t de Student, que normalmente constam em livros de estatística.

Perceba que, se usássemos nível de confiança de 99%, ao invés de 95%, não rejeitaríamos a hipótese nula porque:

  • A probabilidade obtida com o t calculado (1,61%) é superior ao "ponto de corte" do p-valor (1%), ou
  • O valor t do "ponto de corte" escolhido (99% de confiança, que corresponde ao t de 2,821), é superior ao t calculado (2,53).

Teste t para médias de duas amostras

Tamanhos iguais, variâncias iguais

Este teste só deve ser usado quando:

  • o tamanho das amostras (n) dos dois grupos são iguais;
  • Podemos assumir que as duas distribuições possuem a mesma variância.

A estatística t é calculada conforme a fórmula:

    Teste T De Student: História, Conceito, Teste t para média de uma amostra 

,onde

    Teste T De Student: História, Conceito, Teste t para média de uma amostra 

A quantidade de graus de liberdade a ser usado nesse teste é Teste T De Student: História, Conceito, Teste t para média de uma amostra .

Tamanhos diferentes, variâncias iguais

Este teste só deve ser usado quando podemos assumir que as duas distribuições possuem a mesma variância.

A estatística t é calculada conforme a fórmula:

    Teste T De Student: História, Conceito, Teste t para média de uma amostra 

,onde

    Teste T De Student: História, Conceito, Teste t para média de uma amostra 

A quantidade de graus de liberdade a ser usado nesse teste é Teste T De Student: História, Conceito, Teste t para média de uma amostra .

Tamanhos diferentes, variâncias diferentes

Este teste é usado quando as amostras possuem variâncias diferentes. Para confirmar se as variâncias são realmente diferentes, é recomendável realizar um teste de variâncias.

A estatística t é calculada conforme a fórmula:

    Teste T De Student: História, Conceito, Teste t para média de uma amostra 

,onde

    Teste T De Student: História, Conceito, Teste t para média de uma amostra 

A quantidade de graus de liberdade a ser usado nesse teste é:

    Teste T De Student: História, Conceito, Teste t para média de uma amostra 

Essa equação é chamada de Equação Welch–Satterthwaite.

Teste t para coeficiente de regressões

O Teste t também pode ser usado para testar a significância de coeficientes de regressões. Em geral esse teste é usado para confirmar se a variável que está sendo usada na regressão está realmente contribuindo para a estimativa.

Ver também

Referências

Tags:

Teste T De Student HistóriaTeste T De Student ConceitoTeste T De Student Teste t para média de uma amostraTeste T De Student Teste t para médias de duas amostrasTeste T De Student Teste t para coeficiente de regressõesTeste T De Student Ver tambémTeste T De StudentDistribuição t de StudentEstatísticaEstatística de testeHipótese nulaTestes de hipóteses

🔥 Trending searches on Wiki Português:

Fallout 4Bonnie e ClydeTurquia.comArsenal Football ClubCristianismoTouro (astrologia)Simón BolívarSigmund FreudSport Club Corinthians PaulistaDelfín Sporting ClubLevantamento das CaldasBrasíliaALuiz Inácio Lula da SilvaDexter (série de televisão)Fernando HaddadMarcinho VPComunismoEloy CasagrandeLista de unidades federativas do Brasil por populaçãoPortoArgentinaElias MalucoTropa de Elite (filme)Anne Frank24 de abrilAl PacinoPonte 25 de AbrilPrimeiro Comando da CapitalKeanu ReevesPedro II do BrasilGabriel MilitoRui TavaresAfroditeAbel FerreiraRelação sexualPaíses BaixosGuerra do VietnãRio de JaneiroCearáTokugawa IeyasuRevolução IndustrialGolpe de 11 de Março de 1975A PortuguesaKJoana Amaral DiasCopa Sul-AmericanaTelegramFreddie MercuryUnião EuropeiaVenezuelaBruno HenriqueSabotage (rapper)Luiz Marcelo Morais dos ReisOrganização do Tratado do Atlântico NorteTim LopesCazuzaLuaBoston CelticsGuerra do ContestadoXaviFascismoParaíso TropicalLuciano HuckYin-yangReis (telenovela)Partido Renovador Democrático (Portugal)EquadorClub Atlético IndependienteZé PelintraGabigolRenascerCandombléFelipão (treinador de futebol)Feyenoord RotterdamClub Atlético Peñarol🡆 More