Definição covariância

O termo covariância não faz parte do dicionário desenvolvido pela Royal Spanish Academy ( RAE ). O conceito, no entanto, é usado no campo da estatística e no campo da probabilidade para nomear o valor que reflete o grau de variação conjunta que é registrado em duas variáveis ​​aleatórias tomando suas médias como uma medida.

Covariância

A covariância, portanto, nos permite descobrir se as variáveis mantêm um link de dependência . Os dados também ajudam a conhecer outros parâmetros.

É conhecido com o nome de variável aleatória a uma função que ao resultado de um experimento aleatório lhe atribui um valor, geralmente de tipo numérico. Um experimento aleatório, por outro lado, é aquele que pode produzir resultados diferentes, mesmo se for realizado mais de uma vez sob as mesmas condições, de modo que cada experiência se torne impossível de prever e, portanto, de se reproduzir.

Um exemplo muito comum de experimento aleatório, que podemos provar em nossa vida diária, é o lançamento de um dado: mesmo que seja jogado na mesma superfície, com a mesma mão ou copo, e aplicando mais ou menos a mesma força e direção, não É possível prever qual dos seus rostos estará apontando para cima.

Se os valores baixos de uma variável correspondem aos valores baixos de outra variável, ou se o mesmo acontece com os valores altos de ambos, a covariância tem um valor positivo e é qualificada como direta . Por outro lado, se os valores baixos de uma variável correspondem aos valores mais altos de outra variável e vice-versa, a covariância é negativa e é definida como inversa . A tendência existente na relação linear que é estabelecida entre as variáveis, desta forma, é expressa pelo sinal de covariância .

Existem diferentes fórmulas para calcular a covariância. Pode-se dizer que a covariância é a média aritmética que surge do produto dos desvios das variáveis ​​em relação aos seus próprios meios.

Suponha que as variáveis ​​sejam os resultados das avaliações de História e Geografia de cinco alunos:

História dos Grades (P) dos cinco alunos: 6, 5, 7, 7, 4 (total = 29)
Escores de Geografia (S) dos cinco estudantes: 7, 3, 4, 3, 5 (total = 22)

Então você tem que tabular, multiplicando os resultados das avaliações de cada aluno:

P x S: 42 (desde 6 x 7 = 42), 15 (5x3), 28 (7x4), 21 (7x3), 20 (4x5). Total da soma dos resultados = 126)

A média de P: 29/5 = 5, 8
A média de S: 22/5 = 4, 4

Finalmente:

Covariância do PS: (126/5) - 5, 8 x 4, 4
Covariância do PS: 25, 2 - 5, 8 x 4, 4
Covariance PS: 25, 2 - 25, 52
Covariância do PS: -0, 32

Além de saber se duas variáveis ​​aleatórias têm um link de dependência mútua, a covariância é usada para estimar parâmetros como a linha de regressão e o coeficiente de correlação linear .

A linha de regressão também é conhecida como ajuste linear ou regressão linear, e é um conceito pertencente ao campo da estatística que inclui um modelo matemático usado para aproximar a dependência que existe entre um grupo de variáveis ​​e um termo aleatório.

O coeficiente de correlação linear, por outro lado, é um indicador da direção e força de uma relação linear (em matemática, o que é dado se o valor de uma magnitude depende do que o outro tem) e uma proporcionalidade ou relação constante que ocorre entre magnitudes que podem ser medidas) entre duas variáveis ​​estatísticas (são características que podem flutuar, com valores que podem ser observados e medidos).

É importante diferenciar os dois tipos de covariância a seguir: aquele que ocorre entre duas variáveis ​​aleatórias, que é considerado uma propriedade da distribuição conjunta, isto é, dos eventos de ambos que ocorrem simultaneamente; a amostra, que é usada como uma estimativa estatística do parâmetro .

Recomendado