Acção de Formação à Distância TRENDS/PROF2000    

A-13 - Calculadora gráfica e o computador em interacção

António Manuel Marques do Amaral



Actividade 4



A seguir apresentam-se 3 conjuntos de dados A, B e C, preparados pelo estatístico Frank Anscombe, para ilustrar os perigos de calcular medidas sem primeiro representar os dados. Os conjuntos de dados A, B e C têm a mesma correlação e a mesma recta de regressão (Moore, 1995):

 A

 

 

 

 

 

 

 

 

 

 

 

x

10

8

13

9

11

14

6

4

12

7

5

y

8.04

6.95

7.58

8.81

8.33

9.96

7.24

4.26

10.84

4.82

5.6

B

 

 

 

 

 

 

 

 

 

 

 

x

10

8

13

9

11

14

6

4

12

7

5

y

9.14

8.14

8.74

8.77

9.26

8.10

6.13

3.10

9.13

7.26

4.74

C

 

 

 

 

 

 

 

 

 

 

 

x

8

8

8

8

8

8

8

8

8

8

19

y

6.58

5.76

7.71

8.84

8.47

7.04

5.25

5.56

7.91

6.89

12.50

Calcule a média da variável x e a média da variável y, em cada um dos conjuntos.

Calcule o coeficiente de correlação e a recta de regressão para cada um dos conjuntos e verifique que são iguais.

Para cada um dos conjuntos de dados represente a nuvem de pontos e a recta de regressão.

Em qual das situações acha que pode utilizar a recta de regressão para predizer o valor de y para x=13.5? Justifique a resposta.

Adaptado da Brochura Estatística - 10º ano; página 114

 

Resolução


A calculadora CASIO CFX-9950G  permite efectuar cálculos e gráficos estatísticos, nomeadamente:
  • Calcular e representar graficamente dados estatísticos de variáveis únicas;

  • Calcular e representar graficamente dados estatísticos de variáveis duplas;

  • Representar gráficos manualmente;

  • Executar cálculos estatísticos.

Para aceder ao menu de estatística:

MAIN MENU 
STAT



Aberto o modo de Estatística, começamos por introduzir os dados dos grupos A, B e C, respectivamente, nas listas 1 e 2, 1 e 3, e 4 e 5:



Depois de especificarmos a localização dos dados, obtemos os seguintes resultados estatísticos:

Grupo A:

Grupo B:

Grupo C:

Média A B C
x 9,00 9,00 9,00
y 7,49 7,50 7,50


Calculemos o coeficiente de correlação e a recta de regressão para cada um dos grupos, A, B e C, respectivamente:

Grupo Recta Coef.Cor.
A y=0,5x+3 0,82
B y=0,5x+3 0,82
C y=0,5x+3 0,82

Para cada um dos grupos de dados representemos agora o diagrama de dispersão e a recta de regressão:
Grupo A:

Grupo B:

Grupo C:



Representando simultaneamente as distribuições dos três grupos e a recta de regressão, obtemos:




Apenas podemos utilizar a recta de regressão para predizer o valor de y para x=13,5 no conjunto de dados A, pois é este o único grupo de dados onde o diagrama de dispersão sugere uma dependência linear entre as variáveis x e y.


No grupo B, as variáveis estão relacionadas por uma dependência não linear, que poderá ser do tipo quadrático (por exemplo), como podemos observar no gráfico de regressão quadrática seguinte:


No grupo C, se eliminarmos o par (19; 12,5) que parece não estar relacionado com os restantes, obtemos um novo diagrama de distribuição que sugere não existir qualquer tipo de relação (linear ou não linear) entre as variáveis x e y:

 

 

 

Esta actividade sugere a necessidade de uma análise cuidada dos dados antes da obtenção da recta de regressão.

O facto de a recta de regressão estar ligada ao ponto

(xmed,ymed)

é muito influenciada pelas médias das observações das variáveis x e y, quer por valores estranhos da amostra.




Ficheiro do FX-INTERFACE com as capturas de ecrã e as Listas 1 a 5 usadas na resolução desta actividade.

 

Actualizada em
 27-05-2000