lunes, 11 de junio de 2012

coeficiente de correlación de Pearson

La correlación es la medida de la relación entre dos variables, uno de los coeficientes de correlación mas utilizados es el de Pearson si por ejemplo medimos dos variables y observamos su actuación conjunta podremos determinar si están relacionadas o no. Para que se comprenda esto pongo un ejemplo, si medimos el cociente intelectual de un grupo de niños y también medimos sus calificaciones en una determinada asignatura, observaremos que la relación existente es alta.
El valor del coeficiente de correlación de Pearson varia entre -1 y 1, pasando claro está por 0, el signo de la correlación expresa información acerca del sentido de la correlación ya que existe la llamada correlación lineal positiva o negativa según la variable X o Y sea mayor o menor. Para comprender esto podemos dibujar un eje de ordenadas y abcisas, para cada valor de X tenemos un valor de Y, se obtienen así una nube de puntos que en el caso de existir correlación positiva estarían alineados hacia nuestra derecha y en caso de correlación negativa perfecta, estarían alineados los puntos a nuestra izquierda.
 Este coeficiente de correlación sirve de base de bastantes correlaciones y es muy utilizado para determinar la fiabilidad y validez de los tests, tambien es la base de los estudios de tipo correlacional (análisis factorial, análisis multivariado, correlación canónica).
La obtención de este coeficiente es muy sencilla y basta aplicar la fórmula paso por paso. No hay que olvidar que las variables tienen que estar expresadas en medida nominal, tienen que ser variables cuantitativas y continuas. Con los mismos datos obtenidos para realizar un Pearson puede también utilizarse el coeficiente de correlación de Spearman, pero los datos deberán estar ordenados.
Para obtener el coeficiente de correlación lo primero que tenemos que hacer es colocar los datos en dos columnas X e Y, obtendremos después los sumatorios. Como nos hacen falta los datos al cuadrado de las dos variables, escribiremos columnas con esos datos al cuadrado, y por supuesto obtenemos el sumatorio. Por último nos hace falta otra columna en la que se reflejen las multiplicaciones de las variables X e Y, y obtendremos su sumatorio también.
Una vez obtenido el resultado de nuestro coeficiente de correlación(r), el cual tiene que estar entre -1 y 1, podemos determinar si existe correlación entre las variables y el grado. Hay varias formas de clasificar el resultado por ejemplo:
Si la correlación es menor a 0.20 ,podemos decir que es muy pequeña, prñacticamente despreciable.
Si el valor que obtenemos esta entre 0.20 y 0.40 ,podemos decir que la correlación es baja.
Entre 0.40 y 0.60 la correlación es moderada.
Entre 0.60 y 0.80 la correlación es alta, marcada
Si la correlación es mayor que 0.80 la correlación es muy alta.


Antes mencione a las variables continuas, por eso voy a explicar que es una variable cuantitativa que ,entre dos valores dados cualequiera,permite encontrar posiciciones intermedias y puede tomar cualquier valor.
Como ejemplos de este tipo tenemos : la altura de los sujetos, peso en kilogramos, cociente intelectual, etc
 
En 1846, Bravais utilizó ya el concepto de coeficiente, pero fue Pearson el que estableció las propiedades matemáticas de r.

qracias a este coeficiente de correlación, en psicologia y educación podemos responder a un montón de preguntas relacionadas con la relación de variables, por ejemplo podemos determinar si en grupo concreto de sujetos el autoconcepto y la inteligencia estan relacionados de forma significativa, si la creatividad esta relacionada con la inteligencia, etc etc etc.
 
Los datos, para realizar este coeficiente de correlación tienen que ser puntaciones directas, si esas puntaciones las transformamos en una serie ordenada, colocándolos por ejemplo de mayor a menor, entonces solamente indicando ese orden correspondiente a las dos variables, podríamos utilizar el coeficiente de correlación de Spearman.
Para determinar la relación entre dos variables, podemos describirlas graficamente diseñando un diagrama de dispersión. Entonces, a cada unidad de la variable X le corresponderá un valor de la variable Y.
Para representar las correlaciones, a las abcisas les llamamos X y a las ordenadas Y.
Al unir los dos valores, obtendremos un punto… que unido a los otros puntos determinados por la pareja de valores nos dará el grafico que nos indica el sentido de la correlación.
Si al diseñar un diagrama de dispersión, este no es lineal, deberemos escoger un procedimiento estadístico referente a la relación curvilínea, como por ejemplo la eta al cuadrado.