Comentarios

Regresión simple (RLS)


En numerosos problemas, el investigador se enfrenta a dos variables que proporcionan predicciones de comportamientos futuros.

Esta predicción se puede lograr a través de un estudio que involucra la ecuación de la línea de regresión, concebida a través del criterio (y, dependiente o respuesta) e independientes (x, también conocido como pronóstico).

Es una realidad común en el universo de la investigación, que involucra variables como ingresos, edad, gastos, entre muchos otros.

Ecuación de la recta

Y = a1 + a2.x

Donde y es la variable dependiente yx es la variable independiente.

el1 es el valor de y para x y a2. es el valor medio de y por unidad x.

La relación lineal entre las dos variables se mide por el coeficiente de correlación (R).

R varía de -1 a 1, donde 1 es la correlación perfecta y lo contrario indica una fuerte correlación negativa. Los valores cercanos a cero indican una correlación pobre.

En el siguiente ejemplo, si hubiera una R alta, y podría predecirse para eventos futuros.

Y

X

Gastos de combustible

Km redondeado

Ingresos personales

Años de estudio

Números de defectos de parte

Horas de formación de calidad.

El cálculo de R es una operación muy simple para software con funciones estadísticas, siendo necesario profundizar los procedimientos de cálculo.

En este tipo de análisis es importante determinar cuánto representa la línea de regresión los datos. En este caso, es necesario calcular la R2 Pearson o coeficiente de determinación.

A R2 0.80, el 80% de la variabilidad se deriva de x. Por el contrario, se puede decir que el 20% de la varianza de Y no es atribuible a las diferencias en x.

Para obtener la prueba de hipótesis, formulamos H0 y H1 de la siguiente manera:

H0 : p = 0

H1: p ≠ 0

El cálculo de t se realiza a través de la fórmula,

Siendo t calculado mayor que t tabulado, la hipótesis nula es rechazada.

Ejemplo

Un conductor quiere pronosticar los gastos de su automóvil en función de las millas que maneja por mes.

KM

GASTOS (R $)

3203

400

3203

400

2603

340

3105

400

1305

150

804

100

1604

200

2706

300

805

100

1903

200

3203

400

3702

450

3203

400

3203

400

803

100

803

100

1102

130

3202

400

1604

150

1603

200

3203

400

3702

450

3403

440

Estadísticas de regresión

R múltiple

0,993064678

Plaza R

0,986177454

R-cuadrado ajustado

0,985519237

Error estándar

127,508336

Observaciones

23

Mirando la tabla de arriba, podemos ver una fuerte correlación entre las variables, donde R está muy cerca de 1.

Las millas conducidas explican el 98% de la variación del gasto. Siguiente: Regresión lineal múltiple (RLM)