Contexto
Tengo una encuesta que hace 11 preguntas sobre la autoeficacia. Cada pregunta tiene 3 opciones de respuesta (en desacuerdo, de acuerdo, totalmente de acuerdo). Nueve preguntas sobre la autoestima. Utilicé un análisis factorial de los 11 ítems de autoeficacia y extraje dos factores.
$ x_1 $ a $ x_ {11} $ indican las 11 preguntas de autoeficacia de la encuesta, y $ f_1 $ ($ x_1 $ a $ x_6 $), $ f_2 $ ($ x_7 $ a $ x_ {11} $) denotan los dos factores que obtuve del análisis factorial. $ y $ es una variable dependiente.
Luego creé dos nuevas variables:
f1 = mean (x1 to x6); f2 = media (x7-x11).
Entonces, la regresión logística se vería así:
y = a + bf1 + cf2 + ....
Mi pregunta:
- ¿Puedo usar estos dos factores como variables predictoras en mi modelo de regresión logística multivariante?
- ¿Debo calcular la media de cada ítem en cada factor y usar esta media como una variable continua en mi modelo de regresión logística?
- ¿Es este un uso apropiado del análisis factorial?