Summary: | En este trabajo se compara el modelo de regresión logística binaria y el clasificador simple bayesiano en su habilidad para predecir la tendencia emprendedora en una muestra de estudiantes universitarios (n = 1230) utilizando como criterio de bondad predictiva el área bajo la curva ROC (Receiver Operating Characteristic) y manipulando diferentes parámetros determinantes de los datos (tamaño de la muestra, nivel y tipo de categorización en las variables predictoras, y tasa de casos perdidos). El manuscrito consta de doce capítulos organizados en cinco partes. En la primera parte se hace una revisión teórica de los aspectos estadísticos y sustantivos que son objeto de estudio. Así, en un primer capítulo se revisa el concepto de modelado estadístico predictivo. El segundo y tercer capítulo están destinados a establecer los fundamentos matemático-estadísticos de la regresión logística y las redes bayesianas. El último capítulo de la primera parte está destinado a cubrir y contextualizar elementos clave de la investigación en actitudes emprendedoras. La segunda parte contiene el trabajo empírico. En el primer capítulo de esta parte se establecen los objetivos, la metodología a utilizar, las características de la muestra, los materiales utilizados y el procedimiento llevado a cabo. Los cinco siguientes capítulos contienen seis estudios diseñados para alcanzar los objetivos propuestos. En el estudio 1 se obtienen los mejores modelos para predecir las dimensiones cognitiva, emocional y conductual de la tendencia hacia la creación de empresas en función cinco escalas (actitud hacia la creación de empresas, preparación percibida, obstáculos percibidos, motivación y carencias percibidas). Se observa que la deseabilidad de crear una empresa está relacionada positivamente con la actitud, la preparación y con la motivación mientras que los obstáculos percibidos se relacionan negativamente con este aspecto. El componente cognitivo de la creación de empresas se relaciona positivamente con la actitud, las carencias y la preparación percibida. Por último, el aspecto conductual se relaciona negativamente con el número de obstáculos percibidos y positivamente con la actitud y la preparación percibida. En los estudios 2, 3, 4 y 5 se comparan la regresión logística y la red bayesiana correspondientes a los modelos obtenidos en el estudio 1 manipulando el tamaño de la muestra, el nivel de categorización de las variables predictoras, el tipo de categorización de las variables predictoras y la tasa de casos perdidos respectivamente. Los resultados muestran que la red bayesiana obtiene mayores áreas bajo la curva ROC cuando se manipulan el tamaño de la muestra y la tasa de casos perdidos. Cuando se manipula el grado de categorización de los predictores la regresión logística se comporta ligeramente mejor que la red bayesiana mientras que esa ventaja desaparece cuando se utilizan recodificaciones relativas (normalizadas y percentiles) de las variables predictoras. En la tercera parte se plantean las conclusiones a nivel estadístico y sustantivo. Se plantea que se usen las redes bayesianas como otra alternativa, junto a las ya existentes, para desarrollar modelos probabilísticos cuando se den las condiciones que atentan contra la validez de la regresión logística. Los hallazgos sustantivos se contextualizan en la investigación del emprendedor potencial. La cuarta parte de la tesis contiene un conjunto de reflexiones sobre la utilidad de las redes bayesianas en diferentes áreas de la psicología y la quinta parte contiene el cuestionario usado en la investigación.
|