Perspectivas en Costa Rica de la evaluación nacional de Capacidades Superiores ante la Inteligencia Artificial

Por

11 de marzo de 2026

Contenidos

En el contexto de la educación costarricense, y con particular relevancia para los procesos de evaluación que administra el Ministerio de Educación Pública (MEP) —incluyendo las pruebas FARO, las evaluaciones de bachillerato y las pruebas nacionales estandarizadas—, la valoración dominante entre los investigadores en Educación Matemática es que los enfoques psicométricos tradicionales de las pruebas a gran escala han alcanzado un límite crítico. Esta crisis no solo deriva de los formatos de ítems heredados de la era analógica, sino de marcos intelectuales que priorizan la eficiencia estadística sobre la profundidad del pensamiento matemático.

1. Del “Resultado” al “Proceso”

Tradicionalmente, la psicometría se ha centrado en “medir de manera fiable el resultado del aprendizaje” y no el aprendizaje en sí mismo, omitiendo los procesos de pensamiento y comunicación (Suurtamm et al., 2016). Esta circunstancia ha distanciado a las pruebas estandarizadas de las funciones formativas, situación que se replica en las evaluaciones nacionales sumativas del sistema educativo costarricense.

Sin embargo, la Inteligencia Artificial (IA) está permitiendo abrir esta “caja negra”. Mediante los Tests Adaptativos Computarizados (CAT), los algoritmos ajustan la dificultad en tiempo real, mientras que la captura de la “traza de datos” (log data) permite analizar no solo si la respuesta es correcta, sino cómo el estudiante interactúa con el problema, sus dudas y sus estrategias de resolución. Para el MEP esto abre posibilidades inéditas para enriquecer el diagnóstico educativo a escala nacional.

2. La Superación del Conductismo y la Selección Única

El formato de selección única, predominante en América Latina —y aún presente en pruebas nacionales costarricenses— por el bajo costo de la revisión óptica, refleja una visión conductista que fragmenta el conocimiento (Scherrer, 2015). Schoenfeld (2007) advierte que estas pruebas poseen un escaso valor diagnóstico y no captan el espectro deseado de la competencia matemática, tal como la concibe el currículo costarricense reformado a partir de 2012, que enfatiza procesos como el razonamiento, la resolución de problemas y la comunicación matemática.

En la actualidad, los Modelos de Lenguaje de Gran Escala (LLM) están rompiendo esta limitación al permitir la calificación automatizada de respuestas abiertas. La tecnología actual ya es capaz de evaluar procedimientos complejos, identificar “errores inteligentes” y ofrecer retroalimentación inmediata, integrando la riqueza de la evaluación de aula en las mediciones a gran escala. Esto resulta especialmente pertinente para Costa Rica, donde el currículo vigente exige la demostración de competencias complejas que los ítems de opción múltiple no logran capturar (Ruiz, 2018).

3. Los buenos problemas matemáticos son inherentemente “desordenados”

La psicometría clásica descansa sobre supuestos como la unidimensionalidad y la independencia local (Osterlind, 1998). No obstante, autores como Van den Heuvel-Panhuizen & Becker (2003) sostienen que los buenos problemas matemáticos son inherentemente “desordenados”, multidimensionales y con múltiples vías de solución, característica que el currículo costarricense promueve activamente mediante situaciones de aprendizaje contextualizadas en la realidad nacional.

Para abordar esta complejidad, han surgido los Modelos de Clasificación Diagnóstica (MCD). Estos modelos se apoyan en la Matriz-Q (Tatsuoka, 2016) para mapear atributos cognitivos específicos. Gracias a la capacidad de procesamiento de la IA, hoy es posible construir y validar estas matrices de forma mucho más ágil, permitiendo que las pruebas identifiquen con precisión qué habilidades específicas posee o le faltan a un estudiante. Aplicado al sistema educativo costarricense, esto podría transformar los informes de resultados que reciben los centros educativos, pasando de puntajes globales a diagnósticos detallados por habilidad y nivel cognitivo, alineados con los estándares nacionales.

4. Hacia una Enseñanza Propositiva y Desafiante en el Contexto Costarricense

El reto actual para Costa Rica consiste en compatibilizar estos avances tecnológicos con una enseñanza que motive a los estudiantes a “trabajar con problemas mal estructurados del mundo real o resolver problemas desde más de una perspectiva” (Suurtamm et al., 2016). El país cuenta con una sólida tradición de reformas curriculares progresistas y con el respaldo institucional, lo que constituye una base favorable para liderar este proceso en la región centroamericana.

La IA no debe ser solo un medio para calificar más rápido, sino un motor para promover el progreso de las capacidades cognitivas superiores. En el marco de un Plan Nacional de Educación costarricense, integrar estas tecnologías de manera equitativa —considerando las brechas de conectividad entre zonas urbanas y rurales, incluyendo comunidades indígenas y costeras— representa tanto un imperativo técnico como un compromiso con la justicia educativa.

Conclusión

En la tercera década del siglo XXI, la discusión en Costa Rica debe trascender la técnica. Aunque la tecnología y la IA ofrecen herramientas sin precedentes para captar la complejidad del pensamiento humano, siempre persistirá el desafío ético y pedagógico de asegurar que los instrumentos de evaluación no distorsionen el currículo, sino que potencien una relación profunda y creativa con la matemática. El fortalecimiento del sistema de evaluación nacional, alineado con los principios humanistas que históricamente han caracterizado la educación costarricense, constituye una oportunidad única para que el país se posicione como referente regional en la evaluación matemática del siglo XXI.

Ojalá las autoridades educativas asuman esta perspectiva innovadora en el escenario generado por la IA.

Referencias

De la Torre, J., et al. (2016). Diagnostic Classification Models and Mathematics Education Research. Journal for Research in Mathematics Education (JRME).
Osterlind, S. J. (1998). Constructing test items. Kluwer Academic Publishers.
Ruiz, A. (2018). Evaluación y pruebas nacionales para un currículo de matemáticas que enfatiza capacidades superiores. México: Comité Interamericano de Educación Matemática.
Scherrer, J. (2015). Learning, teaching, and assessing the standards for mathematical practice. NCTM.
Schoenfeld, A. (2007). Assessing Mathematical Proficiency. Cambridge University Press.
Suurtamm, C., et al. (2016). Assessment in Mathematics Education. Springer.
Tatsuoka, C. et al. (2016). Developing Workable Attributes for Psychometric Models Based on the Q-Matrix. NCTM.
Van den Heuvel-Panhuizen, M., & Becker, J. (2003). Towards a didactic model for assessment design. Second International Handbook of Mathematics Education.