Evaluaciones estandarizadas en tiempos de pandemia: ¿un contrasentido?

Fotografía: Archivo Hasenberg-Quaretti

¿Cómo se construyen las evaluaciones estandarizadas? ¿Son realmente una radiografía para medir la "calidad educativa"? ¿Qué desafíos le dejó la pandemia a la evaluación del sistema educativo?

Muchas de las ideas y creencias sostenidas por un sector dominante de la sociedad, cuando se refieren al campo educativo, afirman que el camino para mejorar la educación pasa necesariamente por realizar evaluaciones estandarizadas. Esta visión lineal y simplista con respecto al potencial que tienen las evaluaciones estandarizadas se reproduce también entre algunos académicos y personajes mediáticos con acceso a los medios de comunicación que, de esta manera, logran naturalizar y legitimar un discurso con una alta carga valorativa.

Un nuevo marco normativo, a partir de la Ley de Educación Nacional (Ley Nº 26.206/06), puso en discusión tanto el concepto de una “educación de calidad”, como también “la legitimidad de su medición” a través de las pruebas estandarizadas. Desde la concepción de la educación como derecho, donde el Estado se asume como responsable de que se efectivice este derecho, una prueba estandarizada que homologa y espera que todos tengan los mismos estándares de aprendizajes, no podrá nunca evaluar la “calidad” de un sistema educativo. Este debate, sin embargo, no logró trascender más allá de algunos sectores del ámbito académico y de la docencia. El interés sobre los resultados de las pruebas estandarizadas como medida de “calidad educativa” sigue vigente en el sentido común de un sector importante de la sociedad que, en la situación actual, alza sus voces para reclamar más evaluación. Por esta razón, interesa desarrollar brevemente en este artículo dos argumentos que explican por qué no son apropiadas las evaluaciones estandarizadas para medir y valorar la diversidad y complejidad de la situación educativa durante la pandemia.

Primera cuestión: qué aprendizajes van a ser medidos

Las pruebas estandarizadas sirven para medir y clasificar, pero no para comprender. Son una forma, entre muchas posibles, de medición de los aprendizajes y, por lo tanto, miden sólo aquellos aprendizajes que pueden ser medidos. Los puntajes obtenidos a través de estas pruebas nos dicen muy poco acerca del conocimiento alcanzado en un área determinada y, mucho menos sobre capacidades como la imaginación, la creatividad, el pensamiento crítico, cuya medición, de ser posible, sería muy difícil de ser llevada a la práctica. Además, las pruebas no contemplan todo lo que se aprende en cada una de las áreas evaluadas. Siempre se realiza un recorte del currículo vigente para elaborar los ítems de una prueba estándar, que se aplican en todas las escuelas del país. Además, al construir las pruebas se seleccionan sólo aquellos contenidos que, al ser piloteados, muestran diferencias estadísticas (permiten discriminar) en el desempeño de los estudiantes. Por lo tanto, se dejan de lado, tanto los ítems que resuelven todos los estudiantes (o sea los contenidos más trabajados por los docentes), como los que presentan mayores dificultades en su resolución.

Aquí aparece la primera dificultad que tiene que ver con la diversidad de contenidos que fueron enseñados durante la pandemia. Es necesario conocer no sólo qué se estableció como contenido prioritario, sino también qué se pudo enseñar y aprender en las condiciones existentes. Si bien hubo directivas a nivel nacional y jurisdiccional sobre los contenidos a priorizar en las distintas áreas de conocimiento, es muy probable que cada docente haya realizado su propio recorte, priorizando ciertos saberes y no otros, a partir de factores tan disímiles como su propia percepción de los contenidos más importantes, las posibilidades brindadas por los soportes tecnológicos utilizados, las devoluciones de sus propios alumnos, etc. En ese sentido, las dificultades que puedan presentar los estudiantes al resolver algunos ítems de las pruebas estarían hablando, en una gran cantidad de casos, de saberes que simplemente no fueron enseñados durante la pandemia y no de saberes que no fueron aprendidos por los estudiantes.

Segunda cuestión: ¿cuáles han sido las condiciones para sostener los procesos de enseñanza y de aprendizaje durante la pandemia?

Actualmente existe cierto consenso acerca de que la información que aportan las pruebas estandarizadas debe ser complementada, por ejemplo, con información que permita evaluar también el contexto y las condiciones en que se producen los procesos de enseñanza y aprendizaje. De esta manera, se pueden interpretar los resultados de las pruebas de aprendizaje brindando información que constituya un insumo para la mejora de la práctica pedagógico-didáctica. Durante la pandemia, las posibilidades de desarrollar la enseñanza a partir del espacio del aula y de las escuelas como espacios de producción grupal e institucional se vieron interrumpidas. Lo mismo sucedió con ciertas situaciones estructurantes de los procesos de enseñanza y de aprendizaje propias de la presencialidad. Pensemos solamente en los procesos de comunicación y en los intercambios que se producían durante el período de aislamiento, en el mejor de los casos mediados por recursos tecnológicos varios y, en otros, por cuadernillos, fotocopias, etc. ¿Cómo se decodifican los aportes de los alumnos en este tipo de intercambios para estructurar la enseñanza? ¿Es posible, en esos contextos, transmitir no sólo saber sino también la relación con el saber? ¿En qué medida y de qué manera la interacción mediada por las pantallas pudo sustituir a la interacción en el espacio del aula? Estas son algunas de las preguntas cuyas respuestas están todavía en construcción. Los procesos de enseñanza y de aprendizaje tuvieron lugar en una diversidad de situaciones contextuales, definidas mayormente por las condiciones sociales, económicas, y tecnológicas con las que las familias contaban para acompañar los procesos de aprendizaje de sus hijos/estudiantes. Además, al quedar suspendido el efecto mediador de la escuela, los resultados de las pruebas de evaluación nos hablan fundamentalmente de las características socioeconómicas y culturales de los propios estudiantes y de sus familias.

Nos preguntamos entonces, en primer lugar, si es posible captar la diversidad de condiciones, contextos y recursos de los hogares donde se producen los procesos de aprendizaje durante la pandemia. En segundo lugar, si es lícito producir un conocimiento generalizable sobre estos aspectos (como el que se obtiene a través de cuestionarios o encuestas) en lugar de un conocimiento aplicable que trata de obtener información para transformar y mejorar las prácticas educativas. No podemos soslayar las respuestas a estas y otras preguntas similares si pensamos en un proceso de evaluación que no quede limitado a los meros resultados de una prueba estandarizada de aprendizajes. 

Por último, es importante mencionar otra cuestión que no es menor y que tiene que ver con la comparabilidad de los resultados de las pruebas de aprendizaje. Los resultados no sólo se analizan y se clasifican en los distintos niveles de desempeño en cada una de las aplicaciones, sino que se comparan con los resultados obtenidos en aplicaciones anteriores para analizar tendencias en cada área del conocimiento. Para ello, entre una evaluación y otra se mantiene un cierto número de ítems en común, que se denominan ítems de anclaje. Estos ítems permiten obtener una escala común para medir y comparar las competencias de dos evaluaciones sucesivas en el tiempo. En función de los argumentos desarrollados hasta acá, no existe certeza de que los contenidos abarcados por los ítems de anclaje fueran contemplados entre los contenidos priorizados durante la pandemia. Además, aunque estos contenidos se hubieran priorizado, en qué medida serían comparables con los resultados de pruebas anteriores que se realizaron en contextos totalmente diferentes, cuando ni siquiera podíamos imaginar la pandemia y sus consecuencias en el ámbito educativo.

En esta etapa política nos debemos como sociedad un profundo debate sobre el sentido de las evaluaciones estandarizadas en el contexto de la pandemia de la Covid 19.  Sólo a partir de una profunda reflexión se puede construir un proceso de evaluación que sirva realmente como una fuente de información para la toma de decisiones de políticas educativa.

***

Gloria y Loor es un medio completamente autogestivo. Aspiramos a que nuestrxs compañerxs puedan destinar tiempo para escribir sobre sus prácticas y reflexiones por ello creamos la Cooperadora de GyL donde ustedes nuestrxs lectorxs pueden ser benefactores y ser parte de sorteos y beneficios.

Si considerás que estos textos aportan a la reflexión, podés suscribirte con distintos montos mensuales.

Te estaremos eternamente agradecidxs, honor y gratitud.

Publicada el 31 de octubre de 2021.


Si te gusta lo que hacemos en Gloria y Loor podés apoyarnos asociándote a la Cooperadora de GyL.

Liliana Pascual

Doctora en Ciencias de la Educación, Universidad de Buenos Aires. Profesora de posgrado de UNLA y UNQ. Ex Directora Nacional de Información y Evaluación de la Calidad Educativa y ex Subsecretaria de Planeamiento, Prospectiva e Innovación del Ministerio de Educación de la Nación.

Notas relacionadas