La Inteligencia Artificial generativa le apunta a la tarea de educar en algunos puntos concretos: la evaluación es uno de ellos. Y obliga a repensar esta instancia, sobre todo en las ciencias sociales y las humanidades, donde la producción de texto cumple un rol fundamental.
Publicado originalmente en inglés en Substack el 22 de septiembre de 2025. Traducción: Manuel Jerónimo Becerra
Ni reír, ni llorar: comprender
León Trotsky citando a Baruch Spinoza
Las metáforas son tramposas, pero a veces ayudan. Supongamos que estás en un restaurant con amigos, te traen la cuenta, y tenés que dividir el monto total por el número de comensales. Habrá quien haga el cálculo en su cabeza, pero la abrumadora mayoría de nosotros agarraría el celular y usaría la app de la calculadora. Estoy seguro de que nadie sacaría papel y lápiz para hacer la cuenta a mano.
Ahora supongamos que estás tratando de enseñarle a una persona a dividir. Te basarías en sus conocimientos previos (sumar, restar, multiplicar), y a partir de ahí le explicarías el concepto, le darías ejemplos, la acompañarías haciendo ejercicios, la ayudarías a transitar los problemas. En cierto punto, querrías evaluar si aprendió a dividir. No se te ocurriría dejarle usar una calculadora. Tampoco se te ocurriría darle una evaluación domiciliaria porque no podrías saber si usó o no una calculadora, y en ese caso el examen estaría evaluando su honestidad más que sus habilidades matemáticas.
Los trabajos escritos domiciliarios enfrentan el mismo problema que este ejemplo hipotético. Durante décadas, el trabajo domiciliario (“trabajo práctico” en la secundaria, “parcial domiciliario” en la facultad) funcionó porque, para poder hacerlo, los estudiantes debían realizar un esfuerzo intelectual de análisis, síntesis y argumentación, y poner eso por escrito. Es cierto que uno de nuestros objetivos también era desarrollar sus capacidades de escritura, pero en general el objetivo del trabajo domiciliario era testear si los estudiantes habían consolidado y mejorado esos procesos cognitivos, más que su talento literario.
La situación cambió radicalmente en los últimos dos años. Ahora, con los chats de IA generativa que pueden producir textos sofisticados —especialmente si se les dan las instrucciones adecuadas—, ya no podemos asumir que un trabajo domiciliario prolijamente escrito implica que su autor alcanzó ciertos niveles intelectuales y cognitivos. Así como no podríamos saber si nuestro alumno de matemática usó una calculadora, tampoco podemos saber si un estudiante de Historia usó ChatGPT para analizar fuentes primarias o uno de Literatura apeló a Claude para hacer un análisis literario de un poema. Sencillamente no podemos. Aceptar esta realidad es el primer paso ineludible.
***
El segundo paso (más interesante en términos intelectuales) es aprovechar esta crisis para reflexionar acerca de lo que queremos lograr cuando enseñamos. Tal vez ayude interpretar esto en términos de un desfase entre los objetivos de aprendizaje y las modalidades de evaluación.
En el marco de las teorías constructivistas, el educador australiano John B. Biggs desarrolló el principio de “alineamiento constructivo” para diseñar actividades de enseñanza y aprendizaje en el nivel superior. Sus ideas fundamentales son que los estudiantes construyen significado a partir de lo que hacen para aprender, y que los docentes deben alinear las actividades de enseñanza y las evidencias de aprendizaje. Esto se relaciona con otra idea, la de “planificación inversa”, que plantea que cuando diseñamos una propuesta de enseñanza tenemos que tomar como punto de partida nuestros objetivos (¿qué es lo que realmente queremos que nuestros alumnos aprendan?), para luego y sobre esa base construir instrumentos de evaluación (¿cuál será la evidencia de que aprendieron?) y actividades (¿cómo lo van a aprender?) que están alineados con esos objetivos. Son las personas quienes construyen sus propios conocimientos, de manera que para que haya un aprendizaje significativo los objetivos, las actividades y las evaluaciones que propongamos como docentes tienen que apuntar en la misma dirección.
La IA generativa no cambió nuestros objetivos como docentes de Historia. Seguimos queriendo que los estudiantes aprendan las habilidades fundamentales del oficio del historiador: analizar críticamente fuentes primarias, contextualizar eventos en marcos históricos más amplios, construir argumentos sólidos basados en evidencia, sintetizar información de múltiples fuentes, escribir con claridad ideas complejas. Seguimos queriendo que desarrollen el instinto del historiador para formular buenas preguntas, para detectar prejuicios y problemas en las fuentes, para entender causalidades y cambios a través del tiempo. No hay motivos para entrar en pánico, porque los hábitos críticos de nuestra profesión gozan de buena salud, y seguirán así. En todo caso, tendremos que sumar nuevos objetivos (por ejemplo, el uso responsable de la IA generativa), pero ninguna habilidad fundamental del oficio ha quedado obsoleta.
Lo que la IA generativa sí hizo es socavar cómo hemos estado midiendo si los estudiantes han adquirido algunas de estas habilidades. Los trabajos y parciales domiciliarios ya no resultan pruebas confiables de que el aprendizaje se haya producido. Los chats de IA generativa impactan directamente en la “etapa 2” del proceso de planificación inversa (nuestra “evidencia aceptable” del aprendizaje). Todavía sabemos qué pretendemos que los alumnos aprendan (“etapa 1”), y aún podemos diseñar actividades para acompañarlos a llegar hasta ahí (“etapa 3”), pero ya no podemos confiar en nuestros métodos de evaluación.
***
Para pensar qué hacer al respecto necesitamos ser más precisos acerca de los momentos y formas específicos en que esta crisis impacta distintos momentos de la trayectoria de un estudiante. Personalmente, creo que el impacto no es uniforme a lo largo de toda las etapas del grado y el posgrado. Necesitamos un análisis más cuidadoso sobre el alineamiento constructivo en las distintas materias: en primer lugar, ser más claros sobre nuestros objetivos, para luego poder establecer qué estrategias de evaluación realmente pueden ser evidencia de ellos.
Mi impresión es que en los primeros años de una carrera de nivel superior, y en los cursos introductorios en general, el problema es manejable. En la mayoría de estas instancias buscamos que los estudiantes comprendan categorías históricas básicas, conozcan los eventos más relevantes y sus cronologías, aprehendan hechos importantes y sus actores, y comiencen a ver cómo diferentes períodos históricos y regiones geográficas se conectan entre sí. Un examen presencial escrito sigue funcionando bien para evaluar este tipo de aprendizajes. Un examen oral también: no hay necesidad de reinventar la pólvora acá.
Tampoco me preocupan tanto los talleres avanzados de investigación, seminarios reducidos, o la dirección de tesis. Como docentes y supervisores, podemos evaluar de cerca el desarrollo de los estudiantes, acompañándolos a lo largo del proceso, discutiendo borradores, ayudándolos a reenmarcar problemas y preguntas, tutoriando las decisiones que van tomando en sus investigaciones. Nuestra relación y diálogo intelectual con ellos es parte de la evaluación.
La dificultad más grande está en las instancias intermedias o avanzadas de las carreras de grado, y también en algunos cursos de maestría, donde los objetivos de aprendizaje están más centrados en habilidades intensivas que requieren de mayor práctica: análisis, síntesis, argumentación. Son momentos en que los estudiantes necesitan comenzar a pensar como historiadores: en este tipo de materias los parciales domiciliarios o pequeños trabajos de investigación fueron hasta ahora nuestros instrumentos de evaluación más comunes. Es precisamente en estas etapas de la carrera donde el desfase es más crítico.
***
¿Qué hacer? No creo que debamos abandonar todos los parciales domiciliarios y volver 100% a los exámenes presenciales. Pero hay que pensar alternativas. Una opción es que todo trabajo domiciliario escrito incluya una defensa oral obligatoria. Los estudiantes podrán seguir teniendo los momentos de reflexión propios de las instancias de escritura (y además necesitan aprender también esa habilidad), pero luego tendrán que poder sostener sus argumentos, explicar su razonamiento, enfrentar correcciones inesperadas, responder a preguntas.
De hecho, creo que en general deberíamos apoyarnos más en estrategias orales de evaluación: desde siempre fueron parte de los recursos de evaluación en la universidad, y por buenas razones. No me refiero únicamente a exámenes orales tradicionales, aunque esos también sirven. Pienso que, en las clases prácticas, hay que promover más momentos en que los estudiantes se “hacen cargo” de la clase y darles un peso mayor a la hora de calificar. Pedir que los estudiantes evalúen y revisen los trabajos de sus pares también es una buena idea: crea oportunidades para comprometerse con los argumentos de sus compañeros. Para participar activamente en esos intercambios tienen que mostrar una comprensión real de las producciones que han leído. Pedirle a los estudiantes que graben videos breves explicando sus reflexiones y análisis en diferentes etapas de un proyecto da muy buenos resultados: es como una “presentación oral domiciliaria” (desde ya, asumiendo que no leen un guión en voz alta); hay algo en la necesidad de articular ideas frente a una cámara que revela (o no) el trabajo intelectual auténtico.
Está claro que no son soluciones ideales, y creo que estamos todos haciendo experimentos para descifrar qué es lo que funciona mejor en diferentes contextos. Pero lo que me queda claro es que esta “crisis” nos va a obligar a hacernos preguntas fundamentales sobre lo que queremos lograr en las aulas. Los trabajos escritos domiciliarios funcionaron bien durante mucho tiempo, pero la masificación de la IA generativa es el fin de una época. Tal vez sea también una oportunidad para volver a pensar en cómo alinear nuestros objetivos, nuestros métodos y nuestras modalidades de evaluación. La única salida es la creatividad, la curiosidad y una mayor disposición a tener conversaciones honestas con nuestros estudiantes sobre cómo se produce realmente el aprendizaje.
Publicada el 6 de diciembre de 2025
Si te gusta lo que hacemos en Gloria y Loor podés apoyarnos asociándote a la Cooperadora