Evaluación educativa: hacia la construcción de un espacio de aprendizaje

Toranzos, Lilia Verónica

Servicios Personalizados

Revista

Articulo

Indicadores

Citado por SciELO

Links relacionados

Similares en SciELO

Otros
Otros

Permalink

Propuesta educativa

versión On-line ISSN 1995-7785

Propuesta educativa (Online) no.41 Ciudad Autonoma de Buenos Aires jun. 2014

DOSSIER: ENSEÑANZA Y EVALUACIÓN: DOS CARAS DE LA MISMA MONEDA

Evaluación educativa: hacia la construcción de un espacio de aprendizaje

Lilia Verónica Toranzos *

* Lic. en Ciencias de la Educación y Especialista en Planificación y Gestión de Políticas Sociales, Universidad de Buenos Aires. Responsable del área de Evaluación Educativa de la Organización de Estados Iberoamericanos y co-coordinadora del Sistema de Información sobre Tendencias Educativas en América Latina - SITEAL OEI/IIPE Buenos Aires. E-mail: ltoranzos@oei.org.ar

Resumen

La evaluación es una práctica habitual en el ámbito del sistema educativo y, a la vez, ha tomado un particular impulso su aparición en la agenda de políticas educativas de la región a partir de la década del noventa. Sin embargo, en ambos planos persisten las nociones de evaluación vinculadas con el control, la sanción y el predominio de una mirada centrada en señalar solo el error y lo ausente. La propuesta es recorrer algunas nociones conceptuales básicas que permitan identificar los términos de las tensiones que atraviesan hoy la concepción de evaluación educativa y, a partir de ello, proponer y promover prácticas de evaluación más enriquecidas que se constituyan en espacios de aprendizaje y reflexión orientados a la mejora de la educación. Tanto la generación de mayores capacidades técnicas para el desarrollo de procesos de evaluación más complejos, como el fortalecimiento de la legitimidad de los mismos constituyen hoy los mayores desafíos actuales en el área; por ello la discusión amplia y fundada sobre estos aspectos y la revisión de las prácticas actuales resultan un valioso punto de partida para la construcción de un espacio de aprendizaje.

Palabras clave: Evaluación Formativa; Evaluación Sumativa; Estándares; Aprendizaje

Abstract

Evaluation is a common practice in the field of education and has also gained momentum in the agenda of educational policies in the region starting in the 1990s. Yet in both planes of notion, evaluation parameters related to control, punishment and the predominance of a single point centered on errors still persist. The proposal is to cover some basic conceptual notions that identify the terms of tensions running through today's conception of educational evaluation and, based on this, propose and promote richer assessment practices to be established in areas of learning and reflection oriented in improving education. Both the generation of greater technical capabilities to develop more complex evaluation processes along with strengthening the legitimacy of these are currently the most important challenges in the area therefore, the comprehensive discussion of these issues and review of current practices are a valuable starting point for building a learning space.

Key words: Formative Assessment; Summative Assessment; Standars; Learning.

I. Evaluación educativa: una práctica conocida y un significado renovado

La evaluación es una actividad que siempre tuvo y tiene un lugar significativo en el espacio escolar. Existe un conjunto de dispositivos muy variados que se suponen desarrollados con propósitos de evaluación entre los que se pueden incluir: los exámenes y pruebas en sus versiones más conocidas, la presentación de trabajos monográficos por parte de los alumnos, el cuaderno de actuación de los docentes, una parte importante de las tareas que desempeña el supervisor escolar, las observaciones de clase por parte de los equipos directivos, etc. Todo esto supone acciones vinculadas a la evaluación. Sin embargo, cada una de ellas puede adquirir sentidos y dimensiones diferentes y, a su vez, desplegar consecuencias muy diversas. Entonces ¿de qué hablamos cuando hablamos de evaluación en el espacio del sistema educativo? y ¿más específicamente en el ámbito escolar?
En los últimos veinte años hemos asistido a la instalación de la problemática de la evaluación en el primer plano de la agenda educativa y con ello, a la expansión de las iniciativas evaluativas (en particular aquellas que son a gran escala), el desarrollo de investigaciones y producción bibliográfica específica, el surgimiento de perfiles profesionales especializados en el área y la inclusión de todo ello como objeto y sujeto de las políticas educativas. Esta misma situación la reflejó muy bien Ernest House (1993) en los Estados Unidos unos años antes cuando relata lo siguiente:

"Cuando comencé mi carrera en evaluación hace más de veinticinco años, reuní todos los trabajos que pude encontrar en una pequeña caja de cartón en un rincón de mi despacho y los leí en un mes. Desde entonces, la evaluación ha pasado de ser una actividad marginal desarrollada a tiempo parcial por académicos a convertirse en una pequeña industria profesionalizada, con sus propias revistas, premios, reuniones, organizaciones y estándares" (House, 1993: 1).

Todo este desarrollo reciente, más tardío en América Latina, generó un conjunto de efectos diversos tales como:
a. Promover la instalación de un discurso pedagógico que reconoce a la evaluación como un espacio de producción de insumos para los procesos de gestión asociados a la mejora de la calidad de la educación.
b. Generar una importante brecha entre este discurso pedagógico renovado y la práctica evaluativa concreta que tiene lugar en diferentes espacios del sistema educativo.
c. Abrir una serie de interrogantes conexos sobre qué es la calidad de la educación, y la necesidad de acotar la polisemia del concepto.

A pesar de los esfuerzos empeñados aún persiste un conjunto de significados frecuentemente atribuidos a la evaluación como son el del control externo, la función penalizadora, la sanción, la selección, el cálculo del valor de una cosa, el juicio sobre la suficiencia o insuficiencia de determinados aspectos o cualidades, el criterio para la administración de premios y castigos. Con mucha frecuencia las discusiones sobre la pertinencia o la utilidad de los procesos de evaluación en el ámbito del sistema educativo se basan en estos sentidos atribuidos que originan una severa disparidad de criterios.
Entre estas ideas, las relacionadas con la calificación -acción muy propia del ámbito escolar-, ha ido permeando sobremanera la definición de evaluación en su sentido más amplio y, a su vez, ha contribuido a la generación de un conjunto de estereotipos que dificultan modificar e instalar una práctica evaluadora renovada. En este sentido, la mayoría de las definiciones sobre evaluación se enmarcan en un plano que se puede denominar normativo. Es decir, en el deber ser que define un modelo ideal y se constituye en el referente evaluativo. La evaluación aparece solo como una probabilidad de determinar en qué medida las acciones realizadas se ajustan o no a ese patrón normativo y no tanto como una posibilidad de definir nuevas normas o bien recrear las existentes.
Este significado relativamente incompleto o poco robusto de evaluación no se plantea con un sentido constructivo, como una opción para revisar el proceso de enseñanza y su incidencia en los aprendizajes, para incidir directamente en la toma de decisiones en diferentes ámbitos definiendo el sentido de la orientación de tales acciones.
Por el contrario, a pesar que la afirmación sobre la necesidad de la evaluación como una herramienta fundamental para mejorar la calidad de los procesos de enseñanza y los aprendizajes es tan ampliamente incorporada y aceptada, es indudable que la práctica pedagógica en nuestras escuelas ha estado mayoritariamente caracterizada por una débil cultura de la evaluación. En la práctica escolar persiste aún con frecuencia la evaluación como un requisito formal con escaso o nulo valor pedagógico y como una instancia que se presenta y se concibe en forma escindida del resto de las actividades de enseñanza o de gestión pedagógica en general. El principal desafío consiste en promover la construcción de un concepto más comprensivo de evaluación.
La definición propuesta por T. Tenbrink (1981) además de simple propone un espacio de trabajo en tanto sostiene que "evaluación es el proceso de obtener información y usarla para formar juicios que a su vez se utilizarán en la toma de decisiones". La evaluación es un proceso que, en su esencia, produce información. La producción de esta información implica un esfuerzo sistemático e intencionado de aproximación al objeto evaluado. A la vez, esta información que produce la evaluación, genera un conocimiento de carácter retroalimentador, es decir, ilumina los objetos evaluados permitiendo poner de manifiesto aspectos o procesos que de otra manera permanecerían ocultos.

Foto de Néstor Fernández Sánchez, México.

Así es como posibilita una aproximación en forma más precisa y más fina a la naturaleza de ciertos procesos, las formas de organización de los mismos, los efectos, las consecuencias, los elementos intervinientes, y atribuye valor a esos procesos y a esos resultados. De este modo, todo proceso de evaluación contribuye a "dar cuenta" y a "darse cuenta" de cambios y apropiaciones, de logros y carencias, de modo de tomar decisiones fundamentadas a futuro.
La evaluación asume dos funciones interactivas, la retroalimentación y el dar cuenta. La visión de Eisner (1985) permite enriquecer los planteos anteriores:

"La evaluación como crítica educativa es válida y confiable cuando capacita a alguien (...) para ver lo que de otro modo permanecería oculto. De la misma manera que un crítico nos ayuda a ver en la película, en el cuadro, en el espectáculo, lo que de otra manera permanecería oculto, el evaluador "quien quiera que sea" tiene o debe tener solvencia (.) para ver y ayudar a ver aspectos ocultos de la situación - objeto" (op.cit: 11).

La definición de Tenbrink permite identificar tres elementos fundamentales que están en la base de todo proceso de evaluación:

a. recolección de información, imprescindible como punto de partida de todo proceso de evaluación;
b. producción de juicios de valor, no basta recoger sistemáticamente la información, sino que ésta ha de integrarse en valoraciones producto de la comparación con el o los parámetros construidos o constituidos y;
c. orientación hacia la toma de decisiones, constituye el elemento central del proceso de evaluación que lo diferencia de otro tipo de indagación. La orientación hacia la acción convierte a la evaluación en un elemento dinámico, en una herramienta, un medio que genera condiciones de posibilidad para la mejora y no en un fin en sí misma.

II. ¿Qué evaluar y para qué?

¿Qué evaluar? es la pregunta por el objeto de la evaluación que si bien parece simple, en la práctica no resulta de fácil resolución. En el espacio educativo se tiende a pensar en objetos múltiples de evaluación: los alumnos y estudiantes, el docente, los aprendizajes, las estrategias de enseñanza, la gestión pedagógica, los recursos empleados, la institución, un programa, etc. Cuando esto sucede y ni el objeto ni los sujetos de la evaluación resultan bien definidos se suele producir una reducción notable de las reflexiones sobre la evaluación y sus efectos a cuestiones meramente instrumentales o técnicas. Esto, en general, trae como consecuencia una mirada que empobrece el valor de los procesos de evaluación como instancias de construcción colectiva y producción de conocimiento.
La construcción del objeto de evaluación suele ser un proceso complejo relativamente espiralado que requiere de un ejercicio de aproximación sucesiva al mismo. A partir de una concepción sistémica de la realidad educativa resulta fundamental diferenciar aquello que se constituye en fuente y unidad de información en el marco de un proceso de evaluación y lo que efectivamente es el objeto de la misma.
Con frecuencia se puede pensar en al menos cuatro objetos bien diferentes como son los aprendizajes, las instituciones, el desempeño de los docentes y/o el sistema educativo¹; si bien tienen muchas implicancias mutuas constituyen entidades bien diferentes y suponen procesos de evaluación que conceptual y metodológicamente difieren mucho.
¿Cuál es la principal dificultad con la que se enfrenta esta tarea de definición del objeto? Las acciones de evaluación suelen aparecer recargadas sobre los alumnos como sujetos de las mismas y sus aprendizajes como aparentes objetos. Sin embargo, la falta de precisión sobre qué es lo que se quiere evaluar trae como consecuencia una serie de falacias de diferente orden como las que resultan de evaluar los aprendizajes de los alumnos para predicar sobre el desempeño de los docentes o sobre el funcionamiento institucional o sobre las políticas educativas o sobre el diseño curricular. Es imposible sostener que no existe relación entre unos y otros pero también es equívoco pretender que un mismo proceso de evaluación puede atender y dar respuesta a conjuntos de interrogantes tan diversos y complejos.
En este punto resulta útil recurrir a la noción de ámbito de la evaluación como un elemento complementario en la definición del objeto de evaluación. El ámbito refiere al espacio (locus) en el que acontece el proceso de evaluación y que plantea los límites dentro de los cuales tienen efecto los resultados de dicho proceso.
La pregunta por el ámbito de la evaluación determina la necesidad de precisar el alcance de la misma y el conjunto de herramientas e instrumentos que por su adecuación se seleccionarán para llevar a cabo dicho proceso, contribuyen a una mejor definición del alcance y el marco metodológico más adecuado a utilizar. La falta de identificación clara del ámbito en el que se desarrolla un proceso de evaluación, con frecuencia, trae como consecuencia algunas posibles falacias tales como (Toranzos, 2003):

- Desarrollar un proyecto de evaluación propio de un ámbito y extender el análisis y las conclusiones a otro ámbito diferente. Es frecuente sostener acciones de evaluación centradas en la evaluación de los aprendizajes y extender dichas conclusiones como suficientes para explicar el funcionamiento institucional o del sistema educativo.

- Utilizar el marco metodológico, las herramientas y los instrumentos propios de un ámbito específico para desarrollar acciones de evaluación dentro de otro ámbito. En ocasiones tiene lugar una suerte de abuso de las herramientas e instrumentos, un ejemplo simple lo ofrecen las diferentes formas de test o exámenes regularmente escritos y de estructura cerrada que están destinados a la evaluación de determinados tipo de aprendizajes, en forma masiva y con propósitos bien explícitos, sin embargo con mucha frecuencia se intenta utilizar estos instrumentos o criticar su utilización como los únicos posibles para la evaluación de los aprendizajes, dejando de lado la consideración del ámbito específico en que esta tiene lugar.
- Diseñar proyectos de evaluación que suponen la consideración de más de un ámbito simultáneamente sin reconocer las diferencias existentes y necesarias entre los mismos. Esto conduce a cierta pobreza de los resultados del proceso de evaluación, un planteo confuso, poco constructivo y el escaso aprovechamiento de las instancias de evaluación para la generación de aprendizajes relevantes alrededor del objeto de evaluación.

El tercer elemento de la tríada de un proceso de evaluación lo constituye la respuesta al interrogante por el propósito y la finalidad de la misma, es decir, por las consecuencias esperables de los resultados de evaluación. Quien aborda el diseño de un proceso de evaluación debe poder definir con claridad el para qué de esta iniciativa: ¿Qué decisiones se espera adoptar a partir de los resultados de la evaluación?
¿A quiénes alcanzan estas decisiones? ¿Qué preguntas se espera responder a partir de los resultados de la evaluación? ¿Cuáles son posibles propósitos de un proceso de evaluación de los aprendizajes de un grupo de alumnos? Entre ellos podemos mencionar:

a) acreditación y/o certificación de un conjunto de saberes (p.e. generar calificaciones, decidir la promoción de un curso o asignatura);
b) generar un ordenamiento para un proceso de selección (p.e. exámenes de ingreso);
c) toma de decisiones vinculadas con la mejora de algunos procesos (p.e información diagnóstica para planificar actividades de enseñanza al inicio o durante un curso);
e) establecimiento de incentivos o régimen de premios para individuos o instituciones (p.e. información para distribuir beneficios, becas, reconocimientos);
f ) rendición de cuentas por los resultados (p.e en el marco de informes de gestión destinados a donantes).

Si bien esta no es una enumeración exhaustiva nos permite ilustrar propósitos muy diversos que nos conducen, a su vez, a pensar en la necesidad de contar con instrumentos y procesos de evaluación de características también muy diferentes.
En el mismo sentido Scriven (1967) fue el primero en sugerir la distinción entre evaluación formativa y evaluación sumativa, para referirse a las principales funciones de la evaluación.
Más tarde Stufflebeam (1972) refiriéndose a esas mismas funciones sugirió la distinción entre evaluación proactiva, que sirve para la toma de decisiones, y evaluación retroactiva, que sirve para delimitar responsabilidades. Así es que en su función formativa la evaluación se concibe como un aporte central para la mejora y el desarrollo de una actividad; estas evaluaciones formativas, por ejemplo, ayudan al personal de la escuela a dirigir y mejorar el servicio escolar y proporcionan advertencias tempranas sobre cuáles serán los resultados sumativos finales si el enfoque presente no es corregido.
En su función sumativa, la evaluación puede utilizarse como rendición de cuentas, para certificar o para seleccionar. Por lo general se realizan evaluaciones sumativas a final del año escolar, al final de un proyecto de 2 o 3 años de trabajo. En general, estos esfuerzos se realizan para mantener la credibilidad externa o bien para responder a requisitos de responsabilidad externa. Robert Stake (1981) ofreció un ejemplo sencillo para distinguir entre una y otra función que a la vez enfatiza la distinción necesaria del tipo de decisiones que se adoptan a partir de los resultados de la evaluación, es decir, el para qué de la misma: "Cuando el cocinero prueba la sopa que ha hecho, su propósito es formativo. Mientras que cuando los comensales prueban la sopa, el carácter de esa evaluación es sumativa".
En síntesis, la definición del objeto, el ámbito y el propósito en conjunto constituyen el corazón de toda iniciativa de evaluación. Joan Mateo (2000) expresa con mucha claridad la complejidad intrínseca de toda evaluación cuando señala que en ella se produce una situación paradojal que no tiene lugar en otras actividades de producción de conocimiento: aquello que es sustantivo y le proporciona el sentido a la evaluación que es la formulación de juicios y asignación de valor a aquello sobre lo que centra su actividad, no es lo que la legitima. Mientras que lo que legitima a la evaluación como práctica y justifica su desarrollo es finalmente la mejora del objeto evaluado. Esta duplicidad de objetivos permite identificar aquello que le otorga carácter propio a la evaluación y, a la vez, confirmar la complejidad que implica en tanto actividad de producción de conocimiento. Al procurar precisar las razones y propósitos de la evaluación siempre habrá que tener en cuenta la necesidad de sostener esta doble responsabilidad, por una parte garantizar la validez en cuanto al resguardo técnico que permite asegurar la precisión de los instrumentos que se utilizan y la calidad de la información que se genere; y por la otra, la credibilidad en tanto se deriven del proceso de evaluación acciones de mejora.

III. El desafío de construir criterios de evaluación

Si retomamos la definición de Tenbrink el componente vinculado con la formulación de juicios de valor se destaca como un elemento que diferencia la tarea de evaluación de otras actividades de indagación y producción de conocimiento como es la investigación. Esta acción valorativa es un rasgo distintivo que no está exenta de dificultades y que se supone el resultado del análisis comparativo entre la información que se ha recolectado y un conjunto de parámetros o criterios que permiten concluir y valorar aquella porción de la realidad que concentra nuestra atención. Es decir, la construcción y definición de los criterios sobre los cuales se elaboran los juicios forman parte de las tareas más arduas dentro del proceso de evaluación en el ámbito educativo.
En algunos países se han planteado procesos amplios y complejos de construcción de criterios de carácter nacional o regional sobre algunos aspectos del quehacer educativo y, al ser adoptados en forma generalizada e instalarse como referencia, por una parte facilitan notablemente la tarea del evaluador en tanto se adoptan criterios homogéneos y, por la otra, generan un entramado particular y un proceso complejo y sostenido destinado a la construcción de consensos y legitimidad de los mismos. Así surge el concepto de estándar o estándares que son aquellos criterios o parámetros que cuentan con suficiente legitimidad y consenso para su utilización en forma generalizada por algún período. Algunos países de la región cuentan con un desarrollo significativo en la materia tales como Chile², Ecuador³, Colombia⁴, entre otros.
Las características del sistema educativo argentino y la propia estructura federal, sumado a cierta tradición en la producción de conocimiento específico y de gestión dentro del sistema e incluso aspectos vinculados con nuestra cultura institucional, convierten en muy dificultoso e improbable pensar en este tipo de definición consensuada a gran escala del tipo de los estándares. Sin embargo, la idea de construcción de criterios acotada a un proceso de evaluación específico sí aparece como muy potente y resulta un motor interesante para movilizar experiencias, por ejemplo, a nivel institucional.
En este sentido la definición de criterios se plantea como un aspecto ineludible en todo proceso de evaluación y, a su vez, se transforma en un desafío importante que permite abrir un espacio de aprendizaje y de reflexión sobre aquello que se quiere evaluar, que se constituye en uno de los efectos positivos más elocuente de todo proceso de evaluación.
Las definiciones adoptadas hasta ahora nos permiten concluir que los procesos de evaluación además de complejos constituyen un interesante desafío en tanto espacio productor de conocimiento reflexivo sobre las acciones desarrolladas. A la vez es posible entender que una evaluación bien fundada es aquella que presenta algunos atributos básicos como la utilidad, en tanto se la concibe como respuesta a algún tipo de necesidad por parte de los usuarios. La viabilidad por cuanto se requiere un proceso de trabajo realista que observa criterios de prudencia y moderación en las acciones que implica; que debe desarrollarse en un marco legal y ético, respetando a los actores involucrados y a quienes de una u otra manera se vean afectados por los resultados del dicho proceso; es decir debe ser apropiado. Y por último también se reclama precisión, es decir, se espera que la evaluación sea valiosa en tanto produzca información técnicamente adecuada sobre aquellos aspectos que se propone valorar.

IV. La evaluación de los aprendizajes: las pruebas estandarizadas y la evaluación en el aula

La inclusión de la problemática de la calidad de la educación en la agenda educativa de los países de América Latina a partir de los años noventa y la expansión de las iniciativas de evaluación educativa como forma de respuesta a estas inquietudes generó en pocos años un nutrido mapa de experiencias de evaluación a gran escala que adquirieron dos expresiones diferentes aún vigentes: los dispositivos nacionales de evaluación y los estudios internacionales que reconocen un origen entrelazado. Hilda Lanza (2008) reseña con claridad el origen de estas iniciativas:
El primer movimiento en este sentido es heredero de las experiencias acontecidas, fundamentalmente durante la década de los sesenta en los EEUU, en torno al tema de la producción de criterios homogéneos para la acreditación del pasaje de los alumnos de un estado a otro y de los intentos de estandarización de los resultados educativos enunciados en términos de objetivos. La segunda de las ondas, se generó en EEUU a partir de los años ochenta a la luz del informe que produjeron las pruebas académicas realizadas por la administración republicana y difundidas a través del informe titulado "Nation at Risk". El carácter controlador impreso a esta acción condicionó la reaparición de las primeras discusiones referidas a acciones de evaluación en el contexto latinoamericano e inició una fuerte polémica que tardó varios años en ser superada. La tercera de estas ondas proviene de Europa y de los denominados estudios internacionales que reconocen su inicio hacia 1965, año en que "la IEA (Asociación Internacional para la Evaluación del rendimiento escolar) estaba terminando su primera gran encuesta internacional de alumnos en matemática" (Bottani, 2006).
La influencia de la primera de las ondas expansivas quedó acotada en la mayoría de los países de la región a los ámbitos de la formación e investigación universitaria. Es recién a partir de la segunda onda expansiva que surgen en algunos países experiencias más o menos complejas, con cierto nivel de institucionalidad y que incluyen la aplicación de instrumentos (pruebas y cuestionarios) a gran cantidad de estudiantes con el objetivo de producir información sobre los resultados del aprendizaje.
Un breve análisis de los primeros dispositivos de evaluación instalados en América Latina durante los años noventa, permite identificar cuatro perfiles de casos diferentes:

a. Acciones de evaluación orientadas a las tareas de acreditación de niveles educativos.
b. Sistemas de evaluación, con periodicidad en los procesos de aplicación de instrumentos de medición con alcance nacional, cuya tarea se orienta a la producción de información sobre logros de aprendizaje y acerca de los contextos que los producen.
c. Experiencias aisladas de evaluación de aprendizajes ligadas a diagnósticos situacionales o en etapa de validación de ítems o en etapa de pilotaje de instrumentos, pero que aún no conforman un sistema.
d. Experiencias de medición de resultados realizadas en el marco de las denominadas pruebas regionales e internacionales sin sostén en ámbitos nacionales dedicados exclusivamente a la evaluación.

Más allá de las variaciones de organización y de tiempo en el proceso de su instalación, en todos estos casos se ha recorrido un camino similar signado por los esfuerzos orientados a, por un lado, desarrollar competencias técnico-científicas en los ámbitos responsables de la evaluación a través de la capacitación de los recursos humanos que allí desempeñan sus tareas estableciendo relaciones con otros ámbitos, como las universidades y centros de investigación y, en otro sentido, a promover la utilización de la información sobre resultados educativos para la formulación y reorientación de las políticas, programas y proyectos y también para la reflexión y los debates en torno a la calidad educativa.
Los propósitos, es decir el ¿para qué se evalúa?, se expresan a través de los objetivos que los sistemas se proponen cumplir. En general, en todos los casos estos objetivos se caracterizan por el intento de incidir en las políticas de mejora y en las decisiones que orientan el diseño y desarrollo de estas políticas, siempre a partir de una información panorámica sobre algunos aspectos considerados centrales en el cumplimiento de los objetivos del sistema educativo.
Pero, una mirada a las tareas, es decir, al ¿qué evalúan?, permite ver que las experiencias suelen concentrarse en la evaluación de los aprendizajes de los alumnos en algunas áreas de conocimiento y en determinados momentos de su trayectoria escolar. Esto se propone mayoritariamente a través de un tipo de pruebas o test que es escrito y con predominancia de preguntas cerradas. Muy pocas experiencias proponen variantes metodológicas significativas y tampoco suelen incursionar en la evaluación del desempeño de los docentes, las instituciones, el currículo, las políticas educativas, los proyectos, etc.
El desarrollo de los estudios internacionales de evaluación en el espacio de América Latina es más reciente, en algunos casos porque los estudios lo son y porque la adhesión de algunos países de la región a los mismos está cercana en el tiempo. Si bien actualmente el estudio PISA de la OCDE es el más conocido, aunque no ha sido el único ni el primero. A continuación se presenta una breve síntesis de los principales estudios internacionales en los que participan algunos países de la región.

Estudio Regional Comparativo y Explicativo - Laboratorio Latinoamericano de Evaluación de la Calidad de la Educación (LLECE). Orealc/UNESCO
Estudio centrado en los aprendizajes de los alumnos de educación básica (3° y 6°) en las áreas de matemática, lengua y ciencias naturales (a partir del 2006, en 6°)
Ediciones: 1997 - 2006 - 2013
Países que participan: la mayoría de los países de América Latina, Argentina ha participado en todas las ediciones.

LAMP - Instituto de Estadísticas de UNESCO
Estudio centrado en evaluar las capacidades y destrezas de lectura, escritura y cálculo en la población joven y adulta.
Solo se desarrolló en 2003 y solo ha participado Paraguay de América Latina.

TIMSS - Asociación Internacional para la Evaluación del Rendimiento Educativo (IEA)
Estudio centrado en evaluar logros educativos en las áreas de matemática y ciencias naturales en estudiantes de 4° y 8 ° grado de la educación básica.
Ediciones: 1995 - 1999 - 2003 - 2007 - 2011. Participaron⁵: Argentina, Chile, Colombia, El Salvador, Honduras y México.

PIRLS - IEA Estudio centrado en evaluar logros educativos en el área de la comprensión lectora en alumnos que finalizan el 4° grado de educación básica.
Ediciones: 2001 - 2006 - 2011. Participaron: Colombia y Honduras⁶.

CIVED - IEA Estudio centrado en los aprendizajes cognitivos y actitudinales vinculados con el área de la educación cívica en estudiantes de 8° de educación básica.
Ediciones: 1999 - 2000. Participaron: Chile y Colombia.

ICCS - IEA Estudio centrado en evaluar competencias ciudadanas en alumnos de 14 años. Ediciones: 1971 - 1999 - 2009. Participaron: Chile, Colombia, México y Paraguay.

SITES - IEA Estudio centrado en analizar el uso de TIC's por parte de docentes y estudiantes de 8° de educación básica en los procesos de enseñanza y aprendizaje de matemática y ciencias naturales.
Ediciones: 1996 - 2006. Participó Chile

TEDS-M - IEA Estudio centrado en la evaluación de la formación docente en el área de matemática para la educación básica y la escuela secundaria obligatoria. Ediciones: 2007/2008. Participó Chile

PISA - Estudio Internacional de Evaluación de Alumnos (OCDE)
Es una evaluación estandarizada desarrollada por los países miembros de la OCDE e invitados que es aplicada a los alumnos de 15 años escolarizados. Se centra en evaluar la adquisición de competencias en las áreas de comprensión lectora, matemática y ciencias naturales. Se aplica cada 3 años a partir del año 2000.
Los países de América Latina han ido incrementando su participación, al menos han participado de una edición: Brasil, Chile, Colombia, Costa Rica, México, Panamá, Perú, y Uruguay. Argentina ha participado en todas las ediciones⁷.

TALIS - OCDE
Estudio centrado en el análisis de las características de los docentes, las prácticas de enseñanza y de las instituciones educativas en tanto condiciones que permiten formar estudiantes con buen rendimiento escolar.
Ediciones: 2008 - 2013. Participaron Brasil y México.

Estas experiencias tanto nacionales como internacionales, de evaluaciones a gran escala, generaron y generan intensos debates que manifiestan posiciones enfrentadas y tensan las reflexiones hacia extremos que, con frecuencia, se perciben como irreconciliables al postular marcos metodológicos diferentes de trabajo para producir información sobre el aprendizaje de los alumnos.
Esta tensión con frecuencia se expresa en dos conjuntos de argumento. Por una parte el cuestionamiento a los aspectos técnicos -todos o algunos- de un determinado proceso de evaluación, como por ejemplo el tipo de instrumentos que se utiliza, el marco metodológico adoptado, los procesos de selección de la población a ser evaluada, por enumerar algunos. Por otra parte, suele discutirse la legitimidad de origen del propio proceso de evaluación: ¿quién puede evaluar? En ambos casos lo que se produce es un severo empobrecimiento de la práctica de evaluación ya que la discusión suele impedir la percepción del proceso de evaluación como un espacio para el aprendizaje y la mejora en sentido amplio.
¿Qué se puede decir sobre las prácticas de evaluación en el aula? Si bien estas prácticas tienen como eje también el aprendizaje de los alumnos, difieren sustantivamente de las evaluaciones a gran escala. Mientras estas proveen una visión macroscópica, con frecuencia poco contextualizada y que promueven formatos y análisis estandarizados, las estrategias de evaluación en el aula debieran generar una información detallada de las trayectorias de cada uno de los alumnos a partir de una comprensión holística de los procesos de enseñanza y de un menú amplio de perspectivas y formas de abordaje.
Desde el punto de vista del alumno, deseablemente, la evaluación se debe fusionar con el aprendizaje permitiendo convalidarlo y reorientarlo. De este modo, le permite conocer su progreso en relación con las expectativas curriculares a fin de ajustar sus esfuerzos, identificar deficiencias y localizar dificultades y contribuir a revisar y ajustar estrategias de aprendizaje.
Desde el punto de vista del docente, deseablemente, la evaluación de los aprendizajes debe actuar como reguladora del proceso de enseñanza. En tanto le permite apreciar los logros de los estudiantes, revisar y ajustar las estrategias de enseñanza, la planificación y las estrategias de evaluación.
Retomando los conceptos revisados en la primera parte, podemos destacar al menos tres aspectos que contribuyen a la construcción de procesos de evaluación más provechosos en el marco del trabajo en el aula. Ellos son: la integración de la evaluación a la enseñanza, implica la prevalencia de la evaluación de carácter formativo por sobre otros. Ello no requiere necesariamente de instancias formales de evaluación (administración de pruebas) sino que puede resolverse con la introducción de procedimientos relativamente sencillos e informales o con el aprovechamiento de las actividades que ya se realizan desde una perspectiva evaluativa.
Otro aspecto significativo es la revalorización de la función de retroalimentación, que apunta a ofrecer al alumno información pertinente, en detalle y a tiempo acerca de su desempeño y orientaciones acerca de cómo mejorarlo. Esta información puede derivarse de la evaluación formativa, pero también de las instancias de evaluación parcial.
El tercer elemento es la explicitación de los criterios de evaluación a los estudiantes: esto responde a dos conjuntos de preocupaciones: a) la necesaria transparencia de los proceso evaluación y, b) el resaltar el papel de la evaluación como un elemento que contribuye al desarrollo de procesos metacognitivos, es decir de reflexión activa de los alumnos sobre su propio proceso de aprendizaje.
Si bien la experiencia más frecuente es la de suscribir a esta mirada antagónica que coloca en un extremo las evaluaciones a gran escala y en el otro las estrategias de evaluación que los docentes desarrollan en el marco de su tarea cotidiana en el aula, es importante destacar que solo una mirada más articulada de estas experiencias van a permitir consolidar una práctica de evaluación más constructiva. En particular, desde la comprensión de las diferencias que existen entre los objetos, fines, ámbitos, herramientas, así como de los usos y consecuencias de la información que producen y que se proponen cada uno de estos espacios.

V. A modo de cierre

Este recorrido por algunos aspectos conceptuales y metodológicos está inspirado en la preocupación por promover una mirada constructiva de los procesos de evaluación educativa. En este sentido parece posible y deseable alentar el desarrollo de experiencias reflexivas sobre diferentes aspectos del quehacer educativo, en particular desde las propias instituciones educativas. Esto supone entender a la evaluación como una fuente significativa de insumos para mejorar la gestión pedagógica de la escuela e integrarse en los procesos de planificación institucional.
En segundo lugar cabe tener en cuenta que estos procesos de evaluación permiten generar una instancia de aprendizaje compartido que brinda racionalidad y genera procesos altamente democratizadores al interior de las instituciones. Resulta imprescindible la consideración de aspectos éticos derivados de las acciones de evaluación como los son: el consentimiento informado, la devolución de la información, la transparencia de los criterios y procesos involucrados, la comunicabilidad de la información, etc.
Pérez Juste (2000) expresa con claridad la conjunción de características que debe observar un proceso de evaluación en tanto destaca el carácter integral del mismo en la medida que procure abarcar la realidad educativa en su conjunto y además lo haga de un modo armónico; el carácter integrado en la medida en que la evaluación se constituya en un componente activo dentro del proceso de gestión y no como una actividad segmentada, agregada o yuxtapuesta; y finalmente el carácter integrador en tanto una dimensión activa y dinámica en la armonización de los medios al servicio de la finalidad de la evaluación.
Finalmente, cabe tener presente que en la última década se asiste a una suerte de desplazamiento del concepto de evaluación formativa hacia el de evaluación para el aprendizaje (William: 2011) que complejiza y amplia el concepto, ya que se orienta a pensar en la evaluación como un proceso que tiende a ser continuo, que destaca el efecto retroalimentador de la información para los docentes y en especial para los estudiantes. El aspecto más importante de esta nueva perspectiva es el lugar destacado que ocupa la idea de progreso, y esta es la idea más fértil. A la hora de valorar los resultados de la acción educativa se requiere un énfasis manifiesto en el reconocimiento de los avances individuales y colectivos respecto a un punto de partida reconocido y no solo la comparación respecto a criterios únicos y estandarizados. El adecuado balance entre ambos componentes van a permitir orientar procesos de evaluación más provechosos e incrementar la capacidad de reflexión y mejora de las prácticas educativas en diferentes niveles de gestión.

Notas

¹ A esta enumeración de objetos de evaluación se pueden agregar los proyectos o programas educativos, el diseño curricular, las políticas educativas, etc.

² MARCO DE LA BUENA ENSEÑANZA http://www.docentemas.cl/docs/MBE2008.pdf

³ ESTANDARES DE CALIDAD EDUCATIVA http://educacion.gob.ec/wp-content/uploads/downloads/2012/09/Presentacion_Estandares.pdf

⁴ ESTANDARES BASICOS DE COMPETENCIAS http://www.mineducacion.gov.co/cvn/1665/article-116042.html

⁵ Los países enumerados han participado en forma alternativa en al menos una edición.

⁶ Ídem anterior

⁷ Sin embargo durante los años 2001/2002 quedó interrumpido el trabajo en el marco del estudio.

Bibliografía

1. Bottani, N. (2006), "La más bella del reino: el mundo de la educación en alerta por la llegada de un príncipe encantador", en Revista de Educación, N° Extraordinario 2006 PISA, España, Ministerio de Educación y Ciencia. [ Links ]

2. Eisner, E. W. (1985), The Art Of Educational Evaluation: A Personal View, East Sussex, The Falmer Press, Lewess. [ Links ]

3. House, E. (1993), Evaluación, ética y poder, Madrid, Morata. [ Links ]

4. Lanza, H. (2008), Las políticas de evaluación educativa en América Latina, Buenos Aires, Mimeo. [ Links ]

5. Mateo, J. (2000), "La evaluación educativa, su práctica y otras metáforas, en Cuadernos de Educación, Barcelona, ICE-Horsori. [ Links ]

6. Pérez Juste, R. (2000), "La evaluación de programas educativos: conceptos básicos, planteamientos generales y problemática", en Revista de Investigación Educativa, Madrid. [ Links ]

7. Scriven, M. (1967), "The methodology of evaluation", in R. W. Tyler , R. M. Gagné y M. Scriven (Eds.), Perspectives of curriculum evaluation, Chicago, IL Rand McNally, pp. 39-83. [ Links ]

8. Stake, R. (1981), en Santos Guerra, M. (1990), Hacer visible lo cotidiano. Teoría y práctica de la evaluación cualitativa de los centros escolares, Madrid, Akal. [ Links ]

9. Stufflebeam , D. L. (1972), "The relevance of the CIPP evaluation model for educational accountability", SRIS Quarterly, 5 [ Links ]

10. Tenbrink, T. D. (1981), Evaluación. Guía práctica para profesores, Madrid, Narcea. [ Links ]

11. Toranzos, L. (2003), "Los ámbitos de la evaluación educativa y algunas falacias frecuentes", disponible en http://www.oei.es/calidad2/falacias.htm [ Links ]

12. William, D. (2011), Embedded Formative Assessment, Indiana, Solution Tree Press. [ Links ]