Materialidad de Impacto

Evaluación de programas sociales: tipos, métodos y cómo elegir el que necesita

Por Innoval 9 de junio de 2026 12 minutos de lectura

La evaluación de programas sociales no es un solo estudio: son cuatro evaluaciones distintas, y contratar la equivocada cuesta tiempo, dinero y, a veces, la continuidad de un buen programa. Saber cuál pedir es la mitad del trabajo.

Una organización rara vez necesita "una evaluación" a secas. Necesita responder una pregunta concreta: ¿el programa está bien diseñado?, ¿se está ejecutando como debía?, ¿logró lo que se propuso?, ¿ese logro fue gracias al programa o habría pasado igual sin él? Cada una de esas preguntas pide un tipo de evaluación de programas sociales distinto. Y pedir una evaluación de impacto cuando el problema real es de ejecución sale caro, tarda meses y, al final, no responde lo que de verdad estaba fallando.

Acá ordenamos el panorama: qué es la evaluación de programas sociales, los cuatro tipos que existen, qué pregunta responde cada uno y cómo elegir según la decisión que tiene enfrente. Si lo que busca es el detalle de los métodos para aislar el efecto de un programa, el artículo sobre qué es la evaluación de impacto social y cómo se hace entra a fondo en esa parte.

¿Qué es la evaluación de programas sociales?

La evaluación de programas sociales es un proceso sistemático y basado en evidencia que examina el diseño, la ejecución y los resultados de un programa, proyecto o política para decidir si conviene mantenerlo, ajustarlo, escalarlo o cerrarlo. Es una forma de investigación aplicada: no busca conocimiento por el conocimiento, sino producir información útil para una decisión específica.

El Comité de Ayuda al Desarrollo de la OCDE (OCDE-CAD) define la evaluación como la valoración sistemática y objetiva de una intervención, su diseño, ejecución y resultados, con el fin de determinar su pertinencia, eficacia, eficiencia, impacto y sostenibilidad. Esos cinco criterios son el lenguaje común de la evaluación en cooperación y sector público, y conviene tenerlos presentes porque casi cualquier término de referencia los menciona.

Evaluar no es desconfiar del programa. Es darle la prueba que necesita para sobrevivir a la próxima decisión de presupuesto.

Los cuatro tipos de evaluación de programas sociales

Hay muchas clasificaciones en la literatura, pero en la práctica una organización elige entre cuatro tipos, según el momento del programa y la pregunta que necesita responder. No compiten entre sí. De hecho, muchas veces se hacen en secuencia, una en cada etapa de la vida del programa.

1. Evaluación de diseño (o evaluabilidad)

Revisa la lógica interna del programa antes de que arranque o en sus primeras etapas. Pregunta: ¿el problema está bien definido?, ¿la teoría del cambio es plausible?, ¿las actividades conducen razonablemente a los resultados esperados?, ¿el programa será evaluable más adelante? Es la evaluación más barata y la más rentable, porque corregir un diseño en el papel cuesta una fracción de corregirlo después de tres años de ejecución.

2. Evaluación de proceso (o de implementación)

Examina cómo se está ejecutando el programa en la realidad, no en el documento. Mira la cobertura, la calidad de la entrega, los cuellos de botella, la fidelidad entre lo planeado y lo que ocurre en terreno. Responde a "¿por qué el programa no está funcionando como esperábamos?" mucho antes de que el problema aparezca en los resultados. Es el tipo indicado cuando hay sensación de que algo no fluye, pero no se sabe dónde.

3. Evaluación de resultados

Mide los cambios observados al final o durante el programa: cuántas personas mejoraron su situación, qué indicadores se movieron, qué metas se cumplieron. Es útil para rendir cuentas y para documentar logros, pero tiene un límite importante que se suele pasar por alto: observar que algo mejoró no prueba que el programa lo causó. Las personas pudieron mejorar por la economía, por otro programa o por su propio esfuerzo. Para esa pregunta hace falta el cuarto tipo.

4. Evaluación de impacto

Es la más exigente. Construye un grupo de comparación para estimar qué habría pasado con los participantes si el programa no hubiera existido (el contrafactual) y así aislar la parte del cambio que es atribuible al programa. Es la única que permite afirmar, con respaldo metodológico, que el resultado ocurrió gracias a la intervención y no a otra cosa. Por eso es la que piden los financiadores cuando hay una inversión grande en juego o una decisión de escalar.

TipoPregunta que respondeCuándo conviene
Diseño¿El programa está bien planteado y será evaluable?Antes de arrancar o en el primer año
Proceso¿Se está ejecutando como debía?Durante la ejecución, ante señales de problemas
Resultados¿Qué cambió al final del programa?Al cierre o en hitos, para rendir cuentas
Impacto¿El cambio fue gracias al programa?Para justificar continuidad, escalar o decidir inversión
Los cuatro tipos de evaluación a lo largo del ciclo de un programa Una línea de tiempo del programa, de inicio a cierre, con los cuatro tipos de evaluación ubicados en el momento donde cada uno aporta más: diseño al inicio, proceso durante la ejecución, resultados al cierre e impacto después, para probar atribución. CICLO DEL PROGRAMA Inicio Ejecución Cierre y después 01 Diseño ¿Bien planteado y evaluable? 02 Proceso ¿Se ejecuta como debía? 03 Resultados ¿Qué cambió al final? 04 Impacto ¿Fue gracias al programa? La pregunta de su decisión define cuál contratar. Los cuatro pueden hacerse en secuencia a lo largo de la vida del programa.
Los cuatro tipos de evaluación, según el momento del programa en que cada uno aporta más.

Cómo elegir el tipo correcto

La elección no depende de cuál suene más riguroso, sino de tres factores concretos:

  1. La decisión que tiene enfrente. Si va a defender el presupuesto del programa ante una junta o un donante, necesita evaluación de impacto. Si quiere mejorar la operación del próximo ciclo, una de proceso. Si el programa aún no arranca, una de diseño. La decisión manda sobre el método, nunca al revés.
  2. El momento del programa. No se puede evaluar el impacto de algo que no ha generado efectos todavía, ni reparar un diseño que ya lleva años corriendo. Cada tipo tiene su ventana.
  3. Los datos y el presupuesto disponibles. Una evaluación de impacto rigurosa exige datos de los participantes, una teoría del cambio y la posibilidad de construir un grupo de comparación. Si esas piezas no existen, lo honesto es construirlas primero, o elegir un tipo de evaluación que la realidad sí permita.
El error más caro

Contratar una evaluación de impacto sin verificar antes que el programa sea evaluable. Si no hay línea base, ni datos de comparación, ni una teoría del cambio clara, ninguna técnica estadística rescata esa evaluación. El dinero se gasta y la pregunta queda sin responder. Por eso el primer paso serio nunca es medir: es revisar si se puede medir.

Los métodos: cómo se construye la evidencia

Dentro de cada tipo de evaluación conviven métodos cualitativos y cuantitativos, y las mejores evaluaciones suelen combinarlos. Los métodos cualitativos (entrevistas, grupos focales, observación en terreno) explican el porqué y el cómo: por qué un componente funciona, cómo lo viven los participantes. Los cuantitativos miden cuánto y para cuántos.

En la evaluación de impacto, los métodos cuantitativos se vuelven el centro, porque el reto es estimar el contrafactual. El Banco Mundial documenta en su manual de referencia los principales diseños cuasiexperimentales: diferencias en diferencias, emparejamiento o matching estadístico, regresión discontinua, variables instrumentales y controles sintéticos. La regla es la misma en todos: el método correcto es el que mejor se ajusta a los datos y a la decisión, no el más sofisticado en abstracto. El artículo sobre métodos de evaluación de impacto explica cada uno con ejemplos.

Cada vez más, la analítica de datos y el aprendizaje automático complementan estos métodos, sobre todo para focalizar mejor un programa o anticipar quién está en riesgo. No reemplazan el diseño de evaluación, lo potencian. Sobre cuándo aporta valor real, vale la pena leer machine learning en programas sociales.

Qué se aprende evaluando, más allá del informe

La experiencia de evaluar programas sociales en distintos sectores deja patrones que conviene conocer antes de empezar, porque ahorran tropiezos predecibles.

El primero: la evaluación de impacto rinde mucho más cuando se planifica al inicio del programa, no al final. Innoval ha trabajado evaluaciones de impacto cuasiexperimentales en programas reales, como las tres evaluaciones de inclusión digital del Fideicomiso BCR y FONATEL, con análisis diferenciado por programa, segmento y territorio. La diferencia entre una evaluación que fluye y una que se vuelve un rescate metodológico casi siempre se decide en si hubo o no una línea base y datos de comparación desde el primer día.

El segundo: los datos administrativos que la organización ya tiene suelen valer más de lo que cree. El análisis del programa de transferencias Avancemos para UNICEF y el PANI partió de datos existentes para construir, con aprendizaje automático, un perfil de riesgo de exclusión educativa. No siempre hace falta un levantamiento costoso en campo: a veces el dato útil ya está, sin ordenar.

El tercero: el valor de una evaluación se mide por la decisión que habilita, no por el grosor del informe. Una evaluación que termina en un tablero que la gerencia usa cada trimestre vale más que un documento impecable que nadie abre. Otros casos están documentados en la página de clientes.

Preguntas frecuentes

¿Qué es la evaluación de programas sociales?

Es un proceso sistemático que examina el diseño, la ejecución y los resultados de un programa social para decidir si conviene mantenerlo, ajustarlo, escalarlo o cerrarlo. No es un solo tipo de estudio: agrupa varias evaluaciones distintas según la pregunta que la organización necesite responder.

¿Cuáles son los tipos de evaluación de programas sociales?

Los cuatro tipos principales son evaluación de diseño (revisa la lógica del programa antes o al inicio), evaluación de proceso (examina cómo se ejecuta), evaluación de resultados (mide qué se logró) y evaluación de impacto (aísla cuánto del cambio es atribuible al programa frente a lo que habría ocurrido sin él).

¿Cuál es la diferencia entre evaluación de resultados e impacto?

La evaluación de resultados mide los cambios observados al final del programa, sin probar que el programa los causó. La evaluación de impacto va más allá: construye un grupo de comparación para estimar qué habría pasado sin el programa y así aislar el efecto que es atribuible a la intervención.

¿Cómo se elige qué tipo de evaluación hacer?

Se elige según la decisión que se necesita tomar y el momento del programa. Si el programa aún no arranca, conviene evaluar el diseño; si funciona mal, una evaluación de proceso; si hay que justificar continuidad o escalamiento ante un financiador, una evaluación de impacto. El presupuesto y los datos disponibles también condicionan la elección.

¿No sabe qué tipo de evaluación necesita su programa?

Innoval parte de un diagnóstico que ubica a su organización y define qué evaluación responde a su decisión. La primera conversación es de 30 minutos, sin costo, con la socia que ejecutaría el proyecto.

Agendar una reunión