Este es un problema que he estado obsesionado durante los últimos cuatro años, al momento de escribir esta respuesta.
Llegué a la conclusión de que es extremadamente difícil, si no imposible, obtener este tipo de información.
¿Por qué?
- ¿Qué métricas debes usar? ¿Las puntuaciones del alumno en la aplicación? No todos los proveedores de aplicaciones estarán dispuestos o serán capaces de proporcionar estos datos. Incluso si lo tiene, normalizarlo para compararlo con miles de otras aplicaciones es una hazaña monumental. ¿Qué hay de los resultados de los exámenes estandarizados del estudiante? Esas métricas ya son cuestionables, como cualquier educador le dirá.
- ¿Cómo conduces una evaluación científicamente controlada? Hay muchos factores que influyen en la educación de un estudiante, desde los maestros hasta los padres, los compañeros, los materiales de instrucción, los factores socioeconómicos, la genética y, bueno, entiendes el punto. Determinar si una aplicación específica ha hecho una diferencia perceptible es un desafío significativo. Algunos proveedores ya lo intentan, pero saber cómo funcionará una aplicación en un aula o en un hogar lleno de distracciones en comparación con un laboratorio prístino son cosas muy diferentes.
- ¿Cómo explicas las diferencias individuales? Algunos estudiantes irán a un juego y aprenderán mucho de él, otros simplemente aprenderán cómo engañar al juego. Algunos sobresaldrán con solo un poco de orientación práctica, otros necesitarán atención constante. El rendimiento de una aplicación depende mucho del aprendiz. ¿Significa esto que la aplicación es efectiva o inefectiva? Desafortunadamente, una talla no sirve para todos.
- ¿Cómo explican los productos que cambian rápidamente? Supongamos que encuentra una manera de realizar una prueba científicamente controlada en un entorno de clase utilizando una métrica confiable. La probabilidad de que el desarrollador lea su informe e incorpore sus hallazgos es muy alta. Las aplicaciones se están mejorando y evolucionando constantemente. ¿Qué significa eso para tu investigación? Está desactualizado en el momento en que se lanza una nueva versión.
Hay algunos esfuerzos fantásticos y nobles en curso para resolver este desafío, aunque creo que todos estamos muy lejos. Ese estándar de oro de datos y pruebas es muy difícil de obtener de una manera repetible, confiable, personalizada y escalable.
- ¿Me puede sugerir una lista de herramientas de aprendizaje basadas en proyectos para la enseñanza de la gestión de marketing global?
- ¿Qué foros son buenos para aprender hacking?
- ¿Es una buena idea apresurarse por el trabajo escolar?
- ¿Qué lecciones importantes en la vida podemos aprender de los animales?
- ¿Qué puedo aprender en 5 min?
Una solución involucra el uso de rúbricas a través de las cuales evaluar todas estas aplicaciones. Aunque la evaluación requiere el trabajo manual de alguien capacitado en evaluaciones pedagógicas, es un proxy razonable de la calidad, si no la verdadera eficacia. Muchos servicios actuales de revisión de edtech utilizan algún tipo de rúbrica, con algunas diferencias en amplitud y profundidad.
Otro implica revisiones en profundidad escritas por un individuo con una buena comprensión del dominio de la aplicación. Esto es similar a las revisiones de productos que se ven en las guías de electrónica más populares. Dichas revisiones se limitan a la experiencia y los prejuicios del revisor, aunque al menos pueden proporcionar información de alguien que ha utilizado, pinchado y pinchado la aplicación.
Una de las soluciones más débiles es el uso de calificaciones . Dado que son relativamente fáciles de obtener de los revisores, aprovechan la inteligencia colectiva de la multitud. Las calificaciones también son fáciles de entender de un vistazo y de usar como un filtro básico. Sin embargo, no proporcionan ningún contexto. Algunos servicios evitan esto al ofrecer múltiples dimensiones de calificación, pero también pueden sufrir el problema de promediar calificaciones muy positivas y muy negativas.
Estas soluciones se ubican en un espectro con la sabiduría de las multitudes en un extremo y la sabiduría de los expertos en el otro.
Si cree que el valor pedagógico de una aplicación educativa se puede obtener de la multitud, pruebe el modelo de Yelp. Si cree que el valor pedagógico debe ser evaluado por expertos, pruebe el modelo Consumer Reports. Los servicios de revisión de Edtech están empleando actualmente estrategias en todo el espectro porque alcanzar un verdadero estándar de oro con datos y pruebas reales es muy difícil.
¿Serán suficientes estas soluciones? ¿Alguien será capaz de romper el patrón oro? No estoy seguro de que sea posible, pero sinceramente espero que alguien lo haga.
PD: publiqué esta respuesta el 20 de julio de 2014 en mi blog, la mayoría de los cuales he reproducido aquí en esta respuesta de Quora.