¿Cuáles son algunos buenos recursos (con ejemplos guiados) para aprender a aplicar técnicas de predicción de defectos de software?

Muy buena pregunta.

Desafortunadamente, no hay mucho material por ahí que te diga cómo hacerlo y qué se requiere para hacerlo.

Hay dos problemas-

  1. Los datos requeridos para predecir defectos de software son mayormente sesgados, incorrectos y técnicamente no son correctos para construir modelos de predicción.
  2. No hay tanta gente trabajando en este campo; hay pocos individuos en Microsoft que dicen haber usado modelos de predicción; sin embargo, sus resultados no fueron confiables para ser utilizados en la producción real o para generalizar modelos para otras compañías.

Sin embargo, el problema en el que está trabajando es grande y tiene la capacidad de generar un gran valor para el desarrollo de software.

Para dar una respuesta básica a sus preguntas, seleccione algoritmos básicos de aprendizaje automático (lineal, logístico, de árbol o bosque aleatorio, etc.) y aprenda en qué formato requieren datos. Luego construya modelos: para su contexto, el software meteorológico tendrá defectos o no se basará en una prueba en particular. En este caso, necesita todos los detalles en varias columnas sobre el modelo de software bajo prueba y los detalles de prueba que se ejecutarán, incluida la cantidad de veces que realizó la prueba. Su columna de predicción es variable binaria.

Esta es una forma muy básica de comenzar a trabajar en este problema; sin embargo, si necesita detalles exactos, necesitaría conocer los datos que tiene actualmente.