Muy buena pregunta.
Desafortunadamente, no hay mucho material por ahí que te diga cómo hacerlo y qué se requiere para hacerlo.
Hay dos problemas-
- Los datos requeridos para predecir defectos de software son mayormente sesgados, incorrectos y técnicamente no son correctos para construir modelos de predicción.
- No hay tanta gente trabajando en este campo; hay pocos individuos en Microsoft que dicen haber usado modelos de predicción; sin embargo, sus resultados no fueron confiables para ser utilizados en la producción real o para generalizar modelos para otras compañías.
Sin embargo, el problema en el que está trabajando es grande y tiene la capacidad de generar un gran valor para el desarrollo de software.
- ¿Cuáles son los buenos recursos para aprender herramientas de DevOps como el chef y Jenkins?
- ¿Cuáles son todos los buenos recursos que sugeriría a alguien que querría aprender sobre el reconocimiento de voz?
- ¿Cuál es el mejor recurso en línea para las actualizaciones y noticias de Cloud Computing?
- ¿Cuáles son algunos recursos en línea recomendados para prepararse para el nivel DELF C1?
- ¿Cuáles son los buenos recursos para aprender sobre el diseño de experimentos para pruebas A / B?
Para dar una respuesta básica a sus preguntas, seleccione algoritmos básicos de aprendizaje automático (lineal, logístico, de árbol o bosque aleatorio, etc.) y aprenda en qué formato requieren datos. Luego construya modelos: para su contexto, el software meteorológico tendrá defectos o no se basará en una prueba en particular. En este caso, necesita todos los detalles en varias columnas sobre el modelo de software bajo prueba y los detalles de prueba que se ejecutarán, incluida la cantidad de veces que realizó la prueba. Su columna de predicción es variable binaria.
Esta es una forma muy básica de comenzar a trabajar en este problema; sin embargo, si necesita detalles exactos, necesitaría conocer los datos que tiene actualmente.