¿Cuáles son las mejores maneras de comenzar a aprender bioinformática para un biólogo de laboratorio?

Simplemente súbase. Tome el curso de código académico en python y git y luego pase a Rosalind. Rosalind tiene mucha ayuda en los conceptos básicos de python y muchos problemas para trabajar en todas las áreas de la bioinformática. Una vez que sea competente, o en cualquier momento realmente, comience a usar la codificación para resolver problemas en su laboratorio o comience a contribuir a un proyecto de código abierto en github que le interese.

Hay otros cursos para R, pero una vez que estés decente con python (que es más fácil de aprender) traer paquetes de R al redil no debería ser demasiado difícil. Hay absolutamente un montón de conjuntos de datos disponibles (NCBI, PGP, etc.) y competiciones como los desafíos DREAM o CAGI que le permitirán hacer ciencia real si su laboratorio húmedo actual no produce datos que sean interesantes o útiles para sus necesidades de programación.

Todos los programadores usan google y stackoverflow para responder preguntas y mejorar su código o simplemente recordar algún patrón que se les escapó. No hay atajos para ser un buen programador / bioinformático, es un lenguaje y nada más que usarlo regularmente y luchar contra los problemas lo llevará a la competencia. A medida que la cantidad de datos generados por los biólogos se expande, es absolutamente esencial que tengamos las herramientas para procesar, interpretar e integrar datos de muchas fuentes, por lo que es un esfuerzo que vale la pena. Buena suerte.

Una pregunta que debe hacerse es qué parte de la bioinformática le gustaría dominar. La mayoría de los cursos se centran en la codificación como parte integral del dominio de la bioinformática, lo cual es importante, pero requiere algunos antecedentes para comenzar. Antes de hacer eso, puede ser útil comprender la “lógica” del análisis y ver cómo se pueden aplicar varios enfoques. Utilizado en proyectos. Al comprender bien el laboratorio de mojado, probablemente esté familiarizado con muchos proyectos en la base de datos de GEO que tienen datos que puede analizar. Estamos empezando a reunir proyectos que puede usar para comenzar con el procesamiento básico (como extraer valores de expresión génica de la secuenciación de NGS sin procesar) a métodos analíticos que puede usar para “interrogar” los datos. Por ejemplo, puede aprender acerca de las estadísticas de la prueba t y cómo se pueden usar métodos como la expresión génica diferencial (es decir, DESEQ, por ejemplo) o métodos más complejos como el Análisis de regresión factorial para comparar grupos de muestras y reducir las enormes tablas de expresión a manejables y Resultados interpretables que puede utilizar para comprender la biología que está “oculta en los datos”. Ya que estamos empezando a poner a prueba este enfoque, puede consultar los primeros cursos y proyectos gratuitos aquí: edu.t-bio.info

Aprender los aspectos informáticos y matemáticos de la bioinformática.

Para la informática, familiarícese con:

  • Estructuras de datos (listas enlazadas, árboles, mapas hash, etc.)
  • Algoritmos básicos (búsqueda, clasificación, recorrido de gráficos, etc.)
  • Manipulación de cadenas (formato FASTA, búsqueda de subcadenas, etc.)
  • Programación dinámica
  • Un lenguaje de scripting (Python, MATLAB, R)
  • Un lenguaje compilado (Java, C ++)
  • Comandos UNIX
  • Sistemas de control de revisión (Git, SVN).
  • Bases de datos biológicos (UniProt, GenBank, etc.)

Para las matemáticas:

  • Probabilidad
  • Estadística
  • Teoría de grafos
  • Álgebra lineal

Luego puede centrarse en los detalles más finos relacionados con la bioinformática, que se basan en el conocimiento mencionado anteriormente. Empezaría aprendiendo estos dos temas.

  • Alineación de secuencias (Needleman – Wunsch, BLAST, etc.)
  • Aprendizaje automático (HMM, clustering, etc.)

Creo que en este punto, lo que debes aprender es una elección personal. Hay demasiadas áreas finas que vale la pena investigar, así que simplemente elija un área que le interese. Por ejemplo, si su laboratorio está centrado en la biología evolutiva, es posible que esté interesado en MCMC y en los métodos de máxima probabilidad.