Para una pasantía de ciencia de datos, ¿cuáles son algunos proyectos que puedo hacer para que mi perfil sea más impresionante?

Estoy prácticamente en la misma posición que tú. Pero después de obtener mi primera pasantía, espero que los comentarios a continuación le puedan dar una idea de dónde comenzar a cortar.

Preámbulo:

Me di cuenta de eso cuando empecé. Hice más teoría que aplicaciones (tengo una formación matemática) y fue muy difícil convencer a la gente de que sabía algo, mi currículum no fue impresionante, no era mi medio. y durante la entrevista, nadie me probó en algoritmos de la misma manera que mis amigos ingenieros de software.

Esto es lo que he hecho hasta ahora para cambiar eso:

1. He ido a algunos Hackathons para hacer algunos proyectos. Algunos de los premios incluyen la visualización de datos y el modelado, así que trate de obtenerlos.

Descubrí que si se esfuerza por ser notado por las empresas, lo notará. (ha) Pensé que la creación de redes era para perdedores, pero no lo es, piénselo para conocer a sus compañeros de trabajo.

2. He probado algunos de los concursos de Kaggle para obtener más experiencia con las bibliotecas disponibles que tengo a mi disposición. Titanic, OCR, etc.

Lee los foros, casi todos son más inteligentes que tú y es genial.

3. Cuando tomo un curso de Coursera, trato y pienso en maneras de extender lo que he aprendido en un proyecto pequeño.

Cuando tomé la clase de ciencia de datos de Bill Howe, aprendí sobre el análisis de sentimientos, así que escribí mis propios clasificadores Naive Bayes que podían manejar negaciones (200 líneas de python), entrenándolos desde twitter. Luego lo usé para clasificar oraciones en un libro y trazar el sentimiento a lo largo del tiempo / líneas. (20 líneas en python, en realidad no tanto esfuerzo). Pero me enseñó muchas toneladas acerca de la Tokenización de sentencias, cómo sus suposiciones sobre los datos de entrenamiento afectan las pruebas, etc.

4. Escribe. Escribir. Escribir. Cuando aprendes un nuevo truco (kernel, codos, hash) es difícil mostrarle a la gente que conoces, así que escribe sobre él y crea un blog. No es realmente algo que incluyas en tu currículum, así que haz que tu currículum lo dirija a tu blog.

curriculum vitae: “pero espera,

No tiene que ser largo. Escribe para tus amigos “Hey esto si en lo que he estado trabajando / aprendiendo”. También es una excelente manera de resumir cualquier proyecto en el que estuviste. “Esto es lo que aprendí sobre td-idf, muestreo de yacimiento, pendiente de gradiente, svm, etc.”

5. Intenta resolver algunos problemas interesantes.

Aprenderás una gran cantidad de cosas, incluso si fallas y todo el conocimiento se transfiere a aplicaciones reales.

Ruta más corta -> Toneladas de optimización
Problemas de bandidos multiarmed -> Pruebas A / B, aleatorización
Problema de alquiler de esquí -> Cloud Computing rentable
Programación -> Programación / Optimización
Vendedor viajero
Problema de la mochila
etc.

Personalmente me obsesioné con los problemas de bandidos. Recuerdo que pasé 15 minutos en mi entrevista explicándole apasionadamente a quién es ahora mi jefe.

Inicie un repositorio de algoritmos en Github e invite a un amigo. (Si no sabe git, esta es una buena manera, intente tener buenas prácticas cuando comience)

EDITAR: añade un poco más de formato y ejemplos.

Pruebe algunos de los proyectos finales de la página Meta Learning Machine Learning: http://metacademy.org/roadmaps/c

Debes intentar apuntar para poder hacer la piedra de casquillo de nivel 1. Si puede hacer la piedra de casquillo de nivel 2, debe saber más que suficiente para poder comenzar sus propios proyectos.