¿Qué recursos de computación tiene OIST (Okinawa)?

Soy un estudiante de doctorado en OIST que actualmente trabaja en simulaciones que requieren computación GPU. Aquí tenemos dos grupos maravillosos a los que todos los investigadores tienen acceso y ambos tienen nodos de GPU disponibles. Un grupo es principalmente para fines de enseñanza. El otro se ubicó en el puesto 281 del mundo en las 500 súper computadoras del mundo y el 12 en el VERDE 500. Si vienes a OIST, es probable que no te falten recursos informáticos.

Desde un sitio web interno:

Recursos informaticos

Proporcionamos dos clusters HPC, tres sistemas de almacenamiento de datos y un sistema de archivo / respaldo basado en cinta para apoyar a la comunidad de investigación de OIST en sus actividades de computación científica, y para almacenar sus datos de investigación (consulte el flujo de trabajo de almacenamiento y el procedimiento de acceso). Los clusters de HPC y los grandes sistemas de almacenamiento de datos se alojan dentro del campus en el sitio de la aldea de Onna, mientras que el sistema de archivo / respaldo se encuentra en una instalación dedicada en la ciudad de Nago.

Clusters HPC

Operamos dos clústeres de computación de alto rendimiento (HPC), Sango y Tombo, que se encuentran en el centro de datos principal del campus. Sango es el grupo de computación de investigación principal actual de OIST y consta de 10224 núcleos de cómputo (unidades de procesador) con un total de 61 TByte (tera bytes) de memoria. Sango ofrece una potencia de cómputo máxima de aproximadamente 252.7 TFlops (252.7 billones de operaciones de punto flotante por segundo), lo que ubicó a Sango en la posición 281 en el TOP500 mundial de junio de 2015. Tombo es el clúster OIST de la generación anterior, y ahora lo usamos para talleres y capacitación, como un entorno de prueba, y para otros servicios informáticos de investigación no productivos. Tombo consta de 1564 núcleos de cómputo (unidades de procesador) con un total de 6 TByte (tera bytes) de memoria, lo que le otorga una potencia de cálculo máxima estimada de aproximadamente 15 TFlops (15 billones de operaciones de punto flotante por segundo).

Sango

Sango es un clúster de Linux con 400 nodos de cómputo (20 x chasis Supermicro SuperBlade y 10 blades dobles por chasis), cada uno con dos procesadores Intel Xeon E5-2680v3 de 12 núcleos a 2.50 GHz que comparten 128 GiB de memoria del sistema. Además, tenemos 20 nodos de cómputo de gran memoria (de 4 x chasis Supermicro SuperServers con 8 blades por chasis), cada uno con dos procesadores Intel Xeon E5-2680v3 de 12 núcleos a 2.50 GHz que comparten 512 GiB de memoria del sistema y un nodo de memoria grande con 3 TB de memoria del sistema.

Sango también tiene 3 nodos aceleradores Tesla GPU (3 x Supermicro Superserver), cada uno con dos procesadores Intel Xeon E5-2680v3 de 12 núcleos a 2.50 GHz que comparten 128 GiB y están equipados con cuatro GPU Tesla K80 de 4992 núcleos y 24 GiB; y 3 nodos aceleradores Intel Phi (3 x Superserver Supermicro), cada uno con dos procesadores Intel Xeon E5-2680v3 de 12 núcleos a 2.50 GHz que comparten 128 GiB y están equipados con cuatro aceleradores 6138 GHz de 1638 GHz y 16 GiB. Todos los nodos están interconectados utilizando 56Gbit / s InfiniBand FDR. En total, Sango consta de 10224 núcleos de cálculo (+60636 núcleos de acelerador) y 60.75 TiB de memoria principal (+ 480 GiB de aceleradores).

Tombo

Tombo es un clúster de Linux con 96 Dell PowerEdge M620, cada uno con dos procesadores Intel Xeon E5-2670 de 8 núcleos y 2,60 GHz que comparten 64 GiB de memoria del sistema; y un nodo GPU que utiliza un Dell PowerEdge R720 con dos procesadores Intel Xeon E5-2680v2 de 10,80 GHz de 10 núcleos y 64 GiB de memoria del sistema, equipados con dos GPU Tesla K40 de 2496 núcleos y 12 GiB. Los nodos de cómputo Tombo se conectan mediante una red de interconexión QDR InfiniBand (IB) de 40 gigabit / s. En total, Tombo consta de 1564 núcleos de cómputo (+4992 núcleos de acelerador) y 6 TiB de memoria principal.

Además, pronto obtendremos una Power Box con las últimas tarjetas Pascal P100, ¡y la interconexión de alta velocidad NVLink pronto (estoy muy emocionada por esto)! Además, si se encuentra con falta de recursos o necesita su propia caja de desarrollo, TI lo respalda y lo ayudará de cualquier manera posible.

Para ser honesto, las capacidades de cómputo fueron uno de los principales puntos de venta para OIST para mí. He trabajado en algunos otros lugares con Supercomputadoras disponibles (LANL, en particular) y puedo decir honestamente que Sango es mi grupo favorito en el que trabajar hasta ahora. Las colas son cortas y todo se hace lo más fácil de usar posible.

¡Avísame si tienes más preguntas sobre OIST y haré mi mejor esfuerzo para responderlas!