τ-Lop: Modeling performance of shared memory MPI
Las operaciones colectivas definidas en el estándar MPI de paso de mensajes, para sistemas de múltiples procesadores, se pueden implementar mediante varios algoritmos. El modelado formal del coste de estos algoritmos permite su comparación, además del análisis de su rendimiento de manera independiente de la máquina.
Los métodos utilizados actualmente derivan de LogP, un modelo concebido para representar el coste de mensajes punto a punto entre nodos monoprocesador en una red de comunicaciones. Sin embargo, los supercomputadores actuales se construyen en base a nodos que integran cada vez más cores accediendo a la jerarquía de memoria, y la comunicación dentro del nodo adquiere relevancia. Las técnicas para comunicar procesos en memoria compartida, como la segmentación de mensajes o las operaciones colectivas no basadas en mensajes punto a punto, son muy diferentes a las utilizadas para comunicar procesos a través de una red, y requieren de nuevos métodos de representación.
Usando como recurso el supercomputador LUSITANIA, el trabajo de estos investigadores profundiza en las razones de la falta de precisión de LogGP y otros modelos más recientes como LognP y m lognP, y propone un nuevo modelo, denominado τ−Lop, cuyo objetivo es modelar de forma precisa y representativa las comunicaciones MPI en memoria compartida. En el estudio se modelan y analizan algunos de los algoritmos utilizados para implementar la operación colectiva MPI broadcast en las bibliotecas MPI más conocidas: MPICH y OpenMPI.
- Juan Antonio Rico Gallego, Juan Carlos Díaz Martín.
τ-Lop: Modeling performance of shared memory MPI.
Parallel Computing. Volume 46, July 2015, Pages 14–31.
DOI: 10.1016/j.parco.2015.02.006