Возможно материал для FAQ, при беглом просмотре сайта его не нашел. Если это уже есть -- стирайте.
Для наилучшей производительности рабочего кода нужно использовать MPI-реализацию из папки /bgsys/drivers/ppcfloor/comm/fast/, т.е. fast/bin/mpixlc, fast/bin/mpixlf. Делать это следует только при выходе на отлаженный код. "Using these shaves roughly a microsecond off of most communications calls (which can be 25% improvement)"
Спасибо за полезные сведения.
Информация добавлена в раздел, посвященный использованию компиляторов.