У меня плохая сеть, в которой все время появляются и отключаются устройства (например, IoT). Поддерживает ли Charm ++ Adaptive MPI изменение размера сети (увеличение и уменьшение)?
Charm ++ и Adaptive MPI обеспечивают поддержку «податливых» заданий, в которых набор доступных процессоров динамически сжимается и расширяется с течением времени либо из-за аппаратных сбоев, либо из-за того, что пользователь по какой-то причине хочет запустить на другом количестве ядер. Это возможно по двум основным причинам:
1) Модель программирования основана на разложении работы на логические объекты (задачи), а не на физические (процессоры).
2) Система времени выполнения заботится об управлении местоположением и может переносить все задачи и их данные во время выполнения.
Ключевым моментом является то, что сжатие / расширение задания похоже на динамическое распределение нагрузки с точки зрения системы времени выполнения. Поэтому, когда вы написали программу Charm ++, которая способна выполнять динамическую балансировку нагрузки, вы можете воспользоваться гибкой работой и автоматической поддержкой контрольных точек / перезапуска. Для примера этой функции см. Examples / charm ++ / shrink_expand / в основной строке источника Charm ++.
Других решений пока нет …