Soll ich den Trainingsprozess seriell oder parallel ausführen?

Soll ich den Trainingsprozess seriell oder parallel ausführen?

Ich muss 21 ANN-Trainingsprozesse ausführen.

Ich habe vier Rechner in der Hand. Drei davon sind mit GPUs ausgestattet (jeweils zwei GPUs).

Auf Computern mit GPUs kann ich nicht mehr als drei Prozesse gleichzeitig ausführen. GPUs können nicht mehr als drei Prozesse im Speicher unterbringen. Wenn ich also mehr als drei Prozesse ausführe, werden ein oder mehrere Prozesse automatisch beendet.

Wie könnten Prozesse am besten ausgeführt werden, um das Training in möglichst kurzer Zeit zu aktivieren?

verwandte Informationen