Aufgrund der Rückmeldung von SuperMicro ist die Leistungseinbuße auf NUMA, ungleichmäßigen Speicherzugriff, zurückzuführen. Der SuperMicro 1026GT-TF-FM109 verwendet das X8DTG-DF-Motherboard mit einem Intel 5520 Tylersburg-Chipsatz, der mit zwei Intel Xeon E5620-CPUs verbunden ist, die jeweils mit 96 GB RAM ausgestattet sind.
Wenn ich meine Anwendung auf CPU0 sperre, kann ich unterschiedliche Speichergeschwindigkeiten beobachten, je nachdem, welcher Speicherbereich reserviert und folglich gemappt wurde. Wenn der reservierte Speicherbereich außerhalb der CPU liegt, hat mmap Mühe, seine Arbeit zu erledigen, und jedes nachfolgende Memcpy zu und von dem "entfernten" Bereich verbraucht mehr Zeit (Datenblockgröße = 16 MB):
%Vor%Es macht fast Sinn. Nur der dritte Fall, 64G $ 128, was die obersten 64GB bedeutet, liefert ebenfalls gute Ergebnisse. Das widerspricht irgendwie der Theorie.
Grüße, Peter