L2 Daten und Instruktions-Cache wurden plötzlich reduziert

9

Ich arbeite an der Leistung des parallelen Algorithmus auf Multicore-Maschine. Ich habe ein Experiment zur Matrix-Multiplikation mit Loop-Reordering (ikj) -Technik durchgeführt.

Das Ergebnis der seriellen Ausführung ist wie in den folgenden Bildern.L1 Datencache-Treffer für die Schleifenreihenfolge ikj und kij für alle Größen der nXn Matrix liegt nahe 100% (Bild 1 Box Nummer 1 & 2) und wie Sie die Schleifenreihenfolge sehen können ikj in der Größe 2048 und 4096 plötzlich L2 Daten Cach Treffer um 50% verringern (Bild 2 Box Nummer 1 und 2) auch in L2-Befehl Cache-Treffer das gleiche ist wahr. In Fällen, in denen der L1-Daten-Cache-Treffer für diese 2 Größe wie bei anderen Größen (256, 512, 1024) ist, beträgt sie etwa% 100. Ich konnte keinen vernünftigen Grund für diese Steigung sowohl im Befehls- als auch im Daten-Cache-Treffer finden. Könnte mir jemand einen Hinweis geben, wie man den Grund (n) findet?

Glauben Sie, dass der vereinheitlichte L2-Cache Auswirkungen auf die Verschärfung des Problems hat? Aber was immer diese Reduktion verursacht, welche Eigenschaft von Algorithmus und Leistung sollte ich profilieren, um den Grund zu finden.

experimentelle Maschine ist Intel e4500 mit 2 MB L2-Cache, Cache-Zeile 64, os ist Fedora 17 x64 mit gcc 4.7 -o keine Compiler-Optimierung

Gekürzte & amp; Vollständige Frage?   my problem is that why sudden decrease of about 50% in both L2 data and instruction cache happens in only ikj & kij algorithm as it's boxed and numbered 1 & 2 in images, but not in other loop variation ?

%Vor%

%Vor%

%Vor%

%Vor%

%Vor%

Trotz des oben erwähnten Problems gibt es keine Erhöhung des Timings des ikj & amp; kij-Algorithmus. Aber ist auch schneller als andere.

ikj und kij Algorithmus sind zwei Varianten der Loop-Umordnungstechnik /

kij Algorithmus

%Vor%

ikj Algorithmus

%Vor%

Danke

    
mjr 12.10.2013, 13:55
quelle

1 Antwort

4

Ich wette, dass dies aufgrund des Problems der Superausrichtung geschieht, das in der Antwort der folgenden Fragen diskutiert wird:

Ich hoffe, es ist verständlich, dass ich diese Antworten nicht kopieren und einfügen möchte.

    
villekulla 12.10.2013 15:36
quelle

Tags und Links