Sortiert die Effizienz von grep in Perl

Question

Sortiert die Effizienz von grep in Perl

7

Ich suche nach einigen Einzelheiten darüber, wie Perls grep -Funktion funktioniert. Ich mache das:

%Vor%

Angenommen, @bar ist groß (Hunderttausende von Elementen). Wenn ich nach meinen Daten sortiere @bar , erscheinen Werte von $foo eher am Anfang des Arrays als am Ende. Ich frage mich, ob dies der Performance hilft.

Anders ausgedrückt, bewegt sich grep mit dem obigen Code sequentiell durch @bar , prüft ob $foo == $_ und wird dann sofort beendet, sobald ein Wert als wahr erkannt wurde? Oder würde es tatsächlich jedes Element von @bar prüfen, bevor es einen Wert zurückgibt?

perl grep

itzy 19.03.2013, 18:16

quelle

5 Antworten

6

Da Ihre Verwendung von grep im skalaren Kontext ist, wird die Anzahl der übereinstimmenden Elemente zurückgegeben. Um dies zu berechnen, muss Perl jedes Element trotzdem besuchen, daher ist es unwahrscheinlich, dass die Sortierung die Leistung aus diesem Blickwinkel unterstützt.

sidyll 19.03.2013 18:20

quelle

2

In Ihrem Beispiel wird grep das gesamte Array durchlaufen, unabhängig davon, wie viele Elemente übereinstimmen.

Wenn Sie dieses Array sortiert halten können, ist es schneller, nach Ihren Werten mit der binären Suche zu suchen. Sie können auch Ihr Array in Hash konvertieren (mit Keys = Array-Element) und Ihre Prüfungen mit konstanter Zeit durchführen, aber das wird zusätzlichen Speicher verbrauchen.

PSIAlt 19.03.2013 20:29

quelle

1

In Bezug auf Ihre Frage

Wenn ich @bar nach meinen Daten sortiere, erscheinen Werte von $ foo eher am Anfang des Arrays als am Ende. Ich frage mich, ob dies der Performance hilft.

Wenn die Liste in numerischer Reihenfolge sortiert ist, können Sie

schreiben %Vor%

Borodin 19.03.2013 19:52

quelle

0

Es kommt darauf an. A grep { $x == $_ } @a profitiert nicht von der Verzweigungsvorhersage, aber grep { $x < $_ } @a macht!

%Vor%

Die Ergebnisse:

%Vor%

Siehe auch Warum ist es schneller? ein sortiertes Array als ein unsortiertes Array verarbeiten?

user1050755 20.03.2013 05:42

quelle

Tags und Links perl grep

Django: Verwenden von Annotate, Count und Distinct in einem Queryset Wie finden Sie 3 oder mehr aufeinanderfolgende Zeichen?

score 10 · Accepted Answer

grep schließt nicht kurz, so dass die Reihenfolge der Elemente keine Rolle spielt.

Während List :: MoreUtils first einen Kurzschluss hat, muss die ganze Liste vor dem Aufruf auf dem Stack platziert werden.

Dies wird am besten sein:

%Vor%

Aktualisiert : Ich habe ursprünglich über die Indizes iteriert, seit das O (1) Speicher verwendet, aber auch for (@bar) (im Gegensatz zu for (LIST) im Allgemeinen), wie Ysth mich daran erinnert hat.