Hive QL - Begrenzt die Anzahl der Zeilen pro Element

8

Wenn ich mehrere Elemente in einer where-Klausel aufgelistet habe Wie würde man die Ergebnisse für jedes Element in der Liste auf N beschränken?

EX:

%Vor%     
Eric Philmore 31.07.2012, 23:06
quelle

1 Antwort

6

Klingt wie Ihre Frage ist, die oberen N pro a_id zu bekommen. Sie können dies mit einer Fensterfunktion tun, die in Hive 11 eingeführt wurde. Etwas wie:

%Vor%

Dies wird bis zu 10.000 zufällig ausgewählte Zeilen pro a_id ausgeben. Sie können es weiter partitionieren, wenn Sie nach mehr als nur a_id gruppieren möchten. Sie können die Reihenfolge auch in den Fensterfunktionen verwenden. Es gibt viele Beispiele, die zusätzliche Optionen zeigen.

    
Carter Shanklin 06.02.2014 05:05
quelle

Tags und Links