Wenn ich mehrere Elemente in einer where-Klausel aufgelistet habe Wie würde man die Ergebnisse für jedes Element in der Liste auf N beschränken?
EX:
%Vor%Klingt wie Ihre Frage ist, die oberen N pro a_id zu bekommen. Sie können dies mit einer Fensterfunktion tun, die in Hive 11 eingeführt wurde. Etwas wie:
%Vor%Dies wird bis zu 10.000 zufällig ausgewählte Zeilen pro a_id ausgeben. Sie können es weiter partitionieren, wenn Sie nach mehr als nur a_id gruppieren möchten. Sie können die Reihenfolge auch in den Fensterfunktionen verwenden. Es gibt viele Beispiele, die zusätzliche Optionen zeigen.