apache-beam

Apache Beam ist ein vereinheitlichtes SDK für die Batch- und Stream-Verarbeitung. Es erlaubt, große Datenverarbeitungsworkflows mit einem Beam-spezifischen DSL zu spezifizieren. Beam Workflows können auf verschiedenen Runtime wie Apache Flink, Apache Spark oder Google Cloud Dataflow (ein Cloud-Service) ausgeführt werden.
1
Antwort

So kombinieren Sie Streaming-Daten mit großen Verlaufsdaten in Dataflow / Beam

Ich untersuche Verarbeitungsprotokolle von Web-Benutzersitzungen über Google Dataflow / Apache Beam und muss die Logs der Benutzer beim Eintreffen (Streaming) mit dem Verlauf einer Benutzersitzung aus dem letzten Monat kombinieren. Ich habe m...
29.04.2016, 00:21