Apache Beam ist ein vereinheitlichtes SDK für die Batch- und Stream-Verarbeitung. Es erlaubt, große Datenverarbeitungsworkflows mit einem Beam-spezifischen DSL zu spezifizieren. Beam Workflows können auf verschiedenen Runtime wie Apache Flink, Apache Spark oder Google Cloud Dataflow (ein Cloud-Service) ausgeführt werden.
Ich untersuche Verarbeitungsprotokolle von Web-Benutzersitzungen über Google Dataflow / Apache Beam und muss die Logs der Benutzer beim Eintreffen (Streaming) mit dem Verlauf einer Benutzersitzung aus dem letzten Monat kombinieren.
Ich habe m...
29.04.2016, 00:21