Einfacher Dienst zum Übertragen von Daten zwischen Amazon-Datenspeicherdiensten, Starten von Elastic MapReduce-Jobs und Herstellen einer Verbindung mit externen Datendiensten.
Ich brauche weder Hive noch Pig, und die Amazon Data Pipeline installiert sie standardmäßig auf jedem EMR-Cluster, den sie hochfährt. Dies dauert länger als nötig. Irgendwelche Ideen zum Deaktivieren der Installation?