Welche Möglichkeiten gibt es, große Daten von Oracle DB zum elastischen Such-Cluster zu indizieren? Die Anforderung besteht darin, 300 Millionen Datensätze einmal in mehrere Indizes und auch inkrementelle Aktualisierungen mit täglich etwa 1 Million Änderungen zu indexieren.
Ich habe das JDBC-Plugin für elasticsearch Fluss / Feeder ausprobiert, beide scheinen im Inneren zu laufen oder erfordern eine lokal ausgeführte elastische Suchinstanz. Bitte lassen Sie mich wissen, ob es eine bessere Option gibt, den Elastic Search Indexer als eigenständigen Job (wahrscheinlich auf Java-Basis) auszuführen. Irgendwelche Vorschläge werden sehr hilfreich sein. Danke.
Wir verwenden ES als Berichts-DB, und wenn neue Datensätze in SQL geschrieben werden, führen wir die folgende Aktion aus, um sie in ES zu übernehmen:
Dieser Prozess funktioniert gut, da er sowohl neue Daten als auch alte Daten verarbeitet. Für alte Daten schreiben Sie einfach ein schnelles Skript, um 300M Primärschlüssel in Hase zu schreiben und fertig!
Es gibt viele Integrationsoptionen - ich habe einige aufgeführt, um Ihnen einige Ideen zu geben, die Lösung hängt jedoch wirklich von Ihren spezifischen Ressourcen und Anforderungen ab.
Tags und Links java oracle elasticsearch relational-database elasticsearch-plugin