EntityTooLarge-Fehler beim Hochladen einer 5G-Datei in Amazon S3

Question

EntityTooLarge-Fehler beim Hochladen einer 5G-Datei in Amazon S3

8

Die Amazon S3-Dateigrößenbeschränkung soll gemäß dieser Ankündigung , aber ich bekomme den folgenden Fehler beim Hochladen einer 5G-Datei

%Vor%

Das lässt den Eindruck entstehen, dass S3 nur 5G-Uploads akzeptiert. Ich verwende Apache Spark SQL, um einen Parquet-Datensatz mit der SchemRDD.saveAsParquetFile -Methode auszugeben. Die vollständige Stapelverfolgung ist

%Vor%

Ist das Upload-Limit immer noch 5T? Wenn das der Grund ist, warum bekomme ich diesen Fehler und wie behebe ich ihn?

amazon-s3 apache-spark apache-spark-sql parquet jets3t

Daniel Mahler 11.10.2014, 22:15

quelle

2 Antworten

3

Der Trick scheint normalerweise herauszufinden, wie man S3 anweist, einen mehrteiligen Upload durchzuführen. Um Daten von HDFS nach S3 zu kopieren, können Sie das Dateisystem s3n verwenden und speziell Multipart-Uploads mit fs.s3n.multipart.uploads.enabled=true

aktivieren

Dies kann wie folgt durchgeführt werden:

%Vor%

Und weitere Konfiguration finden Sie hier: Ссылка

Sean 22.02.2016 20:40

quelle

Tags und Links amazon-s3 apache-spark apache-spark-sql parquet jets3t

Django: Verwenden von Annotate, Count und Distinct in einem Queryset Verbessern Sie die Leistung des Highcharts Liniendiagramms

score 12 · Accepted Answer

Die Objekt Größe ist auf 5 TB begrenzt. Die Größe hochladen beträgt immer noch 5 GB, wie im Handbuch erklärt:

Abhängig von der Größe der hochgeladenen Daten bietet Amazon S3 die folgenden Optionen:


Objekte in einer einzigen Operation hochladen - Mit einer einzigen PUT -Operation können Sie Objekte mit einer Größe von bis zu 5 GB hochladen.



Objekte in Teilen hochladen - Mit der Multipart-Upload-API können Sie große Objekte bis zu 5 TB hochladen.

Ссылка

Sobald Sie einen mehrteiligen Upload durchgeführt haben, überprüft und kombiniert S3 die Teile und Sie haben dann ein einzelnes Objekt in S3 mit einer Größe von bis zu 5 TB, das als einzelne Entität mit einer einzigen HTTP GET -Anforderung heruntergeladen werden kann ... aber das Hochladen ist möglicherweise viel schneller, sogar bei Dateien, die kleiner als 5 GB sind, da Sie die Teile parallel hochladen und sogar das Hochladen von Teilen, die beim ersten Versuch nicht erfolgreich waren, wiederholen können.