EntityTooLarge-Fehler beim Hochladen einer 5G-Datei in Amazon S3

8

Die Amazon S3-Dateigrößenbeschränkung soll gemäß dieser Ankündigung , aber ich bekomme den folgenden Fehler beim Hochladen einer 5G-Datei

%Vor%

Das lässt den Eindruck entstehen, dass S3 nur 5G-Uploads akzeptiert. Ich verwende Apache Spark SQL, um einen Parquet-Datensatz mit der SchemRDD.saveAsParquetFile -Methode auszugeben. Die vollständige Stapelverfolgung ist

%Vor%

Ist das Upload-Limit immer noch 5T? Wenn das der Grund ist, warum bekomme ich diesen Fehler und wie behebe ich ihn?

    
Daniel Mahler 11.10.2014, 22:15
quelle

2 Antworten

12

Die Objekt Größe ist auf 5 TB begrenzt. Die Größe hochladen beträgt immer noch 5 GB, wie im Handbuch erklärt:

  

Abhängig von der Größe der hochgeladenen Daten bietet Amazon S3 die folgenden Optionen:

     
  • Objekte in einer einzigen Operation hochladen - Mit einer einzigen PUT -Operation können Sie Objekte mit einer Größe von bis zu 5 GB hochladen.

  •   
  • Objekte in Teilen hochladen - Mit der Multipart-Upload-API können Sie große Objekte bis zu 5 TB hochladen.

  •   

Ссылка

Sobald Sie einen mehrteiligen Upload durchgeführt haben, überprüft und kombiniert S3 die Teile und Sie haben dann ein einzelnes Objekt in S3 mit einer Größe von bis zu 5 TB, das als einzelne Entität mit einer einzigen HTTP GET -Anforderung heruntergeladen werden kann ... aber das Hochladen ist möglicherweise viel schneller, sogar bei Dateien, die kleiner als 5 GB sind, da Sie die Teile parallel hochladen und sogar das Hochladen von Teilen, die beim ersten Versuch nicht erfolgreich waren, wiederholen können.

    
Michael - sqlbot 12.10.2014, 03:15
quelle
3

Der Trick scheint normalerweise herauszufinden, wie man S3 anweist, einen mehrteiligen Upload durchzuführen. Um Daten von HDFS nach S3 zu kopieren, können Sie das Dateisystem s3n verwenden und speziell Multipart-Uploads mit fs.s3n.multipart.uploads.enabled=true

aktivieren

Dies kann wie folgt durchgeführt werden:

%Vor%

Und weitere Konfiguration finden Sie hier: Ссылка

    
Sean 22.02.2016 20:40
quelle