Erstellen geeigneter WAV-Dateien für Google Speech API

8

Ich benutze Pyaudio, um meine Stimme als WAV-Datei aufzunehmen. Ich verwende folgenden Code:

%Vor%

Ich verwende den folgenden Code für Google Speech API, der die Sprache in der WAV-Datei im Wesentlichen in Text konvertiert: Ссылка

Wenn ich versuche, die wav-Datei, die von pyaudio generiert wurde, in den Google-Code zu importieren, erhalte ich folgenden Fehler:

%Vor%

Ich benutze folgende Umgehung dafür: Ich konvertiere WAV-Datei mit ffmpeg in MP3, danach konvertiere ich MP3-Datei wieder in WAV mit sox:

%Vor%

Die API von Google funktioniert mit dieser WAV-Ausgabe, aber da die Qualität zu stark abnimmt, funktioniert sie nicht gut.

Wie kann ich also im ersten Schritt eine Google-kompatible WAV-Datei mit pyaudio erstellen?

    
JayGatsby 09.01.2017, 18:34
quelle

1 Antwort

4

Das Konvertieren der WAV-Datei in die FLAC-Datei mit avconv und das Senden an die Google Speech API hat das Problem behoben.

%Vor%     
JayGatsby 14.01.2017, 13:45
quelle