Ich habe ein Projekt, in dem ich ein Chat-Programm zwischen einem Client und einem Host erstellt habe, und ich muss Speech to Text darin einbetten. Gibt es eine Möglichkeit, Google Speech to Text API in mein Programm einzubetten?
Dies ist wahrscheinlich das, was Sie nicht in Ihrem Fall verwenden möchten, aber für andere, die dies für ein einmaliges Projekt benötigen, habe ich vor einiger Zeit einen einfachen Python-Client gehackt, der die in Chrome integrierten APIs für Sprache verwendet Suche:
Damit es funktioniert, müssen Sie 16000Hz kodierte FLACs haben, und sie müssen ziemlich kurz sein.
Auch, wie die Kommentare erwähnen, ist die API inoffiziell, also wer weiß, wann es nicht mehr funktioniert.
Es gibt ein Paket in PyPI namens Spracherkennung , das so aussieht. Die live (d. H. Via Mikrofon) API sieht fantastisch einfach aus.
%Vor%Es verfügt auch über Funktionen zum Transkribieren von WAV-Dateien, die als Hintergrundprozess ausgeführt werden und Konfidenzwerte für die Transkription usw. bereitstellen.
Tags und Links python google-api speech-recognition