RaspberryPi + Pockersphinx + ps3eye Fehler: Audiogerät konnte nicht geöffnet werden

8

habe gerade Pocketsphinx auf meinem Raspberry Pi installiert. Ich denke, ich bin verrückt, aber nicht sicher, ob ich das richtige Gerät zur Verfügung stelle.

Immer wenn ich renne:

  

src / programme / taschensphinx_continuous -adcdev plughw: 1,0-nfft 2048   -samprate 48000

Ich bekomme Folgendes:

  

root @ scarlettpi: /usr/install/pocketsphinx-0.8#   src / programme / taschensphinx_continuous -adcdev plughw: 1,0-nfft 2048   -samprate 48000 INFO: cmd_ln.c (691): Analysieren der Befehlszeile: /usr/install/pocketsphinx-0.8/src/programs/.libs/lt-pocketsphinx_continuous   \ -adcdev plughw: 1,0 \ -nfft 2048 \ -samplrate 48000

     

Aktuelle Konfiguration: [NAME] [DEFLT] [VALUE]   -adcdev plughw: 1,0   -agc keine keine   -agcthresh 2.0 2.000000e + 00   -alpha 0.97 9.700000e-01   -argfile
  -ascale 20.0 2.000000e + 01   -aw 1 1   -backtrace nein nein   -beam 1e-48 1.000000e-48   -bestpath ja ja   -bestpathlw 9.5 9.500000e + 00   -bghist nein nein   -ceplen 13 13   -cmn aktueller Strom   -cmninit 8.0 8.0   -compallsen nein nein   -debug 0   -Diktat   -Diktat nein nein   - Dither nein nein   -doubleb nein nein   -ds 1 1   -Fiktogramm
  -feat 1s_c_d_dd 1s_c_d_dd   -featparams
  -fillprob 1e-8 1.000000-08   -frete 100 100   -fsg
  -fsgusealtpron ja ja   -fsgusefiller ja ja   -fwdflat ja ja   -fwdflatbeam 1e-64 1.000000e-64   -fwdflatefwid 4 4   -fwdfatlw 8.5 8.500000e + 00   -fwdflatsfwin 25 25   -fwdflatwbeam 7e-29 7.000000d-29   -fwdtree ja ja   -hmm
  -infile
  -input_endian wenig wenig   -jsgf
  -kdmaxbbi -1 -1   -kdmaxdepth 0 0   -kdtree
  -latsize 5000 5000   -lda   -dadim 0 0   -weiterer Strich 0 0   -lifter 0 0   -lm
  -lmctl
  -lmname Standard-Standard   -logbase 1.0001 1.000.000e + 00   -logfn
  -logspec nein nein   -lower 133.33334 1.333333e + 02   -lpbeam 1e-40 1.000000e-40   -lponlybeam 7e-29 7.000000d-29   -lw 6.5 6.500000e + 00   -maxhmpf -1 -1   -maxnewoov 20 20   -maxwpf -1 -1   -mdef   -meine
  -mfclogdir   -min_endfr 0 0   -mixw   -mixfloor 0.0000001 1.000000d-07   -mllr
  -mmap ja ja   -cep 13 13   -nfft 512 2048   -nfilt 40 40   -nwpen 1.0 1.000000e + 00   -pbeam 1e-48 1.000000e-48   -pip 1.0 1.000000e + 00   -pl_beam 1e-10 1.000000e-10   -pl_pbeam 1e-5 1.000000d-05   -pl_window 0 0   -rawlogdir
  -remove_dc nein nein   -round_filters ja ja   - 16000 4.800.000e + 04   -Reed -1 -1   -sendump   -senlogdir
  -senmau   -silprob 0.005 5.000000d-03   -smoothspec nein nein   -svspec
  -Zeit nein nein   -tmat
  -tmafloor 0,0001 1,000000e-04   -topn 4 4   -topn_beam 0 0   -topregel   -transformieren Legacy-Legacy   -unit_area ja ja   -uberper 6855.4976 6.855498e + 03   -Nutzenfernsehern nein nein   -u 1.0 1.0000000e + 00   -var   -varfloor 0,0001 1,000000e-04   -Varnorm nein nein   -verbose nein nein   -warp_params
  -warp_type inverse_linear invers_linear   -wbeam 7e-29 7.000000d-29   -wip 0.65 6.500000e-01   -wlen 0.025625 2.562500d-02

     

INFO: cmd_ln.c (691): Befehlszeile parsen: \ -nfilt 20 \ -lowerf 1 \     -upperf 4000 \ -wlen 0.025 \ -transformieren Sie dct \ -round_filters no \     -remove_dc ja \ -svspec 0-12 / 13-25 / 26-38 \ -feat 1s_c_d_dd \ -agc   none \ -cmn aktuell \ -cmninit 56, -3,1 \ -varnorm nein

     

Aktuelle Konfiguration: [NAME] [DEFLT] [VALUE]   -agc keine keine   -agcthresh 2.0 2.000000e + 00   -alpha 0.97 9.700000e-01   -ceplen 13 13   -cmn aktueller Strom   -cmninit 8.0 56, -3,1   - Dither nein nein   -doubleb nein nein   -feat 1s_c_d_dd 1s_c_d_dd   -frete 100 100   -input_endian wenig wenig   -lda   -dadim 0 0   -lifter 0 0   -logspec nein nein   -lower 133,33334 1,000000e + 00   -cep 13 13   -nfft 512 2048   -nfilt 40 20   -remove_dc nein ja   -round_filters ja nein   - 16000 4.800.000e + 04   -Reed -1 -1   -smoothspec nein nein   -svspec 0-12 / 13-25 / 26-38   -transformieren Legacy-dct   -unit_area ja ja   -uberper 6855.4976 4.000000e + 03   -Varnorm nein nein   -verbose nein nein   -warp_params
  -warp_type inverse_linear invers_linear   -wlen 0.025625 2.500000e-02

     

INFO: acmod.c (246): Analysierte modellspezifische Merkmalsparameter von   /usr/local/share/pocketsphinx/model/hmm/en_US/hub4wsj_sc_8k/feat.params   INFO: feat.c (713): Initialisiere Feature-Stream, um '1s_c_d_dd' einzugeben,   ceplen = 13, CMN = 'aktuell', VARNORM = 'nein', AGC = 'keine' INFO: cmn.c (142):   mean [0] = 12.00, mean [1..12] = 0.0 INFO: acmod.c (167): Untervector verwenden   Spezifikation 0-12 / 13-25 / 26-38 INFO: mdef.c (517): Lesemodell   Definition:   / usr / local / share / pocketsphinx / modell / hmm / de_DE / hub4wsj_sc_8k / mdef INFO:   mdef.c (528): Gefundene Byte-Reihenfolge-Markierung BMDF, vorausgesetzt, dies ist eine Binärdatei   mdef-Datei INFO: bin_mdef.c (336): Lesen der binären Modelldefinition:   / usr / local / share / pocketsphinx / modell / hmm / de_DE / hub4wsj_sc_8k / mdef INFO:   bin_mdef.c (513): 50 CI-Telefon, 143047 CD-Telefon, 3 Sender / Telefon, 150   CI-sen, 5150 Sen, 27135 Sen-Seq INFO: tmat.c (205): Lesen von HMM   Übergangswahrscheinlichkeitsmatrizen:   / usr / local / share / pocketsphinx / modell / hmm / de_DE / hub4wsj_sc_8k / transition_matrices   INFO: acmod.c (121): Versuch, das SCHMM-Berechnungsmodul INFO zu verwenden:   ms_gauden.c (198): Gaußscher Parameter der Mischung lesen:   / usr / local / share / pocketsphinx / modell / hmm / de_DE / hub4wsj_sc_8k / bedeutet   INFO: ms_gauden.c (292): 1 Codebuch, 3 Merkmal, Größe: INFO:   ms_gauden.c (294): 256x13 INFO: ms_gauden.c (294): 256x13 INFO:   ms_gauden.c (294): 256x13 INFO: ms_gauden.c (198): Gemisch lesen   Gauß'scher Parameter:   / usr / local / share / pocketsphinx / modell / hmm / de_DE / hub4wsj_sc_8k / varianzen   INFO: ms_gauden.c (292): 1 Codebuch, 3 Merkmal, Größe: INFO:   ms_gauden.c (294): 256x13 INFO: ms_gauden.c (294): 256x13 INFO:   ms_gauden.c (294): 256x13 INFO: ms_gauden.c (354): 0 Varianzwerte   floored INFO: s2_semi_mgau.c (903): Laden von Senonen aus der Dump-Datei   / usr / local / share / pocketsphinx / modell / hmm / de_DE / hub4wsj_sc_8k / sendump   INFO: s2_semi_mgau.c (927): BEGINN DATEIFORMAT BESCHREIBUNG INFO:   s2_semi_mgau.c (1022): Speicherbelegte E / A für Senonen verwenden INFO:   s2_semi_mgau.c (1296): Maximum top-N: 4 Top-N-Strahlen: 0 0 0 INFO:   dict.c (317): Zuweisung von 137543 * 20 Bytes (2686 KiB) für Worteinträge   INFO: dict.c (332): Hauptwörterbuch lesen:   /usr/local/share/pocketsphinx/model/lm/en_US/cmu07a.dic INFO:   dict.c (211): 1010 KiB für Strings, 1664 KiB für Telefone INFO:   dict.c (335): 133436 Wörter lesen INFO: dict.c (341): Füller lesen   Wörterbuch:   / usr / local / share / pocketsphinx / modell / hmm / de_DE / hub4wsj_sc_8k / noisedict   INFO: dict.c (211): 0 KiB für Strings, 0 KiB für Telefone INFO:   dict.c (344): 11 Wörter lesen INFO: dict2pid.c (396): PID-Tabellen erstellen   für Wörterbuch INFO: dict2pid.c (404): Zuweisung von 50 ^ 3 * 2 Bytes (244   KiB) für Wort-Initial-Triphones INFO: dict2pid.c (131): Zugewiesen 30200   Bytes (29 KiB) für wortabschließende Triphones INFO: dict2pid.c (195):   Zugewiesene 30200 Byte (29 KiB) für Single-Phone-Word-Triphones INFO:   ngram_model_arpa.c (77): Nein \ data \ Markierung in der LM-Datei INFO:   ngram_model_dmp.c (142): Verwendet speicherplatzierte E / A für die LM-Datei INFO:   ngram_model_dmp.c (196): ngrams 1 = 5001, 2 = 436879, 3 = 418286 INFO:   ngram_model_dmp.c (242): 5001 = LM.Unigramme (+ Trailer) lesen INFO:   ngram_model_dmp.c (288): 436879 = LM.bigramms (+ trailer) lesen INFO:   ngram_model_dmp.c (314): 418286 = LM.trigrams lesen INFO:   ngram_model_dmp.c (339): 37293 = LM.prob2 Einträge lesen INFO:   ngram_model_dmp.c (359): 14370 = LM.bo_wt2 Einträge lesen INFO:   ngram_model_dmp.c (379): 36094 = LM.prob3 Einträge lesen INFO:   ngram_model_dmp.c (407): 854 = LM.tseg_base Einträge lesen INFO:   ngram_model_dmp.c (463): 5001 = ascii Wortfolgen lesen INFO:   ngram_search_fwdtree.c (99): 788 einzigartige anfängliche Diphone INFO:   ngram_search_fwdtree.c (147): 0 Root, 0 Nicht-Root-Kanäle, 60   Einzelwort-Wörter INFO: ngram_search_fwdtree.c (186): Suche erstellen   Baum INFO: ngram_search_fwdtree.c (191): vorher: 0 root, 0 nicht root   Kanäle, 60 Einzelwort-Wörter INFO: ngram_search_fwdtree.c (326):   nach: max nicht root chan erhöht auf 13428 INFO:   ngram_search_fwdtree.c (338): nach: 457 root, 13300 nicht-root-Kanälen,   26 Einzelwörter INFO: ngram_search_fwdflat.c (156): fwdflat:   min_ef_width = 4, max_sf_win = 25 INFO: kontinuierliche.c (371):   /usr/install/pocketsphinx-0.8/src/programs/.libs/lt-pocketsphinx_continuous   ZUSAMMENGEBAUT: 21. Juli 2013, AT: 14:34:06

     

Mixer laden fehlgeschlagen: Ungültiges Argument FATAL_ERROR: "continuous.c", Zeile   246: Audiogerät konnte nicht geöffnet werden

Ich benutze momentan ein ps3eye. Wenn ich ein einfaches mache:

  

arecord -D plughw: 1,0 -d 5 -q -f cd -t wav ~ / test.wav

Alles funktioniert gut (Verifiziert, indem Sie Raspberrypi über HDMI an den Fernseher angeschlossen haben und aplay ~ / test.wav laufen lassen)

Was mache ich falsch Leute?

Informationen, die Sie benötigen (basierend auf anderen Posts, die ich gesehen habe):

%Vor%

Auch in Bezug auf die Installation von Pocket Sphinx habe ich Folgendes getan:

%Vor%

Ideen oder Ratschläge in die richtige Richtung wären sehr hilfreich.

Danke,

Malcolm Jones

BEARBEITEN:

Vergessen, diese Informationen ebenfalls hinzuzufügen:

%Vor%     
Malcolm Jones 22.07.2013, 00:59
quelle

3 Antworten

18

Ich habe eine Weile gebraucht, mit etwas Hilfe von ein paar Quellen (sie werden in meiner Antwort aufgelistet) und ein paar nützlichen Tipps von nikolay-shmyrev , ich habe endlich eine Antwort gefunden, die für mich funktioniert hat.

Wichtigste Annahmen:

  1. Ausführen dieser Befehle als pi-Benutzer (zuvor habe ich sie als root ausgeführt, was falsch war)

  2. Ich benutze kontinuierliche Anerkennung und ich war NUR auf der Suche nach der Möglichkeit, meinen Raspberry Pi "aufzuwecken". Nach dem Aufwachen habe ich andere Pläne, wie es interagieren sollte.

Mein Setup:

  1. Canakit RaspberryPi

  2. HDMI-Kabel zu meinem Toshiba-Fernseher

  3. USB-WLAN-Dongle

  4. Playstation 3 Eye für die Spracherkennung

Vorwärts gehen. Ich habe die folgenden Befehle auf meinem RaspberryPi ausgeführt, um PulseAudio + puresphinx zusammen mit meiner Playstation 3 Eye zu bekommen. (Wenn Sie irgendwelche Verbesserungsplätze sehen, lassen Sie es mich bitte wissen)

Installieren Sie Pulse Audio / Entwicklungspakete

%Vor%

Einrichten von ALSA

Nach Anweisungen aus Ссылка

%Vor%

Stellen Sie sicher, dass das Kamera-Gerät beim Booten geladen wird

%Vor%

Richten Sie den PulseAudio-Daemon für Netzwerkverbindungen ein

%Vor%

Ändern Sie den Standard-Soundtreiber von alsa in Pulseaudio

%Vor%

Fügen Sie pi user der Impulszugriffsgruppe

hinzu %Vor%

Stellen Sie sicher, dass /usr/local/lib zum Bibliothekspfad

hinzugefügt wird %Vor%

Installieren Sie die Basis PocketSphinx

%Vor%

Überprüfen Sie, ob der Puls-Daemon läuft

%Vor%

Führen Sie abschließend Sphinx

aus

WICHTIGER HINWEIS DU MUSST USER PI SEIN UND DER PULSEAUDIO SERVER MUSS LAUFEN.

Bestehende Corpus-Datei, .jsgf-Datei, .dic- und .lm-Datei (mit lmtool )

%Vor%

Referenzen:

Ich plane, weitere Details zu hinterlegen, warum ich bestimmte Einstellungen, Konfigurationen in einem Blog-Post verwendet habe, schreibe ich auf meinem Hausautomatisierungsprojekt, aber dachte, ich würde teilen, was ich bisher gemacht habe, wenn jemand anderes festsaß wie ich und möchte mit dem weitermachen, woran sie arbeiten. Hoffe, das hilft jemandem. Danke für die Beratung Jungs.

    
Malcolm Jones 24.07.2013, 01:44
quelle
2
  

apt-get entfernen pulseaudio -y   Eignungsbeseitigung pulseaudio -y

Wenn Sie alsa nicht konfigurieren können, sollten Sie besser pulseaudio verwenden, außerdem ist es auf Ihrem System konfiguriert. Sie sollten sphinxbase besser mit pulseaudio-Unterstützung kompilieren. Für weitere Informationen lesen Sie die FAQ:

Ссылка

  

Laden des Mixers fehlgeschlagen: Ungültiges Argument

Dies ist eine Schlüsselnachricht, die besagt, dass Ihre alsa-Konfiguration keinen Level-Mixer unterstützt. Wenn Sie nicht wissen, wie Sie Mixer in alsa-Konfiguration hinzufügen können, verwenden Sie pulseaudio

  

./ configure --enable-fixed

Auch dies ist eine schlechte Idee, die sowohl Geschwindigkeit als auch Genauigkeit auf Ihrem Gerät reduziert. Ihr Prozessor hat FPU, Sie sollten also keinen Fixed-Point-Modus verwenden.

    
Nikolay Shmyrev 22.07.2013 04:14
quelle
1

Ich hatte das gleiche Problem, Audiogerät nicht zu öffnen.

Ссылка

Ich repariere es, indem ich das libpulse-dev-Paket installiere und sphinxbase, pocketsphinx neu installiere.

    
helloiloveit 15.04.2014 07:28
quelle