Nimm etwas auf und lass es dir zu Text umwandeln
In diesem Beispiel wird mit der Bibliothek recorderjs eine Sprachdatei mit 44.100 HZ Abtastrate, 16 bit Auflösung, dem Audio-Codec LINEAR PCM
und dem Container Format WAV
aufgenommen und über eine Websocket Verbindung zu einem Server gesendet.
Beim Server wird das WAV BLOB mit fs
in ein temporäres Verzeichnis geschrieben und mit der DeepSpeech Bibliothek über spawn
die Datei zu Text umgewandelt. Der Text wird zum Client zurückgesendet.
Hier ist ein weiteres Beispiel eines Transkriptionswerkzeuges. Genau wie bei DeepSpeech wird hier wieder eine WAV Datei zum Server gesendet und umgewandelt; blos diesmal mit Vosk.