Rede zum Text

Rede zum Text
Spracherkennung ist eine Technik, die die menschliche Stimme in Text umwandelt. Dies ist ein sehr wichtiges Konzept in der Welt der künstlichen Intelligenz, in der wir einer Maschine wie einem fahrerlosen Auto usw. Befehle geben müssen, usw.

Wir werden die Rede zum Text in Python implementieren. Und dafür müssen wir die folgenden Pakete installieren:

  1. PIP Installieren Sie die Spracherkennung
  2. PIP Installieren Sie Pyaudio

Wir importieren also die Spracherkennung der Bibliothek und initialisieren die Spracherkennung, da wir das Audio ohne Initialisierung nicht als Eingabe verwenden können und die Audio nicht erkennen wird.

Es gibt zwei Möglichkeiten, den Eingabe -Audio an den Erkenntnis zu übergeben:

  1. Aufgenommenes Audio
  2. Verwenden des Standardmikrofons

Dieses Mal implementieren wir also die Standardoption (Mikrofon). Aus diesem Grund holen wir das Modulmikrofon, wie unten gezeigt:

Mit LinuxHint.Mikrofon () als Mikrofon

Wenn wir jedoch das vorgezeichnete Audio als Quelleingabe verwenden möchten, ist die Syntax wie folgt:

Mit LinuxHint.AudioFile (Dateiname) als Quelle

Jetzt verwenden wir die Datensatzmethode. Die Syntax der Datensatzmethode lautet:

Aufzeichnung (Quelle, Dauer)

Hier ist die Quelle unser Mikrofon und die Dauervariable akzeptiert Ganzzahlen, was Sekunden ist. Wir bestehen die Dauer = 10, die dem System mitteilt.

Dann benutzen wir die erkennen_google () Methode, die das Audio akzeptiert und das Audio in ein Textformular verdeckt.

Der obige Code akzeptiert die Eingabe aus dem Mikrofon. Aber manchmal wollen wir Eingaben aus dem vorgezeichneten Audio geben. Dafür ist der Code unten angegeben. Die Syntax dafür wurde bereits oben erklärt.

Wir können die Sprachoption auch in der Methode erConize_google ändern. Wenn wir die Sprache von Englisch zu Hindi ändern, wie unten gezeigt: