语音识别积木块区

1. 积木功能说明

  • 功能简介:将目标路径的语音转化为文字。
  • 参数说明
    • 参数1:输入语音文件的路径。
  • 返回值:返回语音识别后的文字内容。

  • 功能简介:将中文文本转化为不同发音人语调语速的语音。
  • 参数说明
    • 参数1:输入中文字符串。
    • 参数2:发音人选择,0为普通女声,1为普通男声,3为男情感合成,4为女情感合成。
    • 参数3:音调选择,取值0-15,默认5为中语调。
    • 参数4:语速选择,取值0-15,默认3为中语速。
  • 返回值:无。

  • 功能简介:用麦克风进行语音输入并保存到指定路径下的音频文件。
  • 参数说明
    • 参数1:设置音频录制的时间,单位为秒。
    • 参数2:选择音频文件需要保存的路径。
  • 返回值:返回文件的路径位置。

  • 功能简介:创建一个Wakeup函数,当识别到语音唤醒关键词小度小度时,运行函数内程序;如需自定义唤醒词,请将/home/pi/sounds/目录下的xiaoduxiaodu.umdl唤醒文件替换为自定义唤醒文件并重命名为xiaoduxiaodu.umdl。
  • 参数说明:无。
  • 返回值:无。

  • 功能简介:将中文文本转化为不同发音人语调语速的语音并将语音保存到目标吗路径。
  • 参数说明
    • 参数1:输入中文字符串。
    • 参数2:输入语音保存路径。
    • 参数3:发音人选择,0为普通女声,1为普通男声,3为男情感合成,4为女情感合成。
    • 参数4:音调选择,取值0-15,默认5为中语调。
    • 参数5:语速选择,取值0-15,默认3为中语速。
  • 返回值:无。

  • 功能简介:把目标路径的语音转化为文字;可识别英语,粤语,四川话和普通话远场。
  • 参数说明
    • 参数1:输入需要识别语音的保存路径。
    • 参数2:选择需要识别的语种。
  • 返回值:返回文件的路径位置。

  • 功能简介:用麦克风进行语音输入并保存到指定路径下的音频文件,语音直至没有声音后停止录制。
  • 参数说明
    • 参数1:输入语音的保存路径。
  • 返回值:返回用户信息。

  • 功能简介:该积木块用于训练个人语音唤醒模型,详细步骤可参考关键字唤醒模型训练 训练成功则返回训练好的模型文件路径,需要3段说同一唤醒词的音频来训练,一般定义3-4个字的词语作为唤醒词,这3-4个字要避开一些常见的发音,避免和其他发音出现重合,从而导致频繁误唤醒,这三段训练音频录制时需要在安静的环境下录制,且录制清晰。
  • 参数说明
    • 参数1:第一段音频的保存路径。
    • 参数2:第二段音频的保存路径。
    • 参数3:第三段音频的保存路径。
  • 返回值:返回模型文件路径/home/pi/sounds/hotword.pmdl。

  • 功能简介:通过麦克风语音唤醒,唤醒后执行名为Wakeup的自定义函数。
  • 参数说明
    • 参数1:输入训练好的唤醒模型文件。
  • 返回值:无。

2. 注意事项

  • 在使用需要录音的积木块(如录音、小度小度语音唤醒等)时需要先接入麦克风,再运行相关积木。如果没有外接麦克风的情况下, 先运行了相关录音积木,那么后面再接入麦克风,再次运行相关积木也可能无法进行录音功能。需要重启树莓派。
  • 3.3.2及之后版本已解决上述bug。

3. 积木块应用案例

  • 下面的例子展示了如何使用人工智能语音识别模块。
图1

(图1)语音识别应用

Copyright © 古德微 2023 all right reserved,powered by GDWRobot本课修订时间: 2022-10-19

results matching ""

    No results matching ""