WS-117语音识别模块
一、WS-117 简介
WS-117硬件模块是一款利用公司第二代语音处理芯片(DSP芯片)开发的非特定人语音识别的开发应用平台,支持MP3、WMA等格式音频文件的解码和播放。可用于智能控制等诸多领域。WS-117模块可以通过多个接口与主机进行通信。
WS-117支持中文、英文语音的识别控制,并允许用户进行关键词和关键句的更新维护。通过预先定义的通讯接口,主机可以控制WS-117的识别内容以及识别流程。
WS-117可以支持多达1000词条的中文语音识别,识别词条所支持的字数最大为6个汉字,对于非易混词表,系统给出的识别率达到97%以上(系统可以给出3个候选结果)。系统支持在噪音环境下的语音识别,芯片中加入了专门的滤波模块。
二、WS-117架构说明
WS-117模块作为一个协处理器,含有MIC、内置ADC、Speaker喇叭、DSP芯片,可以外扩SD卡或者TF卡。MIC、内置ADC采集语音(录音)。HOST主机将语音识别词条列表生成HMM网格文字,然后导入到DSP芯片中,并存储在外扩的SD卡或者TF卡中(同时MP3等音频文件也可以存储在卡中)。DSP芯片对录制的语音进行处理,识别后将识别结果(3个候选结果)通过相应的接口反馈给HOST,再有HOST执行相应的动作,DSP芯片还可以作为音频的解码器,播放MP3等音频文件。
三、WS-117 使用流程说明
l HOST的工作
HOST主机将语音识别词条列表生成HMM网格文字,然后导入到DSP芯片中,并存储在外扩的SD卡或者TF卡中。
将用户自定义的待识别词条(中文简体)转化为网格文字,具体的转换过程和对DSP的操作我们会提供相应的链接库和API供客户运行在HOST中。
对HOST的要求如下:
1、支持C语音编译。
2、支持 简单的FAT16/32的文件系统。
3、资源的消耗程度:支持MP3播放和语音识别,code部分大概在180KB、RAM部分不小于800B;仅支持语音识别,code部分在120KB、RAM部分不小于800B.
4、HOST和DSP的通信接口:SPI接口或者并口。