首页
场景案例
销售
服务
关怀
产品
辅助坐席技术
通知宝
核心技术
关于我们
我们的目标是
让机器人更好的帮助人类
融合丰富的人工智能科技
为企业销售提供更强大的后盾支撑
语音识别技术
( Auto Speech Recognize,简称ASR )
所要解决的问题是让计算机能够“听懂”人类的语音,将语音中包含的文字信息“提取”出来。
ASR技术在“能听会说”的智能计算机系统中扮演着重要角色,相当于给计算机系统安装上“耳朵”,使其具备“能听”的功能,进而实现信息时代利用“语音”这一自然、便捷的手段进行人机通信和交互。
声洞语音识别通过场景识别优化,准确率已达到90%以上,目前支撑中文普通话的语音识别。
ASR的技术原理,首先麦克风负责收集用户声音,软件将音频进行处理,包括VAD、分帧、mfcc特征提取。
特征提取之后,结合大量数据训练出的声学模型和描述语句文字出现概率的语言模型,通过语音解码和搜索算法最终将音频输出为文字。
声洞智能在智能语言方面做了很多探索,在各个前沿方向都有了开拓性的进展,不仅要让机器能听会说,还要能理解会思考,从而实现一个完善的智能销顾。
CEO 朱炜
自然语义理解
( Natural Language Understanding,简称NLU )
NLU 是要理解给定文本的含义。文本内每个单词的特性与结构需要被理解。
让机器懂得人的话语,理解人的意图,并且返回给用户相应的答案或者内容,来解决用户需求。如果我们把语音识别作为机器的耳朵,那么语义理解就是机器的大脑。
自然语言生成
( Natural Language Generation,简称NLG )
这个系统能生成用英语或其他人类语言表示的可理解文本,它的输入是一些非语言表示的信息,它会利用相关的语言知识和领域知识来自动地生成文件,报告,说明,帮助信息,以及其它类型的文本。
通过自然语言处理技术,声洞通过中文分词、专名识别等技术,准确识别用户意图及需求关键词,并提供相应服务。同时由短文本相似度技术精确匹配近似内容,并完成相似内容推荐。
语音合成,又称文语转换
( Text to Speech,简称TTS )
涉及声学、语言学、数字信号处理、计算机科学等多个学科技术,是中文信息处理领域的一项前沿技术,解决的主要问题是如何将文字信息转化为可听的声音信息,也即“让机器像人一样开口说话”。
声洞目前支持输出男声、女声,能调节语速、音量。支持在线和离线两种调用方式,可以根据网络状况自由切换。
企业的信任 是我们的动力
Cooperation
声洞服务于教育、汽车、房产、金融、保险、美容等众多行业,帮助企业开启高效销售之路,
已经有超过8000+企业感受到了声洞带来的改变。
返回顶部
QQ在线
微信交流
关注声洞智能公众号