语音输入是否需要网络支持?随着百度输入法离线语音输入能力的发展,对于这个问题有着完全不同的答案。现在语音输入受到网络环境的限制,长期存在的一旦网络被切断就“罢工”的问题已经解决。
早在今年1月,百度输入法人工智能探索版就正式发布了。会议现场测试了包括百度输入法在内的三种不同输入法的“离线语音识别能力”。在优化了深层Peak2模式的嵌入式识别输入法后,百度输入法大大提高了离线语音识别的准确率在相同的手机和网络环境下,测试者对三种输入法说相同的句子,只有百度输入法实现了无错别字的“零错误”和无网络漏字,另外两种输入法出现了一些错别字或遗漏

(图:手机输入法离线语音评测)在
准确率领先的同时,百度输入法的离线语音也实现了逐字逐句的流式屏幕显示,即用户无论说什么字,都可以实时屏幕显示并输出逐字逐句的结果,超越了其他输入法落后于屏幕显示或还需要等待一个字完成后才能在屏幕上显示结果的情况。语音输入体验最流畅此外,百度安卓版的离线语音包只有35MB,比其他输入法小得多。它仍然可以实现高质量的语音输入,而不占用用户的手机内存。更重要的是,百度输入法的语音输入可以支持离线智能切换,是唯一真正实现自动切换而无需用户感知的输入法。这意味着只要用户下载离线语音包,输入法就会在进入无网络或弱网络环境如电梯、地铁时自动切换用户的识别模式,用户在这方面不会感到有一点停滞和落后,从而真正实现语音“自由发言”和“随时发言”

(百度输入法离线语音)
百度输入法不仅具有较高的离线语音识别能力,而且在在线语音识别方面也不断进步百度输入法行业首创的流截断多层注意力建模(SMLTA)将在线语音识别的准确率提高了15%,超过行业最高水平15%,在世界上首次实现了基于注意力技术的在线语音识别服务的大规模在线应用。该技术在中文在线语音识别方面实现了两大突破:局部注意建模和识别的准确率在世界上首次超过了全局注意模型,在线语音交互注意模型在世界上首次大规模部署。SMLTA技术在离线语音识别中的应用,将百度输入法离线语音的识别准确率提高到与在线语音相同的准确率水平,准确率超过98%
今年9月,世界知名的新经济产业第三方数据挖掘分析机构媒体研究发布了《2019年上半年中国第三方移动输入法专题研究报告》,显示2019年上半年中国移动输入用户语音输入普及率超过57.4%,语音输入用户总数超过4亿。其中,百度输入法拥有2.71亿语音输入用户,日峰值语音请求超过6.2亿次,是中国最强的语音输入法,人均日语音输入量最大。高效便捷的语音输入功能受到越来越多用户的欢迎,而百度在独立于在线语音识别的能力上的不断突破为在线交流扫清了道路,使用户能够在更多场景中“畅所欲言”,体验最终的语音输入体验。