语音识别技术,也被称为自动语音识别技术,是指将人说话的语音信号转换为可被计算机程序所识别的信息,从而识别说话人的语音指令及文字内容的技术。该技术使得人们可以摆脱键盘的束缚,提高输入速度、降低误输率、缩短系统反应时间。
近20年来,语音识别技术取得了显著进步,在手机上的应用也日趋广泛,如通过提取的声纹特征对手机用户进行身份认证,实现对手机的安全防护;获取语音信号,对其进行解析识别,转化为相应的控制命令,实现对手机某项应用或功能的控制。此外还有些特殊的应用,如通过对声源的定位确定摄像头的旋转角度,便于人们更好地进行自拍;对语音信号进行识别、增强操作,以便抑制噪声,提升用户的通话体验;对用户的语音情绪进行识别,对消极情绪进行处理,确保通话的和谐有效。
笔者通过中国专利文摘数据库(CNABS),对截至2017年1月18日所公开的手机语音识别领域的相关专利申请进行检索,并基于检索得到的数据对该技术领域的专利现状进行简要分析。
各国企业研发实力齐头并进
据统计,该领域的中国专利申请共计1519件。从年度专利申请量变化趋势来看,手机语音识别领域的发展大致可分为4个阶段:第一阶段是1998年以前,该时期手机语音识别领域的年申请量较低,均在10件以下,说明该技术正处于萌芽期;第二阶段是1999年至2003年,该时期的年申请量在15件左右,该技术正处于发展的新兴期;第三阶段是2004年至2011年,该时期专利申请量较之前有了稳定增长,年申请量在70件左右,说明该领域的技术正在稳步发展;第四阶段是从2012年至今,该时期专利申请量呈现井喷态势,由之前的年申请量不足100件增长到200件以上,说明该领域技术正在迎来发展的春天,其广阔的市场前景吸引了越来越多的研发力量投入其中,技术得到了飞速发展。
笔者针对手机语音识别领域的申请人进行排名统计发现,该领域专利申请量最多的申请人为中兴通讯(59件),紧随其后的申请人是三星(56件),联想和LG分列第三、四位,仅从专利申请数量来看,该领域暂未出现申请量遥遥领先、掌握绝对优势的申请人。
从申请人所属地域来看,在该领域排名前10位的申请人中,国内企业与国外企业各占5个席位,其中,国外企业所属国家分别为韩国(2家)、美国(2家)、日本(1家),这说明国内企业与国外企业在该领域的研发实力在伯仲之间。
从企业性质分析,在该领域排名前10位的申请人中,手机生产厂家有7家,占70%,其专利申请量占总量的79%,在数量上占据优势。虽然苹果的市场份额较高,但其在该领域的中国专利申请量并不显眼,这一部分是由于其专利战略布局的重心在美国,另一部分是由于苹果在语音识别技术方面通过不断收购相关公司来获取所需技术,在专利申请量上无法得以体现。
国内企业应当提升专利质量
专利的同族被引证次数在一定程度上可以作为评价专利质量的一个指标。被引证的次数越多说明该专利的质量越高,是该领域中的基础专利,可有效制约晚来竞争对手在该领域的专利布局。
笔者对该领域排名前10位的申请人的专利申请作进一步分析,统计各申请人专利申请的同族被引证次数后,得出以下2个信息:第一,各公司提交的专利申请中,有同族被引证情形的专利申请的总件数,国外公司均高于国内公司;第二,国外公司的专利申请均有被引证次数超过10次的情形,且被引证次数超过10次的专利申请的数量大多在9件以上,而除联想有1件专利申请存在被引证次数超过10次的情形外,其余国内公司都没有被引证次数超过10次的专利申请,且有近半数的国内公司的专利申请被引证次数在3次以下。笔者认为,造成国内外企业专利申请质量存在差异的原因,一方面是因为一件专利申请从开始被引用到大量被引用通常需要5年或更长的时间,而国内公司在该领域的专利申请起步时间均晚于国外公司;另一方面则说明国内公司提交的专利申请并非为基础专利,技术方案容易被竞争对手规避,不能构成有效威胁。
通过上述数据不难发现,国内公司在手机语音识别领域已经取得了长足的进步,在相关专利申请的数量上甚至略高于国外公司,但仍存在着很多不足,如在专利质量上与国外公司还存在差距,技术层面语音识别算法的深度以及相关应用的广度还有待挖掘。对此,笔者建议国内企业应加强语音识别技术的研究,提升识别准确性,这一准确性不仅仅是对语义内容的准确识别,还可以是对声音方位、具体对象、甚至对象情绪的准确识别等,从而对普及和拓宽语音识别的各项应用起到支撑作用;同时加强语音识别防干扰技术的研究,环境干扰是语音识别中的一个技术难点,将限制语音识别的应用场景,若能提升防干扰技术,可以拓展其应用范围。
随着移动互联网技术的不断发展,尤其是移动终端的小型化、多样化变化趋势,语音识别作为区别于键盘、触屏的人机交互手段之一,在需要解放双手的环境下、对于双手或视觉残障人士、对于无法通过触觉控制的微型设备都具有独特的优势。随着语音识别算法模型、自适应性的加强,相信在未来很长一段时间内,语音识别系统的应用将更加广泛与深入,更多丰富的移动终端语音识别产品将步入人们的日常生活。