在党和政府以及全社会的共同努力下,我国新冠肺炎疫情防控取得了阶段性的胜利,各地陆续复工复产,人工智能技术持续赋能,为各行各业的安全复工复产发挥了重要作用。声音作为人类沟通最自然的工具,既有语言属性又有身份属性,声纹识别在这场与病毒较量的战“疫”中充分发挥了其技术优越性,北京远鉴信息技术有限公司(以下简称“远鉴”)的声纹考勤,就是其中的典型代表,公司利用“声纹+应用”,筑起一道新防线,助力企业复工复产。
那么,声纹到底是如何工作的,它能为社会带来怎样的价值,落地应用在哪些场景呢?我们今天请到了远鉴副总裁沈思成先生,以下是中国安防行业网记者对沈总的采访内容。
中国安防行业网:远鉴这次推出的无接触考勤应用了声纹技术,能简单给我们介绍下该技术么?
沈思成:声纹是由波长、频率以及强度等百余种特征维度组成的生物特征,具有稳定性、可测量性、唯一性等特点。与其他生物特征相比,声纹识别技术有一些非常突出的优势:比如蕴含声纹特征的语音获取方便、自然,声纹提取可在不知不觉中完成,因此使用者的接受程度也高;再比如获取语音的识别成本低廉,使用简单,一个麦克风即可,在使用通讯设备时更无需额外的录音设备。而且声纹是非常适合远程身份确认,即使是传统的电话也可以通过声音信息传递实现远程验证。比如我们的“无接触式”声纹考勤系统只需要员工使用本人手机,读出几位随机数字一两秒钟就可以完成打卡,既不需要摘下口罩,更不需要在指纹打卡机前聚集排队,灵活便捷。
中国安防行业网:声纹的优点显而易见,那么它的应用价值主要体现在哪里呢?
沈思成:进入互联网时代,数字身份的概念就在不断变换,但本质上都是用户向远程的服务端证明“你是你”。声纹作为一种生物特征,固有的价值在于能证明或识别人的身份。主要体现在两个方面:一是证明人的身份,也叫身份确认,很多场合需要证明“我是我”和“只有我”才能做,尤其在远程证明身份的场合,声纹的优势尤其突出。二是识别人的身份,也叫身份辨认,主要应用在公共安全和国家安全方面,需要辨认“ta是谁”,比如电信诈骗分子、恐怖分子等。从这两个方面可以看出,声纹识别在网络空间具有特殊的意义:一方面众多的互联网应用场景需要用户证明身份,声纹识别非常便捷,对隐私的侵扰小于人脸识别;另一方面,声纹识别对于揭开网络空间匿名身份的真实面目具有独特的优势。远鉴希望能够让声音成为坚实的盾牌,为国家公共安全、网络安全解决身份识别与认证问题,为未来网络可信身份国家行动战略推广和实施奠定应用基础。
中国安防行业网:据了解远鉴从一开始就选择了声纹技术作为“招牌”,那在声纹领域远鉴都做了哪些探索呢?
沈思成:远鉴一直以来非常重视身份认证领域,从2013年开始,我们敏锐的发现了声纹识别的行业应用机会,加大了对声纹识别等人工智能技术的研发和行业开拓,引入国内顶级声纹技术团队。
在不断组建、扩充团队的过程中,远鉴创造性地将声纹识别与人脸识别深度融合,在国际上首创“人脸+声纹+X”多维身份识别算法,并推出多维认证系统,受到公安部门青睐,已经在全国20多个省、市公安机关落地。当然,该产品同样适合任何重视数据安全的行业。
后来,远鉴参与国家的重大工程项目,经过技术测评后以第一名的成绩胜出,因此得以接触到真实场景下的数据和实战需求。在国家需求的牵引下,2018年我们突破了声纹识别跨信道这一业界难题,也打通了声纹识别大规模应用的最后一公里。2019年,远鉴又面向破解声音深度伪造进军,突破性解决声纹活体检测难题,能够对语音产生的真实性、来源真实性进行鉴别。
在2019年中国人工智能多媒体信息识别技术竞赛中,远鉴获得声纹识别冠军,获评最高等级的A级单位。同年的中国创新挑战赛暨中关村新兴领域专题赛中,远鉴再次获得声纹竞赛冠军-优胜奖。远鉴相继承担了国家十二五、十三五科技支撑计划中相关声纹识别课题的研究任务,主导起草了多项公共安全行业标准和国家标准等,更成为多维身份识别与可信认证技术国家工程实验室的承建单位之一。
中国安防行业网:技术上的前置条件已经达成了,那么声纹的实际应用体现在了哪些方面呢?
沈思成:近两年来,远鉴一直在努力让技术走向应用。天道酬勤,随着我们技术的逐步成熟,声纹识别已经可以从研究领域走进了工业界和民用视野,成为进行身份识别和保障身份安全的“黑科技”。远鉴在多维身份识别、生物特征库、嵌入式应用等三个方向推动声纹技术应用落地。多维身份识别的应用在前面已经介绍,我再以生物特征库为例分析一下声纹识别技术的应用前景。
美国在2003年911事件之后即开始了大规模的声纹识别应用。我国公安部门也早已建立包含指纹、掌纹、DNA等生物特征的数据库。随着我国声纹技术的突破性进展,我国公安机关也启动了刑事声纹库的建设。声纹具有非接触式采集的优点,可以和已有DNA库、指纹库相结合,形成立体生物特征库,建成后直接为多行业领域服务,形成身份与实人的强绑定关系,有效保护公共安全,提升社会治理效率和综合管理能力,是落实科技强国的重要实践之一。目前,公安部已在声纹库建设方面进行了重点布局,远鉴是为数不多通过公安部标准检测的厂商,为有关部门提供声纹采集仪、谛听声纹库、多维生物特征认证等技术支持服务,全方位保护国家公共安全。
当然,并不局限于国家公共安全,远鉴也在积极探索AI如何服务“互联网+政务服务”“社会治理”和“民生服务”,比如疫情期间,远鉴推出了“无接触式”声纹考勤,科技助力安全复工。未来,远鉴希望能够通过声纹和语音识别技术,推动城市逐步实现精细化管理,为百姓提供更人性化的服务,让智慧城市更安全。
中国安防行业网:声纹的市场未来可期,那么远鉴对声纹未来发展有什么展望么?
沈思成:随着我国对于“新基建”的部署的逐步深入,特别是进入2020年首次国务院常务会议就提出,出台信息网络等新型基础设施投资支持政策,声纹识别等领先技术正在深度融入数字中国、网络强国和智慧社会建设中。如今的声纹识别,已经走出实验室,迈向产业化,能够支撑大体量生物特征库的建立,为保护国家安全、金融安全等提供重要的技术支撑。未来,声纹识别和声纹大数据技术将持续助力构建和强化安全的社会公众环境。
远鉴作为一家技术驱动型公司,深厚的自主研发能力、领跑业内的技术实力,都已经让我们从试水者变成了如今的引领者。我们希望能依托现有声纹识别的行业应用优势、应用数据优势和核心技术优势,打造独有的声纹生态,并融合更多人工智能技术,形成“新声纹”模式。同时基于互联网可信身份认证服务,我们会着力发展行业智能业务,并探索发展个人智能业务。我们希望把远鉴打造成为“数字中国”重要的技术基石,有力支撑“数字中国”新型信息基础设施建设,为中国的网信事业做出更大贡献。
编辑:晓莉