怎么证明“你”是你?一个看似简单的问题,实际上是金融、社保等领域需要解决的基础问题。传统的现场身份认证方式带来的 “双重低效”问题在印度尼西亚的社保养老金领域显得尤为突出:一方面,离退休的老人无论行动方便与否,都需要在每两到六个月内亲身前往监管部门现场认证来领取养老金;另一方面,监管部门也不得不投入大量人力进行低效、重复的验证工作。
2018年5月2日,印尼政府正式启用了其新一代养老金认证系统,该系统运用指纹、人脸、声纹等多生物特征识别技术实现了远程身份识别。值得一提的是,这是声纹识别技术首次被应用在国家级社保项目中,印尼的老人们只需在家对着手机说“一句话”就可完成远程身份认证,银行的人工投入因此也可大幅降低。令人惊讶但更多自豪的是,项目中声纹识别的核心技术竟然出自一家名为VoiceAI的中国人工智能公司。
那么,这家中国公司到底掌握了什么样的“核心科技”,它又是如何在众多科技公司中脱颖而出的?带着这些问题,记者走访了这家低调而神秘的人工智能语音公司——深圳市声扬科技有限公司(VoiceAI Technologies),并有幸与其首席技术官陈东鹏博士进行了深度的对话。
图为2018年1月19日印尼雅加达发布会,TASPEN宣布将启用新一代养老金认证系统
记者:陈博士您好,印尼这个国家级社保项目是在什么样的背景下提出来的,他们的核心需求是什么?
陈东鹏博士:简单来说,这个印尼社保项目希望降低冒领骗取养老金的防治成本,这里的关键是解决多种复杂情况下的远程身份认证的问题。养老金管理中有一个全球普遍存在的问题——冒领骗保。印尼之前的做法是现场人工认证领取,需要由银行员工检验证件来核实老人身份。但印尼和中国一样,是人口大国,这就带来一些问题:一是大量老人会集中在规定时间内到银行领取养老金,行动不便的还需家人陪同,排队时间长且现场拥挤,存在安全隐患;二是银行职员人工确认的方式费时费力,并有疏漏或串通骗保的可能性。因此印度尼西亚国家公务员保险储蓄基金公司(简称TASPEN),开始规划新一代养老金认证系统,希望通过生物识别技术实现远程身份识别,从而让老人们足不出户安全、便捷领取养老金,同时减少银行的工作量以及人力投入。我们的声纹识别技术,正好能满足这样的需求。项目第一期服务的离退休人员即多达250万人。
图为VoiceAI 员工与印尼TASPEN工作人员合影
记者:印尼方面为何会采用VoiceAI的技术方案呢?而你们又是如何下定决心去做这个有国际影响力的大型项目呢?
陈东鹏博士:首先,感谢TASPEN和该项目中VoiceAI的合作伙伴北京海鑫科金高科技股份有限公司(编者注:国内知名的多生物智能识别和大数据分析技术供应商)对我们的信任,我想,这是因为我们技术的先进性及对用户需求的精准把握。
对于此次的国家级大型养老金认证项目,印尼方面有着非常严格的要求,在技术选型阶段就进行了大量的专业测试,结果表明VoiceAI的声纹技术能够准确、可靠的完成多种复杂情况下的远程身份认证,满足项目需要。再者,根据项目特点,在项目前期印尼用户提出了不少定制化需求,对此VoiceAI与海鑫科金通力合作,为其量身定制了解决方案。
我们这次面对的是一个创新型应用的国际项目,其中的挑战不言而喻,但同时这也是一次非常宝贵的机会。在人工智能领域,特别是一些细分的领域,中国的原创技术是领先的,能够为用户带来切实的价值,这也是我们下决心去做这个项目的初衷。
图为VoiceAI的陈东鹏博士(左一)在印尼做现场调研
记者:听说这是声纹识别第一次应用在国家级社保项目中,应该也遇到了不小的挑战吧?你们是如何应对的?
陈东鹏博士:诚如你所言,该项目是一个综合性的服务数百万离退休人员的国家级项目,在这过程中我们的确遇到了很多挑战。印尼离退休人群庞大,对声纹识别精度要求高,而我们此前并无印尼语音数据。再者,验证设备复杂,除了各品牌安卓机和iPhone外,老人还可选择在社保局的电脑上进行声纹验证, 在高峰期时需要应对每天上百万次的验证访问量。VoiceAI在智能语音领域拥有多年的积累和多项自主专利技术,在本项目中我们提供了包含以下关键技术点在内的诸多新科技:一、高精度印尼语声纹识别技术;二、非固定文本的跨信道声纹识别应用;三、语音的活体检测技术;四、印尼语语音识别技术;五、语音实时侦听与可变关键词唤醒技术。
记者:您提到的这些声纹识别的技术,都是VoiceAI自主研发的吗?作为一家成立一年多的初创公司,VoiceAI是如何建立起技术壁垒的?
陈东鹏博士:是的,这些都是我们的专利技术。声纹识别是一项非常前沿的领域,需要在底层算法、声音信号处理、深度神经网络等核心技术上有非常深厚的积累,VoiceAI有幸云集了一批来自国内外顶尖院校的一流研究人员,核心成员全部都是在该领域有着多年研究与实践经验的。国内外涉足这个领域的研究团队并 不多,真正有实际项目落地的就更少了,目前我们在这方面处于领先位置。
采访最后,陈东鹏博士还表示,科技以人为本,前沿科技服务各行各业,最终都要服务于人,落实到人的实际生活里;未来VoiceAI将会继续在人工智能语音领域深耕,不断向前探索,力争“化繁为简”,让“一句话” 为更多的行业提效赋能,给人们带来更智能、便利、安全的生活。陈东鹏博士在此也希望有志于人工智能语音和声纹识别的朋友们可以联系VoiceAI,让我们共同努力给社会带来更多的价值。
陈东鹏博士个人简介:
陈东鹏博士,先后毕业于中国科学技术大学和香港科技大学,主要研究方向为语音识别、深度学习和说话人识别;于IEEE TASLP, ICASSP, Interspeech等语音领域的 国际顶级期刊和会议发表多篇文章。