不再需要证明你是你--AI报告解读

浏览: 时间:2020-03-07

计算机视觉另一个比较成熟的应用,是人体生物及行为特征识别(简称生物识别)。生物识别是指通过指纹、视网膜、虹膜、指/掌静脉、掌纹/掌形、人脸、步态、声纹、笔迹等人体的生物或行为的特征,进行个人身份的鉴别和认证。其中,除了声纹以外,其他的识别方法都属于计算机视觉范畴。


传统的身份认证是用户名+密码,或者实体卡片、钥匙等,容易忘记、丢失、被盗取,或者被仿制。生物识别使用人与生俱来、差异性大、稳定性好、难以仿制的生物特征来进行身份的认证,更加安全和便捷。


1.webp

生物识别所用的生物和行为特征



1 应用概述

生物识别已经应用的十分广泛:

日常生活中,比如智能门锁,智能手机的指纹和人脸解锁。买东西时刷脸支付,在银行和金融证券的线上系统操作时的指纹和人脸验证等。

工作中,比如指纹、人脸,或者虹膜的门禁和考勤系统。保密单位或岗位上,登录工作系统的权限验证。

公共服务中,比如电子护照或身份证的验证,医疗保险和养老保险远程发放验证,各种自助服务中的人证核验等。

在生活工作以外,比如公安、司法和刑侦系统中,大量使用生物识别技术进行验证、核查、侦察等方面的工作。

在人们可能不太注意的地方,比如图书馆的智能交互屏,根据用户的性别、年龄、风格特征,以及借阅记录,推荐可能感兴趣的书籍。

2


生物识别的应用,按使用目的大致可以分为认证、匹配、画像三类。

通常提到生物识别的应用,都会用认证的应用场景来举例,但是生物识别的用途其实不止认证。

认证——确认自然人的身份。认证的目的是让自然人获得信息系统的权限,比如,网上银行通过人脸识别确认“我”是小HUI,可以对小HUI的银行账户进行任何操作。高铁闸机,通过摄像头捕捉的人脸和身份证图像比对,确认是自然人持有的合法证件,且有票务信息,可以放行。

匹配——关联不同信息系统中同一个人的信息。一种是跨系统整合信息,比如跨镜头追踪,把同一个人在不同地点和角度的画面整合起来,绘制行动轨迹和特征画像。一种是跨系统信息碰撞,比如在大型集会入口抓取观众人脸图像,和公安违法信息进行碰撞,发现可疑人员。

画像——给出个人或人群画像。画像通常是为了商业目的,比如商业体分析某个区域顾客的整体性别和年龄分布、着装风格,是路过、无差别闲逛,还是有目的购物等,据此进行动线设计。

3

智慧零售,《德勤-2019中国人工智能产业白皮书》


认证是普通消费者最常接触到的生物识别应用,这个场景通常只采集用于验证的1、2种用户信息,比如人脸+指纹。

匹配和画像在特定领域解决问题则复杂一些,通常需要识别多个维度的信息,相互关联印证。比如跨镜头追踪,除了需要识别面部、服饰,还需要通过步态识别,把一个人的正面图像和背影图像做关联。

生物识别的各项技术,目前的普及程度差别很大。走入规模商用的,主要是人脸、指纹、虹膜和静脉:

安全性和准确性最高的是虹膜和静脉识别,识别率能达到近100%,目前多用于安全防护级别高的银行、国防、机场等场所种,核心控制区的身份认证。同时这两项技术的成本也是最高的,由于使用体验和价格的原因,没能被各个行业广泛应用。

应用范围最广的是指纹识别,占有超过50%的生物识别市场份额,这项技术的成本也是最低的,目前广泛用于门禁、解锁、个人支付等场景中的身份认证;

人脸识别的应用范围正在高速扩张,这项技术有非接触、无感知的特点,几乎适用于一切安全防护不太高的公共场所的身份认证,以及移动终端的解锁、支付等。同时这项技术的成本较低、可以得到多维度的信息,目前在44%的金融企业,21%的制造企业,20%的信息服务企业都有应用(数据来自量子位)。

单一的生物识别技术,在数量到达百万级时,都会有一定的误识别率,因此,在安全性要求高的领域,一般使用多模态(如指纹+人脸,掌纹+指纹,人脸+指纹+声纹等)生物识别。

4.webp

生物识别市场格局(2019年7月)


2 生物识别的基本过程

生物识别的不同方法之间,采集的图像不同,分析的特征也不同,但是大概的步骤比较类似:

5.webp

生物识别的基本过程



3 哪个技术更好?

我们在很多媒体上都可以看到类似“人脸识别的准确率达到99.8%,即将爆发”这样的描述。这里有两个误区:

1、 衡量生物识别的,不是一个唯一的“准确率”指标,而是分为误识率、拒真率。

2、 实验室能够达到的水平,和真实环境中能够做到的水准,可能有数量级上的差别。

误识率——多大可能判断“他就是你”。

误识率由识别所依据的生物和行为特征决定,受在库数据量的影响。

不同的生物和行为特征包含的信息量不同,这决定了个体间差异是否明显,进而决定了这种方法能够达到的、最低的误识率。信息量最大的是掌静脉、虹膜,而人脸、声纹的信息量相对比较小。

在库数据量小,比如只有一个小学的样本,数据间的差异一般比较大,认错的可能性就不太大。如果需要在整个城市的人口样本中识别“他是谁”,认错人的可能性就非常大,需要辅以人工或其他的确认方法。

拒真率——多大可能回答“我不认识你”。

拒真率的影响因素比较多,比如特征的稳定性、所处的人体部位,以及图像采集方法等。

和误识率不一样,无论使用哪个生物或行为特性都可以做到很低的拒真率——只要不考虑误识率。比如:分析完员工小王的指纹后回答:我认识你(低拒真率),你是员工小李(高误识率)。

拒真率必须和误识率一起考虑,信息量大的生物和行为特征,通常能同时达到较低的拒真率和误识率。

特征稳定性高,则任何时候提取到的特征值都很稳定,不容易发生拒真。

有些特性会随着年龄变化,比如静脉、耳朵、人脸、声纹、掌形等;

有些与身体状态有关,比如生病就会影响声纹、步态、签名、击键等;

虹膜、指纹、掌纹几乎终身稳定不变。

特征所处的人体部位如果暴露在体表,则比较容易受环境影响或者被人为改变,导致某些情况下发生拒真。

指纹识别会受干、湿、污损手指的影响;

人脸识别会受到化妆、穿着、遮盖等的影响;

步态、击键等可以人为控制;

在同时有多个人的声音时,声纹识别就无法工作;

静脉、虹膜等则不太容易受环境影响或人为改变。

不同的图像采集方法决定了能采集到的信息量和数据的准确程度。

通常需要用户配合的采集方式,采集的数据比较完整和准确,但同时用户体验会不太好。

因为光线和角度会严重影响人脸的图像采集,所以在银行、高铁的身份认证中,会要求用户看镜头,并同时补光,确保得到可信的识别结果,完成自动、自助通关;在安防中用户没有感知,识别结果就仅供参考,需要人工确认。

指纹的采集方案中,电容方案的应用最广,但射频方案才拥有最高的准确性。

可以看出来,不同生物和行为特征所包含的信息量(唯一性)和信息的稳定性,基本上就决定了每种生物识别方法的准确性。

6.webp

特征的生物学特性

    

生物识别还有两个比较新的领域:基于心脏(心跳波形)的生物识别;基于体味的生物识别。目前都只有小样本的实验,没有能够证明唯一性、稳定性的统计数据

这可能也是为什么指纹、虹膜、掌纹的应用研究开展的比较早。2005年中科院就申请了在移动设备上可以使用的掌纹识别的专利。

但是为什么2010年后,人脸识别开始成为科技公司投资的热点?毕竟从技术上看,人脸既不容易做到很好的识别效果,干扰因素又多。


4 人脸识别有什么优势?

为什么“先天条件”不好的人脸识别,现在得到了最快的发展?

先说结论:技术的性能指标很重要,但易用性、可维护性对应用至关重要。

首先:人脸识别的“先天缺陷”可以解决,使技术满足实用要求。

实用化.1:技术的限制可以规避。

从国际大赛公开的数据看,人脸识别目前准确率在99.8%,这意味着每1000个人,就有2个认错或者不认识。这还是在实验室,针对指定数据集的比赛结果,真实世界的情况可能几十个人就会认错一个。这肯定是没法用的。

为什么我们在高铁、机场已经可以刷脸入闸,好像也很顺利呢?

这是因为在工程应用中,把1:N的问题转换成了1:1的问题。通俗一些说,原本需要菊厂的HR看一眼,说出这人是我厂的谁谁谁,实际工作中变成了员工把工卡递给HR,判断这是不是我厂的谁谁谁。前者为了避免见谁都说不认识(拒真),标准只好稍微模糊一点;后者则可以提高标准仔细核对细节。

因此,刷脸入闸这样人证核验中,准确率可以做到99.99999%。

当然,标准提高会导致拒真率也升高,在高铁闸机,也确实经常会遇到识别不通过的情况。但在人脸识别良好的交互体验和结果的可验证,使高拒真率不成为致命问题。

7.webp

图片来自网络


实用化.2:相对优秀的用户体验。

在大部分的技术落地中,导致最后无疾而终的,通常不是技术问题彻底无法解决,而是没有办法做到良好的体验,使用户持续使用。

在接近20种生物识别的方法中,可以不需要用户刻意主动配合就采集到生物特征信息的,有大概7种,其中人脸是唯一性和稳定性最好的一种。

识别准确率高的指纹、掌纹、虹膜、静脉,都需要以用户的主动配合为前提,其中,指纹、掌纹需要用户直接触摸采集器;虹膜、静脉需要用户靠近到距离采集仪20、30cm以内。

当发生拒真的时候,人脸识别的闸机,只需要用户再看一眼摄像头(顺便吐个槽,拍出来实在难看),就可以重试,就算重复了好几次,用户也只会认为这机器太傻。

其他的采集方案就没有这么友好了,用户需要以正确的角度、距离、位置配合机器伸出手或头,如果需要重复试,会显得用户自己很傻,十分容易引起抵触。

解决了这一步还不够,还需要有最终的人工兜底措施,防止极端的拒真情况。

8.webp

特征的采集特点


9.webp

小HUI观点:指纹、掌纹的接触式采集方式,很可能会限制它的适用场景。在个人设备、熟人的公用设备上通常不会有接受度的问题。但是在开放的公用设备上,相当比例的用户会担心采集仪被前面的用户污染。此外,一些宗教原因也会导致的接受度的问题。

实用化.3:识别结果可解释、可验证。

在所有的生物识别方法中,人脸识别是唯一个可以人工的、不借助任何设备,就能完成结果验证的方法。

这样,当一个用户无论如何都没法通过自动身份认证的时候,还可以求助工作人员,转由人工进行身份的确认,不会让流程卡死。

规避技术限制 + 良好的用户体验 + 结果可解释可验证,使人脸识别满足了实用的要求。

除了实用性,人脸识别的广泛的应用还有两个有利条件。

有利条件.1:比较容易取得客户信任。

企业采用新技术对操作过程做自动化改造的时候,会需要一个建立信任的过程。

如果自动化流程中完全无法人工校验、核对,在自动化流程卡壳、结果错误时,客户也就没有办法自己确认是否真的有问题,问题的归属是软件系统、客户自采硬件还是用户,那么建立信任的过程就会很漫长,被放弃的可能性也会很大。

人脸识别的结果可解释、可验证,这意味着用户有机会介入自动化流程,这种透明、可控的状态,对建立信任特别有用。即使需要多轮迭代才难最终满足需求,由于过程中的客户体验良好,客户也更能有耐心给与持续的支持。

有利条件.2:高性价比

人脸识别的前端设备是摄像头,它有非常多元化的应用场景。

对于身份认证而言,人脸识别有先天缺陷,但人脸包含了其他特征没有的信息,比如年龄、性别、风格、情绪,甚至行为、意图(需要结合人体姿态信息)等。

这使得摄像头在安防、工业、教育、办公、零售、金融和个人消费电子等领域,都有广泛的应用。

摄像头的所有应用场景都要求摄像头做到:高还原度、高分辨率、高可靠性。

一方面是规模效应吸引的大量玩家,一方面是旺盛的性能提升需求,这使得摄像头几乎是性价比最高的图像类传感器。

可以说,人脸识别的胜出,是市场和工程共同推进的结果。 


5 应该怎么选择?

虽然指纹获得了最大的市场,人脸获得了最多的投资,但生物识别的各项技术,还是各有用武之地。

安全防护的等级,是生物识别方法选择的首要约束。

安全防护根据失效所造成的影响定级。

如果失效导致的可能影响比较小,比如:企业的主要工作流程不受影响,只是慢一些;对个人造成比较小的财产损失等,则系统只需要做到比较低的安全防护级别。

反之,如果失效导致的可能影响巨大,比如:企业的工作职能无法履行;造成大范围的社会不良影响;出现严重法律问题等,则系统就需要做到比较高的安全防护级别。

生物识别的安全防护级别,取决于误识率(把他认成你)和防伪性能(通过盗取、复制、仿冒等手段欺骗系统的可能性)。

10.webp

特征的安全性


一般来说,暴露在体表的特征更容易被盗取、复制、仿冒。静态特征比动态特征更容易仿冒。

11.webp

小HUI认为,“声纹支付”是安全级别和技术选择错配的典型——用户通过语音控制音箱进行购物,通过声纹验证完成支付。认证的标准严格一些,用户体验不好;松一些,则可能造成经济损失。

如果想要通过支付应用倒逼声纹验证的技术发展,在早期需要设置一个“安全旁路”——比如语音交互完成以后,用户可以选择在APP或PC上确认订单。这样,用户尝鲜的风险更小,更有可能持续使用。

工作环境和识别对象,影响生物识别方法的选择。

室外、光线变化非常大的环境,步态就比人脸更能胜任全天候的工作。

粉尘、污染的环境,就无法使用指纹、静脉、虹膜这样相对精密的方案。

特殊工种,比如穿防护服后进行权限验证、矿井的上下井打卡,就无法使用人脸和指纹。

文化和法规,限制生物识别方法的选择。

在一些宗教国家,所有利用人体生物特征进行识别的方法,可能都不能使用,只能使用行为特征,比如签名,来进行识别。

不同国家和地区有不同的隐私和敏感信息保护法规,相应的,诸如人脸识别这样敏感的技术,应用范围也会受限。(在欧洲,敏感信息是那些可以回溯到自然人的信息,人脸信息是首当其冲的敏感信息)


6 机会

身份认证会是数字化社会的基础设施

随着信息化的发展,每个人都将有一个数字化身份。数字公民包含一个自然人方方面面的信息,除了人脸、指纹、虹膜等生物特征,个人的社会活动如工作履历、社工服务,以及财产、征信、健康情况,甚至还包含日常的经济活动等。

随着数字公民的信息完善,身份认证必然会被更广泛的使用,未来的生活中,可能医院、学校、办公室、厂区、餐厅、商店、充电站、公交和地铁站,甚至私家车、家庭都会有各式各样的身份认证终端,每一个场所和设施,都可以根据个人的权限、特点和过往选择,让人得到更便捷、个性化的服务。

生物信息采集器在未来除了以独立硬件的形态出现,更多还会作为一个模块嵌入各种设备和设施中,作为用户交互的一部分,和设备一起“running in the wild”,经历日晒雨淋、严寒酷暑、油气烟尘,甚至拍打等粗暴对待。

现在广泛使用的人脸、指纹、静脉技术,都还无法适应这样的环境。想要解决这些问题,除了识别方法上需要继续探索,更需要从工程层面去提升可靠性,实现多模态整合。

身份认证现在有一半以上是在金融领域使用,接下来政务和专业服务也会逐渐普及。但身份认证进一步向民生领域渗透之前,需要先解决安全性问题。


数字公民的安全挑战

生物识别虽然好用,但是也有一个致命的隐患:不可撤销。

如果你发现你的某个密码被盗,你可以马上修改。但如果你的指纹、虹膜、人脸的原始数据被非法存储、拦截、盗取,你几乎是永远无法撤销或者追回了,如果别人利用盗取的生物特征数据做了违法的事情,你可能还没办法证明那不是你干的!数字公民的数据量越大,盗取生物特性信息的利益也就越大。

现在生物信息采集器的标准,更多还是针对电、磁安全,对数据安全没有做要求。未来一定会有相关的强制性国家标准,确保信息采集、传输、存储的安全。能够参与标准制定的企业,很可能能够与生物信息数据中心更好交互,拿到第一波红利。


多元应用场景

生物识别除了在身份认证、安防、客流分析上应用,现在也有很多其他有趣的应用案例。

个性化推荐——选择困难症的福音。物质极大丰富的今天,人们在选择上花了更多的时间和金钱,个性化推荐或许可以帮人们“只选对的,不买贵的”。

在图书馆、书城投放的广告机,可以根据人的性别、年龄、着装风格等特征,推荐可能感兴趣的书籍。有些美妆品牌推出的智能镜,可以根据脸型、发型、肤色、风格推荐合适色号的唇膏,还可以“一键试妆”。在眼镜、服装、美业等行业,也有类似的案例。


二次元交互。基于人脸特征生成表情丰富的卡通头像,基于面部变化生成唇部动作和语音同步的二次元视频,基于人体动作捕捉在游戏中控制人物行为。

这些应用让人机交互、社交活动更有趣味的同时,也较少暴露隐私。

击键、签名、眼部的识别,未来的心跳、体味识别,也都有潜力做出有趣的交互方式。

更多信息的挖掘。生物信息除了包含“我是谁”这样的哲学信息,还隐藏“我怎么了”这样的人文表达。通过面部可以识别情绪,通过姿态、笔迹、声纹等了解身体的健康状态。


小结

生物识别是每个人都会接触到的AI。

个人便携设备上的人脸、指纹的识别,理论上属于可以被攻击的技术。但是目前信息安全的所有攻防手段中,从个人设备的生物识别入手进行信息盗取,并不是一个容易操作的、经济的选择(从网络侧动手还是首选)。

因此生物识别通过手机、电脑上的指纹识别、人脸识别,成功的在用户中留下了“既方便又安全”印象,突破了技术应用最初的信任障碍。

现阶段,人脸识别由于工程实施难度小、用户体验好等优势,得到了广泛的应用,投资的热度也很高,但是现在说胜负已分还太早。

一方面,当大部分人过分信任生物识别,个人的信息、财产通过一部手机就可以获取的时候,从终端入手进行攻击,就有可能是最优选项。那时,唯一性、稳定性、安全性都更好的虹膜、静脉识别,应该也找到了改善体验、适应各种环境和条件的方法,那时它们就可能重新变成身份认证的核心方法。

最好的智能不是“我说你做”,而是它发现你的需要,并把需要做的事情都做了。因此,生物识别最终会藏身于家居、汽车、工厂、医院、学校、园区、办公楼等社会的各个角落,深刻的改变人与物的关系。