不再需要证明你是你--AI报告解读

浏览：时间：2020-03-07

计算机视觉另一个比较成熟的应用，是人体生物及行为特征识别（简称生物识别）。生物识别是指通过指纹、视网膜、虹膜、指/掌静脉、掌纹/掌形、人脸、步态、声纹、笔迹等人体的生物或行为的特征，进行个人身份的鉴别和认证。其中，除了声纹以外，其他的识别方法都属于计算机视觉范畴。

传统的身份认证是用户名+密码，或者实体卡片、钥匙等，容易忘记、丢失、被盗取，或者被仿制。生物识别使用人与生俱来、差异性大、稳定性好、难以仿制的生物特征来进行身份的认证，更加安全和便捷。

生物识别所用的生物和行为特征

1 应用概述

生物识别已经应用的十分广泛：

日常生活中，比如智能门锁，智能手机的指纹和人脸解锁。买东西时刷脸支付，在银行和金融证券的线上系统操作时的指纹和人脸验证等。

工作中，比如指纹、人脸，或者虹膜的门禁和考勤系统。保密单位或岗位上，登录工作系统的权限验证。

公共服务中，比如电子护照或身份证的验证，医疗保险和养老保险远程发放验证，各种自助服务中的人证核验等。

在生活工作以外，比如公安、司法和刑侦系统中，大量使用生物识别技术进行验证、核查、侦察等方面的工作。

在人们可能不太注意的地方，比如图书馆的智能交互屏，根据用户的性别、年龄、风格特征，以及借阅记录，推荐可能感兴趣的书籍。

生物识别的应用，按使用目的大致可以分为认证、匹配、画像三类。

通常提到生物识别的应用，都会用认证的应用场景来举例，但是生物识别的用途其实不止认证。

认证——确认自然人的身份。认证的目的是让自然人获得信息系统的权限，比如，网上银行通过人脸识别确认“我”是小HUI，可以对小HUI的银行账户进行任何操作。高铁闸机，通过摄像头捕捉的人脸和身份证图像比对，确认是自然人持有的合法证件，且有票务信息，可以放行。

匹配——关联不同信息系统中同一个人的信息。一种是跨系统整合信息，比如跨镜头追踪，把同一个人在不同地点和角度的画面整合起来，绘制行动轨迹和特征画像。一种是跨系统信息碰撞，比如在大型集会入口抓取观众人脸图像，和公安违法信息进行碰撞，发现可疑人员。

画像——给出个人或人群画像。画像通常是为了商业目的，比如商业体分析某个区域顾客的整体性别和年龄分布、着装风格，是路过、无差别闲逛，还是有目的购物等，据此进行动线设计。

智慧零售，《德勤-2019中国人工智能产业白皮书》

认证是普通消费者最常接触到的生物识别应用，这个场景通常只采集用于验证的1、2种用户信息，比如人脸+指纹。

匹配和画像在特定领域解决问题则复杂一些，通常需要识别多个维度的信息，相互关联印证。比如跨镜头追踪，除了需要识别面部、服饰，还需要通过步态识别，把一个人的正面图像和背影图像做关联。

生物识别的各项技术，目前的普及程度差别很大。走入规模商用的，主要是人脸、指纹、虹膜和静脉：

安全性和准确性最高的是虹膜和静脉识别，识别率能达到近100%，目前多用于安全防护级别高的银行、国防、机场等场所种，核心控制区的身份认证。同时这两项技术的成本也是最高的，由于使用体验和价格的原因，没能被各个行业广泛应用。

应用范围最广的是指纹识别，占有超过50%的生物识别市场份额，这项技术的成本也是最低的，目前广泛用于门禁、解锁、个人支付等场景中的身份认证；

人脸识别的应用范围正在高速扩张，这项技术有非接触、无感知的特点，几乎适用于一切安全防护不太高的公共场所的身份认证，以及移动终端的解锁、支付等。同时这项技术的成本较低、可以得到多维度的信息，目前在44%的金融企业，21%的制造企业，20%的信息服务企业都有应用（数据来自量子位）。

单一的生物识别技术，在数量到达百万级时，都会有一定的误识别率，因此，在安全性要求高的领域，一般使用多模态（如指纹+人脸，掌纹+指纹，人脸+指纹+声纹等）生物识别。

生物识别市场格局（2019年7月）

2 生物识别的基本过程

生物识别的不同方法之间，采集的图像不同，分析的特征也不同，但是大概的步骤比较类似：

生物识别的基本过程

3 哪个技术更好？

我们在很多媒体上都可以看到类似“人脸识别的准确率达到99.8%，即将爆发”这样的描述。这里有两个误区：

1、衡量生物识别的，不是一个唯一的“准确率”指标，而是分为误识率、拒真率。

2、实验室能够达到的水平，和真实环境中能够做到的水准，可能有数量级上的差别。

误识率——多大可能判断“他就是你”。

误识率由识别所依据的生物和行为特征决定，受在库数据量的影响。

不同的生物和行为特征包含的信息量不同，这决定了个体间差异是否明显，进而决定了这种方法能够达到的、最低的误识率。信息量最大的是掌静脉、虹膜，而人脸、声纹的信息量相对比较小。

在库数据量小，比如只有一个小学的样本，数据间的差异一般比较大，认错的可能性就不太大。如果需要在整个城市的人口样本中识别“他是谁”，认错人的可能性就非常大，需要辅以人工或其他的确认方法。

拒真率——多大可能回答“我不认识你”。

拒真率的影响因素比较多，比如特征的稳定性、所处的人体部位，以及图像采集方法等。

和误识率不一样，无论使用哪个生物或行为特性都可以做到很低的拒真率——只要不考虑误识率。比如：分析完员工小王的指纹后回答：我认识你（低拒真率），你是员工小李（高误识率）。

拒真率必须和误识率一起考虑，信息量大的生物和行为特征，通常能同时达到较低的拒真率和误识率。

特征稳定性高，则任何时候提取到的特征值都很稳定，不容易发生拒真。

有些特性会随着年龄变化，比如静脉、耳朵、人脸、声纹、掌形等；

有些与身体状态有关，比如生病就会影响声纹、步态、签名、击键等；

虹膜、指纹、掌纹几乎终身稳定不变。

特征所处的人体部位如果暴露在体表，则比较容易受环境影响或者被人为改变，导致某些情况下发生拒真。

指纹识别会受干、湿、污损手指的影响；

人脸识别会受到化妆、穿着、遮盖等的影响；

步态、击键等可以人为控制；

在同时有多个人的声音时，声纹识别就无法工作；

静脉、虹膜等则不太容易受环境影响或人为改变。

不同的图像采集方法决定了能采集到的信息量和数据的准确程度。

通常需要用户配合的采集方式，采集的数据比较完整和准确，但同时用户体验会不太好。

因为光线和角度会严重影响人脸的图像采集，所以在银行、高铁的身份认证中，会要求用户看镜头，并同时补光，确保得到可信的识别结果，完成自动、自助通关；在安防中用户没有感知，识别结果就仅供参考，需要人工确认。

指纹的采集方案中，电容方案的应用最广，但射频方案才拥有最高的准确性。

可以看出来，不同生物和行为特征所包含的信息量（唯一性）和信息的稳定性，基本上就决定了每种生物识别方法的准确性。

特征的生物学特性

生物识别还有两个比较新的领域：基于心脏（心跳波形）的生物识别；基于体味的生物识别。目前都只有小样本的实验，没有能够证明唯一性、稳定性的统计数据

这可能也是为什么指纹、虹膜、掌纹的应用研究开展的比较早。2005年中科院就申请了在移动设备上可以使用的掌纹识别的专利。

但是为什么2010年后，人脸识别开始成为科技公司投资的热点？毕竟从技术上看，人脸既不容易做到很好的识别效果，干扰因素又多。

4 人脸识别有什么优势？

为什么“先天条件”不好的人脸识别，现在得到了最快的发展？

先说结论：技术的性能指标很重要，但易用性、可维护性对应用至关重要。

首先：人脸识别的“先天缺陷”可以解决，使技术满足实用要求。

实用化.1：技术的限制可以规避。

从国际大赛公开的数据看，人脸识别目前准确率在99.8%，这意味着每1000个人，就有2个认错或者不认识。这还是在实验室，针对指定数据集的比赛结果，真实世界的情况可能几十个人就会认错一个。这肯定是没法用的。

为什么我们在高铁、机场已经可以刷脸入闸，好像也很顺利呢？

这是因为在工程应用中，把1：N的问题转换成了1：1的问题。通俗一些说，原本需要菊厂的HR看一眼，说出这人是我厂的谁谁谁，实际工作中变成了员工把工卡递给HR，判断这是不是我厂的谁谁谁。前者为了避免见谁都说不认识（拒真），标准只好稍微模糊一点；后者则可以提高标准仔细核对细节。

因此，刷脸入闸这样人证核验中，准确率可以做到99.99999%。

当然，标准提高会导致拒真率也升高，在高铁闸机，也确实经常会遇到识别不通过的情况。但在人脸识别良好的交互体验和结果的可验证，使高拒真率不成为致命问题。

图片来自网络

实用化.2：相对优秀的用户体验。

在大部分的技术落地中，导致最后无疾而终的，通常不是技术问题彻底无法解决，而是没有办法做到良好的体验，使用户持续使用。

在接近20种生物识别的方法中，可以不需要用户刻意主动配合就采集到生物特征信息的，有大概7种，其中人脸是唯一性和稳定性最好的一种。

识别准确率高的指纹、掌纹、虹膜、静脉，都需要以用户的主动配合为前提，其中，指纹、掌纹需要用户直接触摸采集器；虹膜、静脉需要用户靠近到距离采集仪20、30cm以内。

当发生拒真的时候，人脸识别的闸机，只需要用户再看一眼摄像头（顺便吐个槽，拍出来实在难看），就可以重试，就算重复了好几次，用户也只会认为这机器太傻。

其他的采集方案就没有这么友好了，用户需要以正确的角度、距离、位置配合机器伸出手或头，如果需要重复试，会显得用户自己很傻，十分容易引起抵触。

解决了这一步还不够，还需要有最终的人工兜底措施，防止极端的拒真情况。

特征的采集特点

小HUI观点：指纹、掌纹的接触式采集方式，很可能会限制它的适用场景。在个人设备、熟人的公用设备上通常不会有接受度的问题。但是在开放的公用设备上，相当比例的用户会担心采集仪被前面的用户污染。此外，一些宗教原因也会导致的接受度的问题。

实用化.3：识别结果可解释、可验证。

在所有的生物识别方法中，人脸识别是唯一个可以人工的、不借助任何设备，就能完成结果验证的方法。

这样，当一个用户无论如何都没法通过自动身份认证的时候，还可以求助工作人员，转由人工进行身份的确认，不会让流程卡死。

规避技术限制 + 良好的用户体验 + 结果可解释可验证，使人脸识别满足了实用的要求。

除了实用性，人脸识别的广泛的应用还有两个有利条件。

有利条件.1：比较容易取得客户信任。

企业采用新技术对操作过程做自动化改造的时候，会需要一个建立信任的过程。

如果自动化流程中完全无法人工校验、核对，在自动化流程卡壳、结果错误时，客户也就没有办法自己确认是否真的有问题，问题的归属是软件系统、客户自采硬件还是用户，那么建立信任的过程就会很漫长，被放弃的可能性也会很大。

人脸识别的结果可解释、可验证，这意味着用户有机会介入自动化流程，这种透明、可控的状态，对建立信任特别有用。即使需要多轮迭代才难最终满足需求，由于过程中的客户体验良好，客户也更能有耐心给与持续的支持。

有利条件.2：高性价比

人脸识别的前端设备是摄像头，它有非常多元化的应用场景。

对于身份认证而言，人脸识别有先天缺陷，但人脸包含了其他特征没有的信息，比如年龄、性别、风格、情绪，甚至行为、意图（需要结合人体姿态信息）等。

这使得摄像头在安防、工业、教育、办公、零售、金融和个人消费电子等领域，都有广泛的应用。

摄像头的所有应用场景都要求摄像头做到：高还原度、高分辨率、高可靠性。

一方面是规模效应吸引的大量玩家，一方面是旺盛的性能提升需求，这使得摄像头几乎是性价比最高的图像类传感器。

可以说，人脸识别的胜出，是市场和工程共同推进的结果。

5 应该怎么选择？

虽然指纹获得了最大的市场，人脸获得了最多的投资，但生物识别的各项技术，还是各有用武之地。

安全防护的等级，是生物识别方法选择的首要约束。

安全防护根据失效所造成的影响定级。

如果失效导致的可能影响比较小，比如：企业的主要工作流程不受影响，只是慢一些；对个人造成比较小的财产损失等，则系统只需要做到比较低的安全防护级别。

反之，如果失效导致的可能影响巨大，比如：企业的工作职能无法履行；造成大范围的社会不良影响；出现严重法律问题等，则系统就需要做到比较高的安全防护级别。

生物识别的安全防护级别，取决于误识率（把他认成你）和防伪性能（通过盗取、复制、仿冒等手段欺骗系统的可能性）。

特征的安全性

一般来说，暴露在体表的特征更容易被盗取、复制、仿冒。静态特征比动态特征更容易仿冒。

小HUI认为，“声纹支付”是安全级别和技术选择错配的典型——用户通过语音控制音箱进行购物，通过声纹验证完成支付。认证的标准严格一些，用户体验不好；松一些，则可能造成经济损失。

如果想要通过支付应用倒逼声纹验证的技术发展，在早期需要设置一个“安全旁路”——比如语音交互完成以后，用户可以选择在APP或PC上确认订单。这样，用户尝鲜的风险更小，更有可能持续使用。

工作环境和识别对象，影响生物识别方法的选择。

室外、光线变化非常大的环境，步态就比人脸更能胜任全天候的工作。

粉尘、污染的环境，就无法使用指纹、静脉、虹膜这样相对精密的方案。

特殊工种，比如穿防护服后进行权限验证、矿井的上下井打卡，就无法使用人脸和指纹。

文化和法规，限制生物识别方法的选择。

在一些宗教国家，所有利用人体生物特征进行识别的方法，可能都不能使用，只能使用行为特征，比如签名，来进行识别。

不同国家和地区有不同的隐私和敏感信息保护法规，相应的，诸如人脸识别这样敏感的技术，应用范围也会受限。（在欧洲，敏感信息是那些可以回溯到自然人的信息，人脸信息是首当其冲的敏感信息）

6 机会

身份认证会是数字化社会的基础设施

随着信息化的发展，每个人都将有一个数字化身份。数字公民包含一个自然人方方面面的信息，除了人脸、指纹、虹膜等生物特征，个人的社会活动如工作履历、社工服务，以及财产、征信、健康情况，甚至还包含日常的经济活动等。

随着数字公民的信息完善，身份认证必然会被更广泛的使用，未来的生活中，可能医院、学校、办公室、厂区、餐厅、商店、充电站、公交和地铁站，甚至私家车、家庭都会有各式各样的身份认证终端，每一个场所和设施，都可以根据个人的权限、特点和过往选择，让人得到更便捷、个性化的服务。

生物信息采集器在未来除了以独立硬件的形态出现，更多还会作为一个模块嵌入各种设备和设施中，作为用户交互的一部分，和设备一起“running in the wild”，经历日晒雨淋、严寒酷暑、油气烟尘，甚至拍打等粗暴对待。

现在广泛使用的人脸、指纹、静脉技术，都还无法适应这样的环境。想要解决这些问题，除了识别方法上需要继续探索，更需要从工程层面去提升可靠性，实现多模态整合。

身份认证现在有一半以上是在金融领域使用，接下来政务和专业服务也会逐渐普及。但身份认证进一步向民生领域渗透之前，需要先解决安全性问题。

数字公民的安全挑战

生物识别虽然好用，但是也有一个致命的隐患：不可撤销。

如果你发现你的某个密码被盗，你可以马上修改。但如果你的指纹、虹膜、人脸的原始数据被非法存储、拦截、盗取，你几乎是永远无法撤销或者追回了，如果别人利用盗取的生物特征数据做了违法的事情，你可能还没办法证明那不是你干的！数字公民的数据量越大，盗取生物特性信息的利益也就越大。

现在生物信息采集器的标准，更多还是针对电、磁安全，对数据安全没有做要求。未来一定会有相关的强制性国家标准，确保信息采集、传输、存储的安全。能够参与标准制定的企业，很可能能够与生物信息数据中心更好交互，拿到第一波红利。

多元应用场景

生物识别除了在身份认证、安防、客流分析上应用，现在也有很多其他有趣的应用案例。

个性化推荐——选择困难症的福音。物质极大丰富的今天，人们在选择上花了更多的时间和金钱，个性化推荐或许可以帮人们“只选对的，不买贵的”。

在图书馆、书城投放的广告机，可以根据人的性别、年龄、着装风格等特征，推荐可能感兴趣的书籍。有些美妆品牌推出的智能镜，可以根据脸型、发型、肤色、风格推荐合适色号的唇膏，还可以“一键试妆”。在眼镜、服装、美业等行业，也有类似的案例。

二次元交互。基于人脸特征生成表情丰富的卡通头像，基于面部变化生成唇部动作和语音同步的二次元视频，基于人体动作捕捉在游戏中控制人物行为。

这些应用让人机交互、社交活动更有趣味的同时，也较少暴露隐私。

击键、签名、眼部的识别，未来的心跳、体味识别，也都有潜力做出有趣的交互方式。

更多信息的挖掘。生物信息除了包含“我是谁”这样的哲学信息，还隐藏“我怎么了”这样的人文表达。通过面部可以识别情绪，通过姿态、笔迹、声纹等了解身体的健康状态。

小结

生物识别是每个人都会接触到的AI。

个人便携设备上的人脸、指纹的识别，理论上属于可以被攻击的技术。但是目前信息安全的所有攻防手段中，从个人设备的生物识别入手进行信息盗取，并不是一个容易操作的、经济的选择（从网络侧动手还是首选）。

因此生物识别通过手机、电脑上的指纹识别、人脸识别，成功的在用户中留下了“既方便又安全”印象，突破了技术应用最初的信任障碍。

现阶段，人脸识别由于工程实施难度小、用户体验好等优势，得到了广泛的应用，投资的热度也很高，但是现在说胜负已分还太早。

一方面，当大部分人过分信任生物识别，个人的信息、财产通过一部手机就可以获取的时候，从终端入手进行攻击，就有可能是最优选项。那时，唯一性、稳定性、安全性都更好的虹膜、静脉识别，应该也找到了改善体验、适应各种环境和条件的方法，那时它们就可能重新变成身份认证的核心方法。

最好的智能不是“我说你做”，而是它发现你的需要，并把需要做的事情都做了。因此，生物识别最终会藏身于家居、汽车、工厂、医院、学校、园区、办公楼等社会的各个角落，深刻的改变人与物的关系。

上一篇: 2019中国人工智能产业报告（一）

下一篇: 南山新品发布会健康专场活动