2019中国人工智能产业报告(一)

浏览: 时间:2019-12-18

引言

   又到年底,德勤、赛迪智库、清华大学、IDC、工信部等,人工智能相关的产业研究院、投资机构、媒体等,相继发布了今年的人工智能报告。

小HUI将用一个系列分享研读这些报告的笔记。

   分享内容主要围绕计算机视觉、自然语言处理等AI技术,在安防、医疗、自动驾驶、工业制造、办公、服务、家居等领域的应用,包括实现的典型功能,存在的主要难点等。也会大概梳理主要的技术进展和头部公司。

范围上,除了当前热点的技术和应用,也包含属于人工智能领域,但已经广泛应用的技术。

  小HUI希望这阶段的分享维持“从需求看技术”的角度。有任何建议,欢迎留言交流。

  这个系列的分享将从计算机视觉开始,小HUI会分6~8期来记录计算机视觉在文字识别、工业视觉、生物识别、智能安防、自动驾驶、智慧医疗等领域的应用。

第一期是对计算机视觉应用的概述。

第一期:计算机视觉概述

1 什么是计算机视觉

  计算机视觉,作为一门计算机学科,是利用摄像机和电脑代替人眼,使得计算机拥有类似于人类的那种对目标进行分割、分类、识别、跟踪、判别决策的功能。

  从应用的角度看,让计算机看见、看清、识别、理解图像和视频,以及根据图像和视频预判、决策的技术,通常都归于计算机视觉。

  计算机视觉一个完整的处理过程如下:

图片

计算机视觉完整处理过程


计算机视觉对图像的处理,分为感知智能和认知智能两个层次:

  • 在感知智能层,计算机通过摄像头获取光学图像或视频,经过提取、标注、识别等处理后,能够“看见”,并辨别“是什么”。感知的结果类似于:图里有一个水族缸和两个人。

  • 在认知智能层,计算机将前面感知的信息,结合其他方式获得的语义上下文,应用知识、联想、记忆、推理等方法处理后,能够“看懂”,并在理解的基础上进行人机交互。认知的结果类似于:Jake和爸爸去长隆海洋公园看鲸鲨。那天他们真开心。

一般而言,感知层实现的功能相对通用,处理结果可以在很多应用中使用。实现认知层的功能,一方面需要特定领域的知识,另一方面需要进一步采取后续行动形成闭环,因而很难通用。

目前计算机视觉的大部分的应用集中在感知智能层面,例如:人脸识别、拍照搜索、文字识别等。

感知智能在特定行业也有案例,例如:金融行业的风控、自动驾驶的行人意图识别、安防领域的人员违规行为识别等。


2 计算机视觉的应用

OCR

计算机视觉技术最早的应用,是计算机文字识别(OCR)。OCR的意思是“光学字符识别”——对图像中的印刷体或手写文字进行识别,转化成电子文档。

纸质、电子化文字资料在使用上各有优势:纸质资料方便查看和标记,电子化资料便于存档和检索。OCR使得纸质资料能够快速、方便地录入到计算机中,保持纸质、电子化资料的一致性。

OCR现在的应用已经不限于印刷物上的文字提取,这项技术出现了两个分支:手写体识别和自然环境中印刷体识别。前者在教育和办公场景中有很好的应用前景;后者在安防、自动驾驶、工业视觉等领域,提供多模感知的一种信息源。


工业视觉

工业视觉是和计算机视觉并列的分类,都属于机器视觉。二者的市场容量也在同一个级别。

工业视觉在工业生产的各环节中,进行自动的识别、检测、测量、定位,提升加工、装配、质检、分拣等各环节的效率,提升产品质量、降低工人劳动强度。

工业视觉在制造业已经应用了十多年,最早应用于半导体和电子行业,现在在汽车制造业大规模落地,未来还可能在印刷、包装、食品、药品、仓储等领域快速增长。

工业视觉的落地,在每个行业都有大量的工程问题需要解决,但底层技术的瓶颈并不太多。随着工业4.0的推进,将会进入高速增长期。


生物识别

计算机视觉另一个比较成熟的应用,是人体生物特征识别(简称生物识别)。生物识别是指通过指纹、视网膜、虹膜、指/掌静脉、掌纹/掌形、人脸、步态、声纹、笔迹等人体的生物特征,进行个人身份的鉴别和认证。其中,除了声纹以外,其他的识别方法都属于计算机视觉范畴。

传统的身份认证是用户名+密码,或者实体卡片、钥匙等,容易忘记、丢失、被盗取,或者被仿制。生物识别使用人与生俱来、差异性大、稳定性好、难以仿制的生物特征来进行身份的认证,更加安全和便捷。

生物识别已经广泛用于银行、国防、机场、高铁等高安全级别的场所,以及门禁、移动设备解锁、个人支付等场景中的身份认证。


智能安防

计算机视觉目前最大的应用市场是智能安防(大约60%的市场)。智能安防主要帮助相关部门实现:事后追踪、事中报警、事前预警,一方面降低违法行为的发生频率,另一方面也减轻工作强度。

公共区域虽然有大量的监控摄像头,但需要进行人、车、物追踪的时候,还是需要人工调取和分析,不仅工作量大,而且依赖经验。在人流密集的区域,为了及时发现异常,需要专职人员时刻观察摄像头抓取的现场信息,极易产生疲劳和疏忽。

智能安防现在可以实现无人值守场地(如地下车库)的看管、开放区域内的跨镜头目标(主要是人、车)追踪、落脚点分析、追逃和寻人、人流密集区域,会议/活动/展览的主动安全预防等。


自动驾驶

自动驾驶是计算机视觉最具潜力的应用方向之一。2019年全球在人工智能领域的投资,有10%都投给了自动驾驶。

L4/L5级自动驾驶——高度/完全自动驾驶——将会彻底改变城市交通的管理方式,小汽车将成为公共交通的主体。也会改变人们的出行方式,绝大部分个性化的市内交通需求都可以即时满足,私家车将不再必要。

这个领域目前的应用主要在toB,如自动驾驶卡车或特种车辆在矿区、港区、建筑工地、农田,以及长途货运的应用。此外还有园区低速通勤、接驳、递送,或清扫作业。

乘用车方面,城市公交和出租车,目前尚在试运营测试阶段。

toC的应用主要是小型乘用车的ADAS功能应用,如自动泊车和高速公路自动行驶。


智慧医疗

近年来,人工智能、大数据在医疗领域的手术机器人、医学影像分析、辅助诊断、药物研发、疾病预测、医院管理等方面有广泛的应用。

计算机视觉在医疗上最典型的是医学影像分析。通过病灶自动识别与标注、影像的三维重建等,帮助医生提高诊断的准确性和效率。目前已经可以用于肿瘤筛查、眼底筛查、X线胸片阅片、脑疾病诊断、骨伤鉴定、骨龄分析、病理切片分析、皮肤病辅助诊断等。

医学影像的三维重建,加上AR/VR的显示技术,还被用于辅助诊断和手术导航。在诊断时帮助评估病变程度和康复水平。在手术中准确找到病变位置,减少对其他组织的破坏,实现精准医疗。


其他

计算机视觉的应用不限于上述领域,toB的如:

  • 零售系统中基于人脸的会员管理和客流统计;

  • 视频网站上自动检测和屏蔽不良内容;

  • 金融领域网上银行的身份验证等。


toC的应用以高质量拍照、照片美化、拍照识别为主。如:

  • 智能手机/智能相机的人像拍摄、HDR、夜景等功能;

  • 手持云台对目标的自动跟拍;

  • 对照片的后期美颜、风格化处理、自动标记等;

  • 拍照翻译、以图搜图、拍照识别植物、酒类、商标等;

  • 对食物进行拍照识别,合理评估和安排膳食。


计算机视觉和硬件结合,还有一些机器人方面的应用,如:

  • 以绘本阅读为代表的教育类机器人;

  • 扫地机器人、智能猫眼和门锁等智能家居产品;

  • 能自动跟随和导航的家用或服务机器人;

  • ……

    3 白皮书摘录

以神经网络算法为基础的深度学习,让计算机视觉的应用门槛降低、落地效率提高。直接促进了计算机视觉在民生、安全、家居、制造、娱乐、服务等产业的广泛应用,满足各个行业对数据化,以及基于数据进行质量、成本、效率、体验改进的需要。


企业服务中的智能营销,金融中的智能风控,大健康中的智能影像诊疗,汽车中的自动驾驶(ADAS)系统和机器人中的服务机器人,是人工智能领域的热门投资对象。

其中,长期最被看好的是自动驾驶,它将深刻变革汽车行业的产业链。机器人领域的投资今年以来,热度有所降低。

AI在金融领域的应用最深入,而在制造业领域的应用潜力则被长期低估。


政府在人工智能应用落地上发挥了重要作用,一方面对AI有明确的政策导向和产业支持;另一方面在自动驾驶等民生领域、智能安防等公共领域,政府也是AI产品重要的买家。


人工智能领域这些年的投资额、人才储备、论文和专利数量,都有明显的提升,和美国等先发国家的差距正在缩小。

图片

各细分领域专利申请比例


但积累的时间还不够,从基础到应用都还有明显的、甚至数量级上的差距:

1、基础层包含计算芯片、数据、算法三部分。

  1. 国内在终端专用计算芯片上有了长足的发展。在云端计算芯片上,BAT也都有布局,阿里的云端计算芯片已经发布并用于阿里云平台。在通用计算芯片上,目前还是空白

  2. 国内科技企业通过互联网发展期的积累,获得了海量的数据,这些数据现在也推动了计算机视觉、自然语言处理上的发展。

  3. 国内在算法、算法框架、训练框架上投入的科技公司非常少,这些方面的差距也非常明显。

2、技术层包含计算机视觉、自然语言处理、语音识别、机器学习等细分领域。国内的进展主要集中在工程应用领域,而这些技术所需的通用和专业数据集、知识库的建设还有非常大的差距。

3、应用层包含医疗、安防、金融、无人驾驶等,国内的产业应用发展的非常快,边落地边改进是国内的AI应用快速发展的基础。在应用层的短板,主要是国内的科研成果转换还缺少科技企业家群体的参与,以及鼓励和支持科技企业家创新的生态。


未来几年的人工智能预计会维持40%以上的增长,OCR、图像识别、人体与人脸识别、自然语言交互的智能客服等,会在金融、制造、互联网和信息服务等领域加速落地,支持企业在运营、客服、营销等方面降低成本、提高效率、创新业务。