/ 基于深度学习的视频中人体行为识别研究_百威雷科技PowerArena

基于深度学习的视频中人体行为识别研究

视频动作分析

基于机器视觉的人体行为识别是将包含人体动作的视频添加上动作类型的标签。近年来, 随着视频采集传感器及信息科学技术的不断发展, 这方面的研究在视频监控、 人机交互、 基于内容的视频检索等方面逐渐成为一个具有广泛应用前景的研究课题。自动化监控对生产生活产生很大的影响, 可以应用在商场、 广场以及工业生产的监控中; 作为人机交互的关键技术, 可以将其作为智能家居的一部分应用在家庭中, 如监护小孩或者老人的危险行为等; 传统的视频检索方法都是人工对其进行标定, 其中有很多主观因素, 如果能够将人体行为识别方法应用到该领域, 将大大提高建立索引的效率及搜索效果。

当深度学习遇到视频大数据

深度学习方法以其强大的表示学习的能力,使得机器视觉在图像识别任务上能比人类视觉完成的更优秀,即机器与人眼相比已经能从图像上获得更多的信息。2016年ILSVRC的图像识别错误率已经达到约2.9%, 远远超越人类的5.1%。计算机视觉技术的突飞猛进和深度学习的发展不仅拓宽了图像领域的应用,同时也给互联网视频内容带来了新的可能性。

视频中的人体行为识别是通过计算机对一系列的视频图像帧序列进行视觉信息的处理和分析,从而自动识别视频中人的行为。在移动互联网的时代,公众的日常生活已经被大楼门禁、 交通摄像头、银行安保摄像头等包围, 无处不在的摄像头使得每个人的行为都能被监控,因此视频中的人体识别在安防领域大有可为。除此以外,分析和理解视频中的人体行为涉及目标检测,语义分割,运动分析以及姿态识别等多个研究课题,在智能视频监控,自动驾驶,人机交互以及智能看护等领域有着广泛的应用前景。那么行为识别系统会在这些应用场景中产生什么样的影响呢?

网络视频检索与分析

手机、数码摄像机、平板电脑等便携视频设备即拍即传,方便快捷,也使得互联网上的视频数据以指数级速度不断增长。2015年底,Google旗下影像分享网站Youtube视频上传量达到每分钟500小时。这些海量视频目前主要由上传者用文本进行标注,然而人工标注方式存在明显不足:不同人对某段视频的理解和描述可能不同,甚至同一个人在不同环境下对同一视频的描述也可能不同。人工标注信息的主观性导致视频分类结果准确度低,影响视频检索结果精确性。因此,引入智能行为识别系统对视频内容进行分析,自动调整视频标注信息,可有效降低人的主观性对标注信息的不利影响,提升视频检索精度。另外,行为识别系统还可以自动清除不适合在互联网上传播的不良视频。

智能监控视频分析

全球各地室内及街头监控摄像头在监控、保障人身安全的同时,也不断产生着海量监控视频数据。2003年以来我国就开展了大规模“城市视频监控与报警示范工程”建设,己建成的城市联网监控系统每天产生PB级监控视频数据单纯地依靠人工判别,从这海量视频中发现实时监控异常和可疑动作(如“有人丢下了一个手提袋”或者“有人把钱包丢进了垃圾箱”等)已变得极为困难:一是监控人员过多会导致人力成本过高,监控人员过少又无法及时监控到人们的异常行为;二是当监控视频工作人员注意力不集中时,无法及时发现一些危险行为并采取有效措施,危及公共安全。因此,使用异常行为识别系统来辅助或取代工作人员完成实时监控,可以解决成本与有效监控之间的矛盾。