译文题目: 在智能家居中从视频中检测个人活动 摘要——论文阐述了在智能家居环境中个人活动的检测。我们的系统是基于一个强大的视频跟踪器,创建和使用一个广角摄像头跟踪目标。该系统采了对用输入目标位置,大小和方向的翻译。对每一个目标进行翻译,产生活动分类,如“走”,“站立”,“坐”,“吃饭”,或“睡眠”。贝叶斯分类器和支持向量机(SVMs)相比,获取和识别到先前定义的单个活动。这些方法在记录的数据集上被评估。然后提出一种新型的混合分类器。此分类器结合了生成的贝叶斯方法和区别性支持向量机。贝叶斯方法用于检测先前地看不见的活动,而支持向量机在识别获取活动类别的例子上被展示了能提供搞的区别力。记录的数据集的混合分类器评估结果表明,当识别系统看不见的活动时,生成和区别性的分类相结合方法的优于单独的方法。 一,引言
本文介绍了一种用于检测在智能家居环境下的个人活动的系统。目的是检测预定义的和看不见的活动。提出的系统是基于使用一个广角摄像头创建和跟踪移动目标的可视化的跟踪过程。提取目标位置,大小和方向,作为每个目标的活动识别输入。
本文的两个贡献:首先,贝叶斯分类器和支持向量机(SVMs)相比,从视觉目标属性中获取和识别基本的个人的活动(“走”,“站立”,“会议”,“吃饭”,“睡觉”)。 在数据集中这两种方法都被测试和评估,记录在智能家居环境的实验室样机。其次,为识别预先看不到的活动提出了一种新型的混合分类器。贝叶斯方法用于创建一个有依据的数据模型。关于这个模型的概率确定与否,可以归结预定义的活动种类。如果是,支持向量机是用来确定获取活动种类。如果不是这样,一个错误检测或一个新的活动类(所获取到的)被识别。该混合分类器在记录数据集中已经进行了测定和评估。 二,方法
在下面,我们提出从视频检测活动的方法。首先,我们对智能家居环境和强大视频跟踪系统进行了简要描述。接着,阐述活动种类和记录的数据集。最后,贝叶斯分类器,支持向量机和混合分类器的分析和提出了对数据集的结果。
2.1智能家居环境
在本文中所描述的实验是在实验室进行模型的一个智能家居客厅环境。环境包含一个小桌子周围三扶手椅和沙发(图1左)。在这环境中,麦克风阵列和摄像机安装在所有墙壁。在本文中,我们专注于使用一个单一广角镜头,摄影机安装在智能房间的一个角落里(图1中)沙发的对面。
图1。我们的智能房(左)地图,广角相机视图显示灰色(中),广角摄像机的图像(右)
广角照相机观察环境与一帧率之间的15和20每秒图像(图1)。一个强劲跟踪系统实时检测和跟踪视频图像目标。 2.2视频跟踪系统
在我们的智能环境中,一个强大的视频实时跟踪系统[3][11]被用来探测和跟踪移动的用户。通过基于背景差集或标准化颜色直方图强度的能量检测值可检测到目标。这个视频跟踪系统返回每个视频帧的属性向量。每个向量都包含的一个被系统检测和跟踪的目标位置,大小和方向。返回为每个目标性能最高的地位(x,y)的边界椭圆,半径的第一和第二轴椭圆和角度描述椭圆的方向(图2)从目标跟踪过程也可确定附加功能包括速度或能量。
图2。强大的跟踪仪估计目标内容
2.3个人的活动和数据集
五类基本的活动识别:“走”,“站立”,“坐”,“吃饭”和“睡觉”。 为了开发和评估检测过程中,我们录得8个环境中的短视频序列。在这些序列,一个或若干个个人在不同的智能间房的基本的活动。表1所示的帧的数量和分布的序列中播放的不同的活动。视频序列中的播放个人的活动已经被手工标记来用来获取和评估。
这标记过程由强大的跟踪系统检测每一帧对每个目标分配一个活动标签。如果检测到的目标并未做任何的五个基本的活动,贴标机有可能分配一个“无活动”的标签。
因此,每8个数据集包含一个目标属性(X,Y,第一半径,第二半径,角度)和相关活动的标签列表。
表1,视频序列和分销活动的画面编号(%) Video Sequence No. Frames Class 1 1352 Walking 2 6186 Standing 3 4446 Sitting 4 4684 Inter. Table 5 4027 Sleeping 6 4477
7 3067 8 3147 Total 31386 2.4获取和识别个人的活动
通过使用机器获取的方法,我们的系统是要找到一个检测到信息(每帧目标性质)和个别活动之间的关系来作为被提供了手动标签人的感知和标记。我们特别侧重于贝叶斯方法,因为它们很好地适应处理错误的传感器数据,他们在许多应用领域已经被证明是有用的,尤其是计算机视觉[8] [10]。在下面,我们将在记录的数据集中首先介绍和评价贝叶斯分类器和支持向量机。然后,我们为确定不可见的活动种类将提出和评价一种新型的结合了贝叶斯方法和支持向量机的混合分类器。 2.4.1贝叶斯分类器
在传感器数据和相关活动标签的基础上,我们力图获取相关活动的概率分类。 贝叶斯分类被类似分类的[7] [10]中提出。分类以帧数完成,即分类器作为输入
% in data sets 0.18 0.09 0.44 0.19 0.10 帧的目标属性并生成作为输出帧的活动预报。我们设法确定活动aMAP的最大后验概率(MAP),给定的目标属性集T(方程(1))。
aMAP = arg max P(a | T ) (1)
Pa | TP(T|a)P(a)P(T) (2)
我们应用贝叶斯定理(2),我们进一步假设的先验概率P(a)活动的每一帧都是相等的。作为常数的分母可以因为argmax消除,我们可以得到方程(3)。
aMAP = arg max P(T | a) (3)
我们为每个活动模拟P(T|a),在获取的数据中通过运行EM算法[1]作为多维混合高斯分布估计。混合高斯模型的初始值被设置为一个高值(128); 混合高斯分布过少的相继消除。
我们对使用8折交叉验证视频序列的录音评估分类(见表1)分类。每个序列已被用于测试一次,同时获取其余7序列模型。贝叶斯分类器的总体结果可以看出,左边的列在表2。我们评估了三种不同的目标属性集合T.第一组图像中的位置的X,Y。这结果很好的展现了在环境中被识别的个人活动的位置。然而,位置非常依赖环境的配置,例如沙发和椅子的位置。因此,第二个目标集(第一,第二,角度),其中只包含形成椭圆的形式,而不是它的位置。结果是得到相当类似的位置。第一和第二的目标属性集(X,Y的角度来看,第一,第二)的结合的提供的最好的结果。 2.4.2支持向量机
为了进一步提高识别结果,我们使用支持向量机(支持向量机)作为分类。支持向量机[2] [5]通过支持向量数据集测定,由过平均误差最小化进行分类,。一个支持向量被输入集合所记录,在特征空间勾勒出超平面轮廓。L -维超平面,其中L是输入向量特征,定义了不同阶层之间的边界。简单分类的任务是,以确定哪一方的超平面的测试载体驻留。
试验载体可以映射到一个更高(可能无限)维空间的函数φ。SVM找到一个最大的分离超平面在这个高维空间的边距 K(xi, xj) = φ ( xi )φ ( x j )被作为一个内核功能。对多层次分类、“最后通过仿真实验证明了”的分类为每个k类,可以执行。这个测试数据的分类是由一个在每一个二进制比较增量的优胜者的计数器上投票策略实现的。这种类是由所有类别进行了比较后计数器值最高的被选取。
我们评估了对视频序列的录音使用8折交叉验证(见表1)分类。一个径向基函数与C= 11.0和γ= 11.0显示我们的有依据的数据是合适的结果。LIBSVM库[4]已经用于实施和评价。
SVM的整体结果显示在表2的右列。SVM和贝叶斯分类广泛应用。也就是说,每个帧的目标属性是用来产生活动标签,独立于其他帧的的值。由于SVM是一种区别性的方法,优化分类之间给定/有依据的类别,优于贝叶斯分类器。然而,SVM不获取对于一个给定的数据集的结构,但有唯一的边界之间的类别。因此,SVM是很难或不可能拒绝看不见的测试数据或发现新的类别的活动。 表2。贝叶斯分类和SVM的识别率 Bayesian Classifier SVMs X,Y Mean 0,7696 0,7855 Std. dev. 0,0469 0,0398 1st, 2nd, angle Mean 0,7691 0,7811 Std. dev. 0,0393 0,0469 X,Y,1st,2nd,angle Mean 0,8150 0,8610 Std. dev. 0,0146 0,0276 2.4.3混合分类
支持向量机是一种区别性的分类方法,该方法在特别的数据集中优于生成贝叶斯分类器。然而,支持向量机不提供有关是否是一个新的数据项目和有依据数据集的连贯的可靠的信息。虽然概率性的支持向量机[9],生成的概率仅是指有依据的类别内的分布。错误的目标检测或新的活动种类,作为看不见的数据不能被确定。这些数据将被归结为一个现有的类别。贝叶斯分类器是一个生成分类方法,该方法生成有依据的数据模型,为没一个新数据项目提供了一个可能概率的输出。一种混合分类器相结合每种方法的优点:贝叶斯分类和SVM的辨别力的概率输出。
图3。扩展贝叶斯分类器,混合分类器和支持向量机
在下面,我们提出了一种结合了能识别无法看见数据的贝叶斯方法和识别可见数据的支持向量机的混合分类器。我们将比较扩展贝叶斯分类和经典SVM的方法。
分类体系在图3中可以看出 用于测试和评估,我们会限制自己的完整的目标属性集(X,Y,角度,第一,第二)。
在章节贝叶斯分类中,我们使用公式(3)在确定一个新的数据项的类别 我们仿照P(T|a)每项活动的多维混合高斯分布由EM估计。我们通过建模延长此外P(T)作为多维混合高斯分布由EM估计。P(T)使人们可能从有依据的数据集模型估计出一个有一定概率的新数据项目。通过使用这种概率值的阈值,我们可以决定是否在新的数据项目获取类别或是否是看不见的数据(如错误检测或新的类别)的一部分。从有依据数据集(基于类别的数据项的概率极小)的可自动临界值。
混合分类器(图二)结合类别有衣裾的支持向量机估计的P(T)(生成模型)。 如果数据项支持向量机决定可见的数据,确定本项目的类别。在评估方面,我们比较混合分类器用一个扩展的贝叶斯分类器(图3)和经典的支持向量机(图三)。 扩展贝叶斯分类中结合经典贝叶斯分类中相的的P(T)的估计。我们要表明,混合分类器胜过一个纯粹的贝叶斯分类器和一个纯粹的支持向量机。
我们评估了三个不同的分类上的视频序列用8倍交叉验证的记录(见表1)。为了测试看不见的数据分类,我们为了测试看不见的数据分类,我们排除了每个类别一次从有依据的数据集中排除了每个类别从有依据的数据集。这使得在5 * 8=40的测试运行。这分类所有结果有表3所示。混合分类器优于扩展贝叶斯分
类器和完整的数据集合的支持向量机。
表3贝叶斯分类器,混合分类器和支持向量机的整体识别率 Bayesian Classifier Hybrid Classifier SVMs Mean 0,7523 0,7786 0,7101 Std. dev. 0,0550 0,0639 0,0840 表4显示了已排除有依据的混合分类的活动类别的TP率,FP率,精度,Recall和F-measure。这些结果对扩展的贝叶斯分类是相同的,因为看不见的类别检测的两个类别的P(T)的概率值是一样的。作为经典的支持向量机是没有依据来检测不可见的类别,对于支持向量机的TP率,FP率,精度,Recall和F-measure都为零。看不见的活动的“站立”和“相互作用”的检测结果是普通的。从一个活动的角度来看,更多频繁地类别(“走”和“坐”) 这两个类别重叠,这也说明检测错误。然而,一个鲜明的活动类别,如“沉睡”,很容易识别。整体利率表明,该方法可用于识别看不见的活动类别。
Table 4活动类别的TP率,FP率,精度,Recall和F-measure“走”(0),“站立”(1),“坐”(2),(F值3),“睡觉”(4)) Class % in data TP rate 0 0,18 0,7374 1 0,09 0,0108 2 0,45 0,7467 3 0,19 0,5336 4 0,10 0,8476 Total 1,00 0,5752 3结论
我们提出了一种智能家居环境中视觉检测的方法,这种方法是基于创建和跟踪现场广角摄影图像中的目标的强大的跟踪系统。一个贝叶斯分类器和支持向量机用于分类。这两种方法已提取的目标属性(X,Y,第一半径,第二半径,角度)为了获取和检测单个目标的活动类别,“走”,“站立”,“坐”,“吃饭”,“睡觉”。 在记录的数据集中,这两类分类的评估都显示了良好的效果。为了检测看不见的活动类别,混合分类结合贝叶斯方法区别性的支持向量机的性能被提出。看不见的类别在记录的数据集中的整体检测结果是良好的。混合分类器优于贝叶斯分类器和支持向量机,表明提出的生成组合和区别性的方法是有用的。
FP rate 0,1356 0,001 0,2677 0,1217 0,0631 0,1178 Precision Recall F-measure 0,6481 0,7374 0,6763 0,3938 0,0108 0,0208 0,6576 0,7467 0,6713 0,6845 0,5336 0,5867 0,6557 0,8476 0,723 0,6079 0,5752 0,5356
因篇幅问题不能全部显示,请点此查看更多更全内容