光学课堂 首页 资讯 查看内容

眼动追踪与捕捉

2022-1-25 09:53| 发布者:Davis| 查看:839| 评论:0|原作者: 小小光08

摘要:眼动追踪是一种记录人眼在观看过程中眼球运动的技术,眼动仪是一种用于记录眼球运动的硬件,通过记录视网膜和瞳孔反射的红外线来确定注视位置。眼球运动对聚焦事物是必要的,同时也是重要的信息过滤机制。眼动追踪技术已广泛应用于数据分析和远程测试等领域。

 
眼动追踪是一个识别某人在看什么、怎么看的过程。
眼动追踪技术起源于阅读研究。19世纪后期,研究人员意识到,人们的眼睛并非像以前假设的那样平滑地浏览文字。这种非官方的、自主的观察促使研究人员开发出测量眼部运动的技术,以便更好地理解人们如何阅读。
第一台眼动追踪装置出现在20世纪初。这些眼动仪器具有侵入性,因为它们依赖安装在眼周皮肤上的电极,或者是研究参与者不得不佩戴大型的、让人不舒服的隐形眼镜。
此后不久,非侵入式眼动追踪技术开始出现,它们可以记录反射在眼睛上的光或直接拍摄眼睛。
自那时以来,眼动追踪技术的进展就集中于减少眼动仪对研究参与者的约束,同时提高这些装置的精度和准确性,并且简化数据分析。
同时,眼动追踪研究也有助于研究者进一步理解眼动不同方面与人类认知过程之间的关系。眼动追踪首次应用于用户体验相关研究可以追溯到1947年,当时保罗·菲茨和同事研究了飞行员如何使用驾驶舱内的仪器提供的信息操作飞机的降落[插图]。然而,当时仍然主要由学术界和医学研究者使用眼动追踪。直到20世纪末和21世纪初,这种技术才开始在从业者中广泛应用,这主要得益于它成本的降低和可用性的提高。
 
1.什么是眼动仪?
眼动仪。它是一种硬件,记录你在观看计算机屏幕、物体,甚至你周围环境时的眼球运动。有些眼动仪会贴在你戴的一副眼镜或者一顶特殊的帽子上。其他的眼动仪可以放在你面前,就像那些附在计算机显示器上的一样。
眼动仪将红外线照射到你的脸上,然后记录两件事:从视网膜反射的红外线(这有助于找到瞳孔的中心),以及从角膜反射的红外线(这称为角膜反射)。
视网膜、瞳孔和角膜是眼睛的一部分,如图1。视网膜是眼球后壁的光敏感组织。瞳孔是一个黑色的圆孔,允许光线进入视网膜。角膜是位于眼球前壁的一层透明膜。
图1:人眼的主要构造
 
如果保持头不动,向左、右、上、下这4个方向看,,角膜反射不会移动,只有瞳孔会移动。你可以看出瞳孔中心与角膜反射变化之间的关系,如图2。
图2:头部保持不动,瞳孔和角膜反射的相对位置会随眼球转动而改变
 
人眼往哪儿看是由从瞳孔中心相对于角膜反射的位置确定的。
如果在观察同一部位时稍微移动一下头,瞳孔中心和角膜反射之间的关系不会变,如图3。即使我在移动,眼动仪也能反映我在看同一个地方。
图3:头部移动但看着同一部位,瞳孔和角膜反射的相对位置不会改变
 
现代商业眼动仪包括两个主要组件:第一个组件是近红外线的光源,用于在眼睛中产生反射。第二个组件是对近红外线敏感的摄像机。摄像机聚焦在眼睛上并记录反射。然后,软件计算出注视位置,并将它叠加到你正在查看的图像上。
眼动仪使用近红外线主要是因为近红外线不可见,这样就不会分散注意力,但可以通过眼睛反射。
同时,眼动仪使用的近红外光的曝光量只是安全指南允许的最大曝光量的一小部分。即使用眼动仪跟踪你的眼睛数个小时,眼睛也不会有危险。
 
另外,低成本解决方案使用现成的网络摄像头来提取和跟踪人脸上的眼睛特征,而不是依赖红外线。网络摄像眼动追踪最常用于远程测试,参与者在家里或在工作中使用他们的计算机而不必去实验室。与标准的红外设备相比,目前网络摄像眼动追踪的一个局限性是准确性较低。当参与者四处移动或搬动他们的计算机时,准确性会进一步下降——这在远程会话中很难控制。此外,网络摄像头对注视位置的采样率相对较低,这极大地限制了数据分析。
 
2. 眼球为什么会运动?
在不旋转时,在视野范围内,人眼水平方向上覆盖范围约180°(左侧90°,右侧90°),垂直方向上覆盖范围为90°,如图4。只要你的眼睛是睁开的,你所看到的图像就会投射到视网膜上。视网膜细胞将图像转换成信号,然后传输到大脑。负责高视觉灵敏度的细胞聚集在视网膜的中心,称为中央凹。当你直视某物时,它的图像会落在你的中央凹上,因此,它比中央凹外的图像更清晰、更丰富多彩。
图4:当直视前方时,人的视觉范围约为180°,但只有2°属于清晰的中央凹视野

中央凹的区域相当小,它的视野范围只有2°,它所占比例通常被类比为手臂长度中大拇指甲的长度。即使在称为副中央凹(2°~5°)区域的中央凹外侧,图像也会变得模糊,而在外围则变得更加模糊,如图5a所示。因此,眼球运动对于聚焦事物是必要的,如图5b所示。同时,这也是一个重要的信息过滤机制——如果一切都突然集中在一起,你的大脑就会信息超载!
 
图5:中央凹与眼球的运动
 
人的眼睛每秒从一个地方跳到另一个地方几次(平均3~4次)。这些快速运动称为眼跳,是人体外部器官所能产生的最快的运动。为了防止模糊,你的视力在眼跳过程中会受到抑制。视觉信息只在注视时被提取,也就是眼睛相对静止并聚焦于某物时,如图6所示。注视持续0.1~0.5s,之后眼睛移动(通过眼跳)到视野的下一部分。虽然还有一些其他类型的眼球运动,但由眼跳和注视组成的眼跳运动是最常见的,也是用户体验研究中最有趣的。
图6:注视图表示一个人在火车时刻表上查看时刻时的眼球运动轨迹。
圆点表示注视点,连接圆点的直线表示眼跳。注视点的大小与注视时间成正比
 
3. 为什么要做眼动追踪?
大量的研究已经证实,你的目光所处的位置通常与你所关注和思考的事物有关,尤其是当你怀着一个目标去看某件事的时候。这被称为眼-心假说(the eyemind hypothesis)。
缺乏注视并不总是意味着缺乏注意力,注视并不总是表示注意力,但两者在很大程度上是同时发生的。注意力实际上比眼睛略微超前,因为它计划眼睛的下一个目标。一旦眼睛移动到那里,注意力就会帮助将处理资源分配给被注视的事物。知道用户关注的方向有助于研究人员评估和改进产品。
人的视觉行为会受到迫使人看东西的任何意识(自下而上的注意)以及人心甘情愿地看东西的意念(自上而下的注意)的影响。自下而上的注意是由刺激驱动的。注意力不自觉地转移到与周围环境形成反差的对象上。例如,鲜艳的颜色和运动可以吸引你看到一些东西。在熟悉的环境中,新鲜和意想不到的事物也会吸引你的注意力。
如果自下而上的因素是唯一影响人们注意力的因素,那么不管每个人知道什么,也不管他们试图实现什么,他们都会以同样的方式看待这个世界。这种一致性肯定会让你的研究更容易,
由于自上而下因素的参与,情况并非如此。自上而下的注意是由知识驱动的,它依赖于你的经验和期望。你会有意选择查看与你的目标相关的信息。
眼球的运动与任务有关。这意味着,如果给同一个人不同的任务,他会以不同的眼光看待同一个对象。例如,为了试图确定手机的品牌,或者为了试图确定手机是否能够上网,如图7所示,在完成这两个任务时,查看手机包装的同一个人会产生不同的注视模式。正是这种自上而下的关注导致了这些差异。
图7:同一个人对相同的包装在不同任务下产生了不同的注视模式
 
4. 不同类型的眼动仪---远程眼动仪与可穿戴眼动仪
在用户体验研究中,有两种主要的眼动仪:可穿戴眼动仪(如图8)和远程眼动仪(如图9)。两者的主要区别在于跟踪过程中设备的位置。可穿戴眼动仪佩戴在参与者的头上,而远程眼动仪则是非接触式的,放置在参与者面前的固定位置。
图8:可穿戴眼动仪
图9:远程眼动仪
图10:两种主流眼动仪的比较
 
到底是选择可穿戴眼动仪器还是远程眼动仪?
一方面,一般的经验法则是使用远程眼动仪,除非你确定你的研究需要一个可穿戴眼动仪。原因是可以更好地进行科学控制和更高效的数据分析。因此,虽然你可以使用可穿戴眼动仪在屏幕上测试网站或图像,但是远程眼动仪会让你更轻松,这主要是由于更自动化的分析。另一方面,如果你的目标是验证在机场或火车站标识的内容和位置的可用性,可穿戴眼动仪将是你的最佳选择。因为参与者会四处走动,所以用远程眼动仪无法进行这种类型的研究。
另一个更适合使用可穿戴眼动仪的好例子是开箱即用的研究,其目的是获取产品的初始用户体验。开箱即用的研究可能要求参与者检查产品包装,打开盒子,取出产品,并试图在参考说明书的同时设置它。在这种情况下,远程眼动仪就不合适了,因为参与者会拾起东西并移动它们。物体可能会阻碍眼动仪和参与者眼睛之间的路径,这项任务所需要的头部运动可能超过了远程眼动仪所允许的范围。
当这两种眼动仪看起来都合适的时候,决策就取决于生态效度、科学控制和分析数据简易性两方面的权衡。一方面,生态效度与测试环境和任务与被调查的真实情况的相似性有关。生态效度越高,研究结果更容易推广到“现实世界”。另一方面,科学控制是指研究人员能够在多大程度上影响研究环境,从而尽量减少不必要的变量对研究结果的影响。
 
5. 眼动仪的主要规格:
  • 采样率
采样率是眼动仪最重要的特征之一,以赫兹(Hz)为测量单位,表示眼动仪每秒记录人注视位置的次数。这意味着每秒钟采样率为120 Hz的眼动仪可以对每只被跟踪的眼睛收集120个数据点,在30min的眼动追踪过程中记录了超过20万个数据点!它们将通过软件很好地组合成有意义的注视。
目前可用的采样率范围很广,从25Hz到2000Hz。如果你只想确定人们在看哪里,较高的采样率在识别注视位置方面并不比较低的采样率做得更好。然而,采样率越高,就越能精确地测量注视开始时间,注视持续时间的误差就越小。25~30Hz的系统测量的注视持续时间误差为±20ms,而250 Hz的眼动仪测量的注视持续时间误差仅为±2ms。
因此,如果你不仅对测量人们看哪儿感兴趣,而且对测量多长时间感兴趣,那么你应该注意到这种误差,因为它会增加数据中的噪声。为了减小误差,你应该瞄准更高的采样率。或者,你可以收集更多的数据(例如,通过测试更多的参与者)来消除噪声。
对于用户体验研究,一般的经验法则是50~120 Hz。这些采样率将产生±10ms或更小的注视持续时间误差。一个典型注视持续的时间介于100~500ms(即0.5s),这样的误差在用户体验领域里通常是可以接受的。为了研究测量眼跳的特性(例如,其速度)以及微眼动,需要250Hz和更高的采样率,这可能是神经科学等其他领域感兴趣的。
 
  • 准确度和精密度
眼动仪的准确度是眼动仪记录的注视位置与实际注视位置之间的平均差值。你可能希望这个偏移量尽可能小,但是期望它等于零是不现实的。
准确度是以视角的度数来测量的,如图11a。典型的眼动仪准确度值介于0.5°~1°。例如,在一台68cm远的计算机显示器上,准确度为1°意味着注视半径不到1.3cm。换句话说,实际的注视位置可以是以准确度为1°的眼动仪记录的注视位置为圆心,半径为1.3cm的圆内的任何地方,如图11b

图11:眼动追踪的准确度
 
眼动仪手册中报告的准确度是在理想条件下测量的,这通常包括没有佩戴矫正眼镜的测试参与者,并在校准后立即进行测量。在“真正的研究”中,戴眼镜或隐形眼镜的参与者或在校准过程中移动的参与者,报告的注视位置与实际注视位置之间的差异可能更大。
精密度是眼动仪能够可靠地再现测量结果的程度。理想情况下,如果眼睛注视位置在两次连续测量中都是同一位置,则眼动仪应报告这两个位置相同。那将是完美的精密度。实际上,目前可用的眼动仪的精度值介于0.01°~1°。这些值等于连续样本之间距离(以视角的度数计算)的均方根。因为制造商报告的精密值是根据静止的人造眼睛测量的,所以跟踪真实眼睛的精密度会降低。
 
准确度和精密度是不一样的,但它们经常引起混淆。表2表明了两者之间的区别。表中每个单元格中的十字表示实际注视位置,而这些点是眼动仪报告的注视位置。
图12:准确度与精密度的比较
 
  • 头箱尺寸
头箱表示远程眼动仪允许的头部移动的自由度,如图13所示。只要参与者的头保持在这个假想的框中,眼动仪就可以完成工作并跟踪眼睛的位置。
图13:眼动仪头箱显示的头部运动的允许范围
 
在眼动追踪过程中,头部保持完全不动是不可能的,而且在用户体验研究中,通常不会用腮托或其他装置来稳定参与者的头部。因此,头箱越大,由于头部运动而丢失的数据就越少。头箱的大小取决于眼动仪,但典型的范围是30~44cm长、17~23cm高、20~30cm宽。
可穿戴眼动仪没有指定的头箱。因为眼动仪与参与者的头部一起移动,所以没有运动限制。
 
  • 单目追踪与双目追踪
单目眼动仪只记录一只眼睛的运动情况,而双目眼动仪记录双眼的运动情况。理论上,单目眼动仪应该足够了。因为两只眼睛倾向于一起移动,所以通过观察一只眼睛的位置也可以确定另一只眼睛的位置。
另外,单目系统通常比双目系统更实惠。
然而,在用户体验研究中,双眼跟踪有以下优势。首先,由于双眼数据的平均,双目跟踪可提高准确度和精密度。然后,如果暂时无法跟踪一只眼睛(可能是由于参与者头部移动到头箱外面一点),信息也不会丢失,因为总是有来自另一只眼睛的数据。最后,了解双眼的位置有助于校正可穿戴眼动仪的视差误差。
 
  • 瞳孔照明法
典型的眼动仪会根据人瞳孔中心的位置和角膜反射的关系来判断人在看什么。
红外线发光二极管照亮参与者的眼,眼动仪上的摄像机可以检测和记录这两种眼睛特征。
根据二极管相对于摄像机的位置,可以使用两种不同的方法来照明眼睛:明瞳法和暗瞳法,如图14。两种方法都具有相同的目的:在瞳孔和虹膜(眼睛的有色部分)之间建立尽可能多的对比,以便使瞳孔易于区分。然而,每种方法的有效性取决于使用的条件和参与者眼睛的物理特征。
大多数眼动仪要么提供明瞳孔跟踪功能,要么提供暗瞳孔跟踪功能,但有些眼动仪兼而有之,并自动选择在特定情况下提供更高准确度的追踪。
图14:明瞳法和暗瞳法


路过

雷人

握手

鲜花

鸡蛋

最新评论

联系客服 关注微信 访问手机版 返回顶部