› 首页 ›资讯 › 查看内容

技术前沿：AR显示及光学器件——元宇宙的窗口

2021-12-29 10:12| 发布者：Davis| 查看：3160| 评论：0|原作者: AIOT大数据

摘要：本文介绍了AR显示及光学器件的最新技术前沿，讨论了AR与VR的区别和发展趋势。着重分析了AR眼镜硬件和成本及最新产品，探讨了AR的应用场景和市场空间。同时介绍了VR上游供应链的完善和各大厂商产品市占率情况。文章指出，AR行业目前仍处于探索阶段，需攻克多个核心技术问题，包括微显示、光学和主芯片等方面。

市场对于VR的期望非常高，相比于VR，AR（增强现实）的场景可能会有更快更显著的规模落地。

AR最大的特性不是持续的沉浸式，让人有粘性（上瘾），而是给我们的办公生活带来便利，从这个出发点来说推动他应用场景的逻辑的动能将会更大，VR未来的想象空间当然更大，它相当于建立了一个虚拟文明，而AR从企业侧你只要能减少我的人力成本，场地成本，有效降低测试的错误率，你就是我优秀的生产力工具，也许AR未来会向扫地机器人一样成为企业工厂车间检测督查的必选品。

01硬件

图 1：AR 眼镜硬件成本占比

资料来源：华进资本，安信证券研究中心

图2：HoloLens拆解图

资料来源：华进资本，安信证券研究中心

表1：近期 AR 新品一览

资料来源：VR 陀螺，安信证券研究中心

图3：光波导方案技术原理示意图

资料来源：VR 陀螺，李琨《一文看懂主流 AR 眼镜的核心显示技术——光波导》，安信证券研究中心

（a）几何式光波导和“半透半反”镜面阵列的原理示意图，（b）衍射式光波导和表面浮雕光栅的原理示意图，（c）衍射式光波导和全息体光栅的原理示意图。

02软件

03平台 / 内容

图4：宝马推出 AR 应用 BMW i Visualizer

资料来源：591ARVR 资讯网，安信证券研究中心

图5：乐高发布 AR Studio

资料来源：腾讯网，安信证券研究中心

04应用

图6：AR 远程协作核心之：视频通讯

资料来源：青亭网，安信证券研究中心

图7：AR 远程协作核心之：可视化标注

VR上游供应链已基本完善，如光学、微型显示、主芯片、结构件、定位以及代工厂等都可提供稳定成熟的产品供应。这将进一步推动VR产业走向成熟。

▲VR头显总结与分析

目前市场主要VR厂商有Oculus、DPVR、Pico和HTC等。其中Oculus市占率超过50%，而HTC和SONY份额下降较快。其主要原因在于当前两公司的在售产品款式较老，同时又即将发布新款产品，导致大部分消费者选择观望。凭借Sony在游戏行业内多年的积累以及出色内容产出，是Oculus短期内最有力竞争者。

▲VR不同厂商产品市占率情况

▲各家公司产品活跃度情况情况

同样受益于宅经济，AR行业也迎来了增长。20年出货量为40万台，同比增长33%。21年预计出货70万台,同比增长75%。

▲AR出货量预测

AR行业目前上游还处于核心零部件和技术的攻关阶段，下游生态也并不成熟，同时产品定位也并不是很清晰。关于产品定位，目前对于AR的定位有两种：一是手机屏幕的延伸，二是替代手机是下一代的计算中心。两种产品定位对应两种完全不同市场空间，目前产品走向还并不清晰。

目前市场大部分AR厂商的操作系统主要是基于安卓做二次开发。但几家大型AR企业均在自研操作系统，如Hololens推出基于Windows的OS，Magic Leap则重新打造Lumin OS。总体看目前整体市场还没有出现完善的操作系统。

AR的下游应用还处在探索阶段，在C端还没有找到杀手级应用。目前大部分应用主要集中在目标识别，多用于行业解决方案。

AR的上游核心技术还并不成熟，诸多技术环节还在研发阶段。微显示：因为AR需要工作在外部环境，需要使用亮度很强的微显示产品。目前看Micro LED是最理想的解决方案。但目前Micro LED还处在技术攻克阶段，从衬底/外延材料、单片集成到驱动，目前都没有成熟的解决方案。

光学：目前主要方案有自由曲面、Birdbath、光波导的方案，目前看衍射光波导方案是未来主流方案。主芯片：目前行业主要使用高通晓龙8系列芯片，目前市场还没有专门为AR设备设计的主芯片。

▲AR上游核心技术情况

AR行业经历高开低走，产品策略从C端转向B端。由于技术问题，面向C端市场的的Google Glass和Magic LeapOne等产品销量远不达预期，随后大部分厂商纷纷转向行业应用市场。虽然进入短暂低谷期，但是仍是科技巨头未来重点方向。

Facebook苹果等科技公司正在加速开发面向消费者的增强现实（AR）眼镜。苹果从2006年开始申请了数百项有关AR的专利，还收购了10多家AR相关技术企业。Facebook于2017年首次宣布AR眼镜计划，之后接连申请了一系列AR技术相关专利。还正在研发AR眼镜搭配的腕带等产品。

VR上游技术，光学、显示技术不断革新

VR具有三大重要参数：FOV、PDD和 Persistence。

1、 FOV：视场角在光学工程中又称视场，视场角的大小决定了视野范围。在VR设备中视场角是最为关键的参数，市场角的大小直接决定了VR设备的沉浸感。为了得到更好的效果，需要VR设备的FOV做到90°以上。

2、 PPD：与传统屏幕衡量分辨率不同，VR等近眼设备衡量屏幕清晰度使用角分辨率PPD。指视场角表示平均每1°夹角内填充的像素点的数量。对于头戴显示类产品，PPD 数值越大，就说明对细节的显示越精细。

3、 Persistence：余晖效应指人眼在观察景物时，光信号传人大脑神经，需经过一段短暂的时间，光的作用结束后，视觉形象并不立即消失，从而产生眩晕感。为了降低晕眩感，VR设备需要高刷新率来降低屏幕余晖。

光学器件和屏幕的性能决定了上述三大核心参数。

光学镜片起到了放大屏幕图像提供合适的FOV,其次是帮助人眼聚焦清晰的看到屏幕。是VR系统中最重要的零部件。目前主要厂商产品FOV可以达到90°- 110°左右，未来产品向着160°方向进展。

目前总体看，为了进一步使VR变得更加轻薄，厂商多会选择采用菲涅尔透镜而不是非球面镜。同时为了更好的成像，厂商还会选择组合透镜的方式，来消除单一菲涅尔透镜带来的问题。

通常VR光学系统主要遇到以下几点问题：球面像差、色像差、畸变等。特别是为了消除像差问题，目前VR通常需要采用非球面镜。非球面镜表面曲率不同，可以让近轴光线与远轴光线所形成的焦点位置重合，从而消除球面像差的问题。除此之外，非球面边缘厚度小，可以降低光学系统的重量。

菲涅尔透镜，又名螺纹透镜，多是由聚烯烃材料注压而成的薄片。其在设计时会拿掉尽可能多的光学材料，而保留表面的弯曲度，所以菲涅尔透镜的质量要比传统非球面透镜轻薄很多。但菲涅尔的成像质量存在一定的瑕疵。由于菲尼尔透镜存在齿距和非工作面，所以会存在一球差问题，并且无法完全消除。

折叠光路，又称短焦距光学系统，预计是未来VR光学方案的主要方向。因为镜头需要将来自显示器的光聚焦到用户眼中，而光线的聚焦必须留以足够的距离，所以VR头显必须保持一定的厚度。折叠光路则是将距离”折叠到其自身，使光线可以在更窄的空间内穿越同样的距离。这样就可以使得整体VR设备变轻薄。

与传统光学镜头不同，折叠光路主要由偏光片、分光器和透镜等组成。缺点是光线经过多次反射会损失能量，所以需要亮度足够的显示屏加以配合。光学透镜目前主要使用光学塑料材料和注塑成型工艺作为首选方案，优势在于低成本和轻量化，注塑成型是VR光学透镜首选方案。

▲光学透镜加工工艺与塑料光学系统材料

整体加工过程主要分为填充阶段、保压阶段和冷却阶段。精密注塑成型是把注塑机料桶内的塑料熔融体精确的填充到模具型腔，塑料熔融体与模具型腔之间进行冷热交换而造成塑料熔融体的快速冷却，形成注塑零件的工艺过程。

影响注塑成型的关键因素主要包括模仁模具和注塑成型的仿真技术。模仁模具直接决定了镜片的性能和成本。

▲注塑成型的关键因素

产业链总体可分为光学塑料、光学镜片和光学镜头。其中光学镜头和镜片厂商通常为一家，但有时镜头厂商会把镜片产能外包到第三方。

PPD决定了屏幕的清晰度。与传统手机等屏幕不同，由于VR屏幕离眼睛近，所以引入了PPI的概念。在110°的FOV下，需要2800的PPI才能满足要求，对屏幕厂商提出了很大的挑战。为了减少余晖现象，VR设备需要高刷屏才能降低人们的眩晕感。这对驱动技术、像素材料带来了很大的挑战。

▲VR核心参数示意图

为了降低用户的眩晕感，必须降低余晖，加快屏幕的刷新率。如果刷新率可以达到200hz，眩晕感将大幅降低。VR显示屏正在从LTPS IPS屏幕逐步向硅基OLED迈进。屏幕的选择主要在刷新率、PPI和亮度直接权衡。其中刷新率是最为关键的指标，其次考虑PPI和亮度，所以目前看硅基OLED是最佳方案。

硅基OLED产业链主要分为上游：硅基Driver、OLED材料、滤光片和薄膜封装材料、中游主要为OLED制造和各类显示模组、下游主要为各类终端厂商。

▲硅基OLED产业链

AR上游，光波导+MicroLED是未来

AR的光学元件和VR有很大不同。AR需要See Through，与真实环境发生交互。所以AR的显示是不能直接放在眼前，需要放到眼睛旁边，这时需要一组光学元件将屏幕的像耦合到眼前。

▲VR与AR光学简易示意图

AR光学元件正在由自由曲面/Birdbath等向光波导演进。自由曲面等传统光学元件由于体积过大，使用它们制作出来的产品笨重，所以主流AR厂商都在选择使用光波导方案，可以让眼睛尺寸大幅缩减。但光波导的光学损耗很大，效率只有20%左右，需要光机进行配合。

光波导大致分为两类，一类是几何光波导，另一类是衍射光波导。其中几何光波导分为锯齿光波导和阵列光波导，主要代表光学公司是以色列的Lumus，市场上还未出现大规模的量产眼镜产品。

衍射光波导分为全息光波导和表面浮雕光栅波导。HoloLens 2，Magic Leap One均使用表面浮雕光栅波导，苹果公司收购的Akonia公司采用的是全息体光栅。

几何阵列光波导的概念最先由以色列公司Lumus提出并一直致力于优化迭代，至今差不多二十年。几何光波导主要由一系列半透半反镜面组成，其中镜面是嵌入到玻璃基底里面并且与传输光线形成一个特定角度的表面，每一个镜面会将部分光线反射出波导进入人眼。

几何光波导运用传统几何光学设计理念，不牵扯到任何微纳米级结构。因此图像质量包括颜色和对比度可以达到很高的水准。

阵列光波导的加工流程主要是研磨、抛光、镀膜和胶合四部分。何阵列光波导总体分为四个步骤，但由于传播的光线都是偏振光，所以要在小棱镜上镀十几甚至几十层膜。同时胶合5-7个不同反射比的透镜。总体看几何光波导工艺繁琐，很难保持高良率，量产难度大。

▲几何阵列光波导制造流程

衍射光波导主要分为全息光波导和表面浮雕光波导，通过衍射光栅替代传统几何光学器件。衍射光栅简单来说，是一个具有周期结构的光学元件，周期可以是材料表面浮雕出来的高峰和低谷，也可以是全息技术在材料内部曝光形成的“明暗干涉条纹”。

光栅波导技术采用镜片表面的光栅结构实现光束的扩展和耦出。通过合理的设计光栅结构，光栅波导技术可以实现出瞳的二维扩展。工艺相对简单，批量生产成本低。

▲衍射光波导示意图

表面浮雕光栅波导方案中通过使用亚波长尺度的表面浮雕光栅代替传统的折反射元件作为光波导中耦入、耦出和扩展区域的光学元件，从而实现对光束的调制。根据凹槽的轮廓、形状和倾角等结构参数的不同，常用的表面浮雕光栅可以分为一维光栅与二维光栅。

一维光栅根据剖面形状划分为矩形光栅、梯形光栅、闪耀光栅和倾斜光栅等，二维光栅常用的结构有六边形分布的柱状光栅。

由于可见光波长为450nm-700nm，所以光栅尺寸是微纳米级别的。之前需要通过半导体加工工艺进行制造，成本高。目前可使用纳米压印技术来制做光栅，其中包括热压法、紫外线纳米压印光刻法和微接触压印法（亦称为软光刻）。其中，紫外线纳米压印光刻是表面浮雕光栅波导批量生产的常用方法。

目前浮雕光栅制作的方法更加成熟。同时，压印设备已经可以实现国产化，进一步大幅降低了光栅制造的成本。

通过双光束全息曝光技术在介质中形成干涉条纹，从而可以获得折射率周期性变化的光栅结构。全息体光栅并不是通过结构图型而是通过材料的不同制作光栅，理论上全息光栅的衍射销率可以达100%，有更好的成像效果。

全息体光栅材料和量产工艺是当前门槛。材料端合成难度大，且多用于军用对我国禁运。在量产方面，激光脉冲法不适用于规模量产。所以在全息体光栅方案厂商需要具有IDM能力，提供从材料到量产完整的解决方案。

▲制造体全息光栅波简易工艺流程示意

目前AR光机有如下几种方案:LCOS、DLP、OLED-on-Silicon和MicroLED。目前AR产品主要使用DLP或LCOS，但是业内普遍对MicroLED方案达到共识，因为各维度参数没有死角，非常适用于AR的应用场景。但当前由于该技术还在研发中，预计25年左右可以初步看到量产方案。

▲各方案对比情况

LCOS硅基液晶（liquid crystal on silicon，LCoS），将液晶分子填充于上层玻璃基板和下层金属反射层之间，金属反射层和顶层 ITO 公共电极之间的电压共同决定液晶分子的光通性，而显示驱动电路直接在硅基板上完成制备。

LCoS 的显示原理为：入射的S偏振光经过液晶层，若液晶不产生扭转，达到底部金属反射层反射回来时仍为S偏振光，穿过液晶层射出。随后经过 PBS 棱镜反射回到原来光路，光线不进入投影光路，即此像素呈现“暗态”。反之，若液晶发生偏转，入射的S偏振光在经过液晶层时会发生偏振，可穿过 PBS 棱镜是，将进入投影光路，即呈现“亮态”。

LCoS制作工艺主要为通过半导体工艺进行刻蚀与沉积制造将液晶层和各种保护反射层制备到硅基驱动。目前由于LCOS量产工艺成熟，大部分参数都适配光波导，其目前是AR主要方案。

DLP Digital Light Processing数字光处理。原理与LCoS类似，但是不是通过液晶对光学进行处理，而是通过棱镜。

DLP核心在于DMD（Digital Micromirror Device），该核心MEMS器件由TI长期垄断。制作工艺主要为通过半导体工艺制作MEMS系统控制楞镜偏转，从而控制光路。

OLED-on-Silicon硅基OLED方案。原理与传统OLED方案，但由于在玻璃基板上很难驱动小尺寸的像素，从而用CMOS工艺来驱动小尺寸OLED像素。但由于OLED方案的光的亮度小，如果配合光波导在户外使用效果不佳。所以硅基OLED方案会限制AR的使用场景，目前看不是主流方案。

MicroLED是当前工人的AR显示的最佳解决方案，其刷新率、亮度、发光方式、像素密度等指标都可以提供最佳性能指标。目前是业界内比较公认的最佳解决方案。但由于其像素尺寸，间距都是几微米量级，给量产和全彩方案带来了极大的挑战。

MicroLED的工艺流程大致分为三部分，驱动背板、像素制备和晶圆键合。驱动背板由于没有标准，需要芯片设计厂商做定制化开发。像素制备由于发光效率问题，面临新的材料选择和相应的全彩方案结构设计问题。

▲ MicroLED全流程

MicroLED的一大难点在于，随着像素尺寸的缩小，EQE会降低，特别是红光。所以需要选择新的结构和材料。

▲ MicrLED发光效率

目前，MicroLED全彩色方案有四种方式。主要分为同质材料的全彩方案，主要使用AlInGaN/InGaN。对叠方案，其中红光和蓝绿光的材料不同，使用AlInGaP。最后一种是量子点技术，也是使用同质材料发光，通过量子点将蓝光转为红色和绿色。

MicroLED发红光的主要有两种方案。采用AlInGaN/InGaN为红蓝绿的像素材料，其优势在于全彩方案结构设计简单，但在GaN掺入In复杂。选择非同质材料AlInGaP为红蓝绿材料，优势在于AlInGaP技术相对成熟，但劣势在于全彩方案结构复杂，需要多次进行晶圆键合影响良率。目前两种方案都还没有成熟的量产方案。

MicroLED全彩方案采用蓝光+量子点技术，目前是短期可以实现量产的方案。该方法主要使用GaN制备蓝光，在与CMOS驱动背板键合，工艺和材料相对其他方案简单，易于量产。制备完像素后，在每个像素点喷涂量子点，使得蓝光转化为红光和绿光，完成全彩方案。

▲MicroLED量子点技术

目前AR最佳解决方案是波导+MicroLED方案，但由于MicroLED还在研发中，AR行业的成熟方案尚需一定时间。

▲AR不同光学产品与显示产品之间的匹配度

▲各家科技龙头企业都在积极布局全彩MicroLED方案。

近眼显示：Micro-LED 与衍射光波导成为当前探索热点

近眼显示受限于核心光学器件与新型显示的发展，整体发展相对迟缓。2020 年随着市场需求日渐清晰，业界对近眼显示领域表现出更高的期待。

在显示领域，快速响应液晶与硅基 OLED（OLEDoS）作为主流的显示技术，处于实质规模量产阶段，微型发光二极管（Micro-LED）有望迅速发展。快速响应液晶被广泛用于 2020 年发布的新一代代表性 VR 终端，如 Facebook Quest 2 即采用一块改良后的 Fast-LCD 替换了上代产品中的两块 AMOLED。

当前快速响应液晶屏成为多数 VR终端的常用选择，主要表现为以超高清（如 5.5 英寸 3840*2160 分辨率）、轻薄（2.1 寸 1600*1600）、成本（5.5 寸 2160*1440）为设计导向的三类技术规格；

硅基液晶（LCoS）作为 AR 终端常用的显示技术得到了一定发展与认可，但其较高功耗与较低对比度的不足限制了该技术的发展地位；

OLEDoS 可显著改善 LCOS 在对比度、功耗与响应时间等方面的性能表现，成为新近发布 AR 终端的主流技术选择，

2019 年底京东方在昆明量产；LBS 激光扫描显示已用于微软等部分行业巨头的相关产品，亮度、功耗与体积等方面的优势使得该技术获得业界关注，但须搭配较为复杂的光学架构实现功能，短期内市场预期有限；

Micro-LED 成为继 LCD 和 OLED 后业界期待的下一代显示技术，广阔市场前景致使诸多行业巨头加速战略布局，苹果（LuxVue）、脸书（InfiniLED）、谷歌（Glo、Mojo Vision）、英特尔（Aledia）等纷纷投资或收购该领域初创公司，业界正在规划的规格以 1.3 寸4K*4K 为主。

虽然 Micro-LED 具备低功耗、高亮度、高对比、反应速度快、厚度薄与高可靠等虚拟现实应用方面的性能优势，但现阶段由于 LED 外延成本较高，巨量转移的速度和良率尚未达到可量产的水平，当前 Micro-LED 显示技术正处在量产突破的前夕，梳理晶元光电股份有限公司、友达光电股份有限公司、镎创显示科技股份有限公司、三星等重点企业的发展进度可知，预计其规模量产时间在 2022 年左右；

在光学领域，作为下一代人机交互平台，虚拟现实呼唤以人为中心的光学架构，视觉质量、眼动框范围、体积重量、视场角、光学效率与量产成本间的权衡取舍、优化组合成为驱动技术创新的主要动因。

超薄 VR（Pancake）利用半透半反偏振膜的双透镜系统折叠光学路径，将头显重量降至 200g 以内，体积缩减至传统终端的三分之一，缓解了 VR 头显尺寸重量与便携性的痛点，且可保证较好的显示效果及更大的视场角；

折反式（Birdbath）得益于设计难度与量产成本的优势，触发了消费级 AR 终端的规模上量，基于这一传统技术路径的光学模组体积较大厚度减薄困难，眼动框范围受限，其光学系统须搭配算法缓解畸变，且光效难以高于 15%，效果和成本较大程度受限于微显示器的发展，高亮的 OLEDoS 成为最优搭配，目前我国已有厂商采用该技术大量出货；

自由曲面在早期得到业界认可，其显示效果、光效表现较好，但量产加工难以保持较高精度，局部精度下降可导致图像局部扭曲和分辨率降低，存在产品一致性难题。此外，通过厚棱镜观察真实世界会出现一定程度扭曲和水波纹样畸变，这些因素影响了自由曲面的发展潜力；

光波导在 AR 领域的技术发展前景明确，可进一步分为阵列和衍射光波导两大技术路线。相比其他光学架构，光波导外观形态趋近日常眼镜，且通过增大眼动框范围更易适配不同脸型用户，有助于推动消费级 AR 产品显著升级。

其中，阵列光波导采用传统光学冷加工技术，连续多层半透半反镜面阵列镀膜、贴合、切割等复杂多步工艺对产品良率提升提出较大挑战，量产成本难以降低。此外，基于阵列光波导的二维扩瞳方案对加工工艺的挑战极大，短期难以商用；

衍射光波导依循光学元件从毫米级到微纳级、从立体转向平面的技术趋势，采用平面的衍射光栅取代传统的光学结构。衍射光波导利用经过两次两个方向的扩瞳光栅或二维光栅以实现二维扩瞳，从而给以人为中心的光学设计与用户体验优化留有更大的容差空间。衍射光波导理论上具有较高的可加工性，成本可控，批量生产难度显著低于阵列光波导，现已成为国内外标杆企业研发创新的活力区。此外，为了改善色散问题，针对 FOV 和动眼框内的“彩虹效应”，如何用一层光栅作用于 RGB 三色且实现最大的 FOV 成为重要的技术挑战。

目前，衍射光波导根据光耦合器的差异可分为利用纳米压印技术制造的表面浮雕光栅波导（Surface Relief Grating，SRG）及基于全息干涉技术制造的全息体光栅波导（Volumetric Holographic Grating，VHG）等。其中，微软、Magic Leap 等多家 AR 明星企业的规模量产证明了 SRG这一技术路线在经济成本上的可行性，当前国内有条件建设该产线的厂商相对有限。全息体光栅由于受到可利用材料的限制，致使其在视场角、光效率、清晰度等方面尚未达到表面浮雕光栅的水平，但因其在量产经济性等方面的发展潜力，业界对此方向的探索未曾停歇；

可变焦显示成为当前解决辐辏调节冲突（Vergence Accommodation Conflict, VAC）的重要技术，继 2018 年脸书发布基于可变焦显示的第一代原型机 Half Dome 后，于 2020 年开始了第三代原型机实验室外场景环境下的集成验证，Half Dome 3 通过电子变焦取代了此前的移动式机械变焦，极大程度的优化了头显体积重量与系统可靠性，有望开启可变焦显示技术产业化的量产之路；全息显示通过全息方式显示多个焦面，可作为未来解决辐辏调节冲突的技术路径。目前，由于光相位调制器（SLM）价格昂贵、全息图生成算法尚不完善、所须计算量大且难以实时完成等因素致使该技术短期内难以推广应用。

▲虚拟现实近眼显示部分代表性技术路线

光波导：主流AR眼镜的核心显示技术

1、光波导，一个应AR眼镜需求而生的光学方案

增强现实(AR)与虚拟现实(VR)是近年来广受关注的科技领域，它们的近眼显示系统都是将显示器上的像素，通过一系列光学成像元件形成远处的虚像并投射到人眼中。

不同之处在于，AR眼镜需要透视(see-through)，既要看到真实的外部世界，也要看到虚拟信息，所以成像系统不能挡在视线前方。这就需要多加一个或一组光学组合器(optical combiner)，通过“层叠”的形式，将虚拟信息和真实场景融为一体，互相补充，互相“增强”。

图 1. (a) 虚拟现实(VR)近眼显示系统的示意图; (b) 增强现实(AR)近眼显示系统的示意图。

NED：近眼显示(Near-eye display，简称NED)

AR设备的光学显示系统通常由微型显示屏和光学元件组成。概括来说，目前市场上的AR眼镜采用的显示系统就是各种微型显示屏和棱镜、自由曲面、BirdBath、光波导等光学元件的组合，其中光学组合器的不同，是区分AR显示系统的关键部分。

微型显示屏，用来为设备提供显示内容。它可以是自发光的有源器件，比如发光二极管面板像micro-OLED和现在很热门的micro-LED，也可以是需要外部光源照明的液晶显示屏(包括透射式的LCD和反射式的LCOS)，还有基于微机电系统(MEMS)技术的数字微镜阵列(DMD, 即DLP的核心)和激光束扫描仪(LBS)。

这里做了一张简单的AR光学显示系统的分类和产品举例：

很显然，完美的光学方案还没有出现，才有目前市场上百家争鸣、百花齐放的状态，这需要AR眼镜的产品设计者依据应用场景、产品定位等来做权衡取舍。

我们认为，光波导方案从光学效果、外观形态，和量产前景来说，都具备最好的发展潜力，可能会是让AR眼镜走向消费级的不二之选。

02 光波导是如何工作的

在上述光学成像元件中，光波导技术是应AR眼镜需求而生的一个比较有特色的光学组件，因它的轻薄与外界光线的高穿透特性而被认为是消费级AR眼镜的必选光学方案，而随着微软Hololens两代产品以及Magic Leap One等设备对光波导的采用和量产，关于光波导的讨论热度也在持续增加。

其实，波导技术并不是什么新发明，我们熟悉的光通信系统中，用来传输信号的光纤组成了无数条连接大洋彼岸的海底光缆，就是波导的一种，只不过传输的是我们看不见的红外波段的光。

在AR眼镜中，要想光在传输的过程中无损失无泄漏，“全反射”是关键，即光在波导中像只游蛇一样通过来回反射前进而并不会透射出来。

简单来说达到全反射需要满足两个条件：

(1) 传输介质即波导材料需要具备比周围介质高的折射率(如图2所示n1> n2);

(2) 光进入波导的入射角需要大于临界角θc.

图 2. 全反射原理示意图

光机完成成像过程后，波导将光耦合进自己的玻璃基底中，通过“全反射”原理将光传输到眼睛前方再释放出来。

这个过程中波导只负责传输图像，一般情况下不对图像本身做任何“功”(比如放大缩小等)，可以理解为“平行光进，平行光出”，所以它是独立于成像系统而存在的一个单独元件。

光波导的这种特性，对于优化头戴的设计和美化外观有很大优势。因为有了波导这个传输渠道，可以将显示屏和成像系统远离眼镜移到额头顶部或者侧面，这极大降低了光学系统对外界视线的阻挡，并且使得重量分布更符合人体工程学，从而改善了设备的佩戴体验。

这里将波导技术的主要优点和不足罗列如下，希望读者阅读完本文后会对背后的缘由更加了解。

优点

• 增大动眼框范围从而适应更多人群，改善机械容差，推动消费级产品实现 – 通过一维和二维扩瞳技术增大动眼框。

• 成像系统旁置，不阻挡视线并且改善配重分布 – 波导镜片像光缆一样将图像传输到人眼。

• 外观形态更像传统眼镜，利于设计迭代 – 波导形态一般是平整轻薄的玻璃片，其轮廓可以切割。

• 提供了“真”三维图像的可能性 – 多层波导片可以堆叠在一起，每层提供一个虚像距离。

不足

• 光学效率相对较低 – 光在耦合进出波导以及传输的过程中都会有损失，并且大的动眼框使得单点输出亮度降低。

• 几何波导: 繁冗的制造工艺流程导致总体良率较低。

• 衍射波导: 衍射色散导致图像有“彩虹”现象和光晕，非传统几何光学，设计门槛较高。

图 3. 基于波导的AR眼镜外观原理示意图

03 光波导的不同分类

如文章第二部分所提，波导结构的基础是轻薄透明的玻璃基底(一般厚度在几毫米或亚毫米级别)，光通过在玻璃上下表面之间来回“全反射”前进。

如果我们基于全反射的条件做一个计算，会发现只有一部分角度的入射光能够在波导中传输，这便决定了AR眼镜最终的视场角(FOV)范围。

简而言之，越是大的视场角，就需要越高折射率的玻璃基底来实现。因此传统玻璃制造商比如康宁(Corning)和肖特(Schott)，近年来都在为近眼显示市场研制专门的高折射率并且轻薄的玻璃基底，还在努力不断增大晶元尺寸以降低波导生产的单位成本。

有了高折射率玻璃基底，区别波导类型就主要在于光进出波导的耦合结构了。

光波导总体上可以分为几何光波导（Geometric Waveguide）和衍射光波导（Diffractive Waveguide）两种，几何光波导就是所谓的阵列光波导，其通过阵列反射镜堆叠实现图像的输出和动眼框的扩大，代表光学公司是以色列的Lumus，目前市场上还未出现大规模的量产眼镜产品。

衍射光波导主要有利用光刻技术制造的表面浮雕光栅波导(Surface Relief Grating)和基于全息干涉技术制造的全息体光栅波导(Volumetric Holographic Grating)， HoloLens 2，Magic Leap One均属于前者，全息体光栅光波导则是使用全息体光栅元件代替浮雕光栅，苹果公司收购的Akonia公司采用的便是全息体光栅，另外致力于这个方向的还有Digilens。这个技术还在发展中，色彩表现比较好，但目前对FOV的限制也比较大。

这里还要区别一下真正的“全息技术”，其实这一直是个误区，全息光栅只是因为利用了类似于全息照相的原理来制造的，即用两束激光形成干涉条纹来调制光栅材料的特性以形成“折射率周期”，光栅本身并不能够全息成像。

04 几何光波导的工作原理及优缺点

“几何光波导”的概念最先由以色列公司Lumus提出并一直致力于优化迭代，至今差不多快二十年了。

图 4. 光波导的种类: (a) 几何式光波导和“半透半反”镜面阵列的原理示意图, (b) 衍射式光波导和表面浮雕光栅的原理示意图， (c) 衍射式光波导和全息体光栅的原理示意图。本图改编自https://hackernoon.com/fundamentals-of-display-technologies-for-augmented-and-virtual-reality-c88e4b9b0895

按图4(a)所示，耦合光进入波导的一般是一个反射面或者棱镜。在多轮全反射后光到达眼镜前方时，会遇到一个“半透半反”镜面阵列，这就是耦合光出波导的结构了，也就是几何光波导里的“光组合器”。

“半透半反”(确切说是“部分透部分反”)的镜面是嵌入到玻璃基底里面并且与传输光线形成一个特定角度的表面，每一个镜面会将部分光线反射出波导进入人眼，剩下的光线透射过去继续在波导中前进。然后这部分前进的光又遇到另一个“半透半反”镜面，从而重复上面的“反射-透射”过程，直到镜面阵列里的最后一个镜面将剩下的全部光反射出波导进入人眼。

在传统光学成像系统中，图像通常只有一个“出口”，叫做出瞳。这里的“半透半反”镜面阵列相当于将出瞳沿水平方向复制了多份，每一个出瞳都输出相同的图像，这样眼睛在横向移动时都能看到图像，这就是一维扩瞳技术(1D EPE)。

详细说明，假设进入波导“入瞳”的是直径4毫米的光束，由于波导只负责传输而并不把图像放大缩小等，那么“出瞳”的也是4毫米的光束，在这种情况下人眼的瞳孔中心只能在这4毫米的范围内移动并且仍能看到图像。

这样的问题是，不同性别和年龄的人双眼瞳孔间距可能从51毫米到77毫米不等，如果近眼显示系统的光学中心依据瞳距的平均值(63.5毫米)位置来设计，这就意味着有很大一部分人戴上这个眼镜看不到清晰的图像或完全接收不到图像。

有了这个扩瞳技术，动眼框范围通常能从最初的4毫米左右扩大到10毫米以上。你可能会产生疑问，多个出瞳，这样眼睛不会看到重影么？放心吧，出瞳面只是图像的“傅里叶面”，人眼瞳孔会从这个面截取完整的图像信息并用自带的“透镜”晶状体会将出瞳面透射到真正的“像面”（视网膜）上，因而同一角度的光还是会汇聚到同一个像素（视觉细胞），不会出现重影。

可能有点难理解，但这是扩瞳技术可行的精髓。动眼框的扩大解决了产品设计中的很多问题，例如机械设计容差、产品规格数目(需不需要分男版和女版)、用户交互体验等，将AR眼镜向消费级产品的实现大大推动了一步。

但是天下没有免费的晚餐，复制出瞳导致总的出光面积增大，自然而然在每一个出瞳的位置看到的通光量就减小了，这也是引起波导技术光效率比传统光学系统偏低的原因之一。

几何光波导运用传统几何光学设计理念、仿真软件和制造流程，没有牵扯到任何微纳米级结构。因此图像质量包括颜色和对比度可以达到很高的水准。

但是，工艺流程比较繁冗，其中一步是“半透半反”镜面阵列的镀膜工艺。由于光在传播过程中会越来越少，那么阵列中这五六个镜面的每一个都需要不同的反射透射比(R/T)，以保证整个动眼框范围内的出光量是均匀的。

并且由于几何波导传播的光通常是偏振的(来源于LCOS微型显示屏的工作原理)，导致每个镜面的镀膜层数可能达到十几甚至几十层。另外，这些镜面是镀膜后层层摞在一起并用特殊的胶水粘合，然后按照一个角度切割出波导的形状，这个过程中镜面之间的平行度和切割的角度都会影响到成像质量。

因此，即使每一步工艺都可以达到高良率，这几十步结合起来的总良率却是一个挑战。每一步工艺的失败都可能导致成像出现瑕疵，常见的有背景黑色条纹、出光亮度不均匀、鬼影等。

另外，虽然随着工艺的优化镜面阵列已经几乎做到“不可见”，但在关掉光机的情况下仍然可以看到镜片上的一排竖条纹(即镜面阵列)，可能会遮挡一部分外部视线，也影响了AR眼镜的美观。

接下来，我们重点分析下光波导的另一个类群 – 衍射光波导 (Diffractive Waveguide)，我们将着重讲解衍射光波导的工作原理，与几何光波导相比的优缺点，以及衍射光波导使用的两种主流光栅 – “表面浮雕光栅(SRG)”和”全息体光栅(VHG)”。

AR眼镜想要具备普通眼镜的外观，真正走向消费市场，衍射光波导，具体说表面浮雕光栅方案是目前的不二之选。目前诸如微软HoloLens一代和二代、Magic Leap One等多家明星产品，使用并用消费级产品证明了衍射光波导的可量产性。Rokid最新发布的Rokid Vision AR眼镜也是采用双目衍射光波导的方案。

制造衍射光波导所需要精度和速度都可靠的电子束曝光和纳米压印的仪器都价格不菲，并且需要放置在专业的超净间里，有条件建立该产线的厂商屈指可数。

下面，就让我们通过后半部分的内容，了解下对于AR眼镜而言，神秘又重要的衍射光波导技术。

05 衍射光波导的核心 – 衍射光栅

要想光机产生的虚像被光波导传递到人眼，需要有一个光耦合入(couple-in)和耦合出(couple-out)波导的过程，在几何光波导里这两个过程都是由传统光学元器件比如棱镜、“半透半反”镜面阵列完成的，过程简单易懂，但是具有体积和量产工艺上的挑战。在衍射光波导里，传统的光学结构被平面的衍射光栅(Diffractive Grating)取代，它的产生和流行得益于光学元件从毫米级别到微纳米级别，从“立体”转向“平面”的技术进步趋势。

那么衍射光栅是什么呢？简单来说，它是一个具有周期结构的光学元件，这个周期可以是材料表面浮雕出来的高峰和低谷 (图4b)，也可以是全息技术在材料内部曝光形成的“明暗干涉条纹”(图4c)，但归根结底都是在材料中引起了一个折射率n (refractive index)的周期性变化。

这个周期一般是微纳米级别的，与可见光波长(~450-700nm)一个量级，才能对光线产生有效的操控。

衍射光栅的“分光”体现在两个维度，如图5中所示，假设入射光是单一波长的绿光，它会被衍射光栅分成若干个衍射级(diffraction order)，每一个衍射级沿着不同的方向继续传播下去，包括反射式衍射(R0, R±1, R±2,…)和透射式衍射(T0, T±1, T±2,…)的光线，每一个衍射级对应的衍射角度(θm， m=±1, ±2, …)由光线的入射角(θ)和光栅的周期(Λ)决定，通过设计光栅的其他参数(材料折射率n、光栅形状、厚度、占空比等)可以将某一衍射级(即某一方向)的衍射效率优化到最高，从而使大部分光在衍射后主要沿这一方向传播。

图 5. (a) 表面浮雕光栅的部分衍射级和色散示意图, (b) 全息体光栅的部分衍射级和色散示意图， (c) 衍射光栅与分光棱镜的对比示意图。

这就起到了与传统光学器件类似的改变光线传播方向的作用，但是它所有的操作又都是在平面上通过微纳米结构实现的，所以非常节省空间，自由度也比传统光学器件大很多。

对于光波导而言，这一衍射角度还需要满足玻璃基底里的全反射条件才能在波导中传播，这在上一篇中有分析过。

在将入射光分成不同衍射级的基础上，衍射光栅的另一“分光”维度体现在色散，即对同一光栅周期来说，不同波长的衍射角度(θm)也不同。如图5所示，假设入射光是白光，那么波长越长的光线衍射角度越大，即图示的衍射角红光(R)>绿光(G)>蓝光(B)，这一色散作用在反射衍射和透射衍射中都会体现出来。

这个现象是不是看上去有点熟悉？我想大家小时候都玩过棱镜，太阳光(白光)通过它之后也会被分光成“彩虹”，只不过它的分光原理是光的折射作用而非衍射作用。图5(c)将衍射光栅的分光现象(包括多衍射级和色散作用)与棱镜的分光色散做了直观的对比，可以看到衍射光栅将光分成不同衍射级别的同时，每一个级别又都有色散现象，比分光棱镜要复杂很多。

06 衍射光波导的工作原理

了解了衍射光栅的工作原理之后，我们来看一下它如何在光波导中工作的。

如果我们回忆上一篇文章中提到的，在几何光波导中利用“半透半反”镜面阵列可以实现一维扩瞳，如果我们将这个概念转移到衍射光波导里，如图6(a)所示，可以简单地用入射光栅来将光耦合入波导，然后用出射光栅代替镜面阵列。即像蛇一样在波导里面“游走”的全反射光线在每次遇到玻璃基底表面的光栅的时候就有一部分光通过衍射释放出来进入眼睛，剩下的一部分光继续在波导中传播直到下一次打到波导表面的光栅上，不难理解一维扩瞳即可以实现了。

图 6. 衍射光波导中的扩瞳技术: (a) 一维扩瞳, (b) 利用转折光栅实现的二维扩瞳， (c) 利用二维光栅实现的二维扩瞳。

但是人们并不满足于在一个方向上(即沿双眼瞳距的X方向)增大动眼框，既然光栅结构比传统光学器件能够在更大的自由度上操控光的特性，那么我们何不在另一个方向上(即沿鼻梁的Y方向)也实现扩瞳呢，这样不只可以使得AR眼镜能够接受更大范围的瞳距，也可以对不同脸型、鼻梁高度的人群更有兼容性。

用衍射光栅实现二维扩瞳的概念十几年前由位于芬兰的Nokia研究中心的科学家Dr. Tapani Levola提出，并且给业内贡献了许多有价值的论文，主要使用的是表面浮雕光栅(SRG)。

后来这部分IP分别被Microsoft和Vuzix购买或者获得使用执照(license)，所以现在的HoloLens I和Vuzix Blade用的都是类似的光栅结构和排布。如图6(b)所示，另一个全息体光栅(VHG)的代表光学公司Digilens也是用类似的三区域光栅排布来实现二维扩瞳。可以看到当入射光栅(input grating)将光耦合入波导后，会进入一个转折光栅(fold/turn grating)的区域，这个区域内的光栅沟壑方向与入射光栅呈一定角度，为了方便理解我们假定它是45度角，那么它就像一个45度的镜子一样将X方向打来的光反射一下变成沿Y方向传播。

并且在这个转向的过程中，由于全反射行进的光线会与转折光栅相遇好几次，每一次都将一部分光转90度，另一部分光继续横向前进，这就实现了类似图6(a)的在X方向的一维扩瞳，只不过扩瞳后的光并没有耦合出波导，而是继续沿Y方向前进进入第三个光栅区域 – 出射光栅 (output grating)。

出射光栅的结构与入射光栅类似，只不过面积要大很多而且光栅沟壑的方向与入射光栅垂直，因为它承担着在Y方向扩瞳的重任，过程与图6(a)类似，只不过它接受的是多个光束而非一个。我们假设单瞳(pupil)的入射光在经过转折光栅后扩展成M x 1个瞳(即一个X方向的一维阵列)，那么在经过出射光栅后就被扩展成了一个M x N的二维矩阵，其中N是光线在出射光栅区域全反射的次数即扩瞳的个数。

用转折光栅实现二维扩瞳是一个比较直观也是目前市面上主流产品如HoloLens I, Vuzix Blade, Magic Leap One, Digilens等采取的方式，其中三个光栅区域的面积、形态、排布方式可以根据眼镜的光学参数要求和外形设计来灵活调节。

另外一种实现二维扩瞳的方式是直接使用二维光栅，即光栅在至少两个方向上都有周期，比较直观来讲就是单向“沟壑”变为柱状阵列。来自英国的衍射光波导公司WaveOptics就是采用的这种结构，如图6(c)所示，从入射光栅(区域1)耦合进波导的光直接进入区域3，这个区域的二维柱状阵列可以同时将光线在X和Y两个方向实现扩束，并且一边传播一边将一部分光耦合出来进入人眼。

可想而知这个二维光栅的设计是非常复杂的，因为在兼顾多个传播方向的耦合效率同时还要平衡每个出瞳的出光均匀性。

它的好处是只有两个光栅区域，减少了光在传播中的损耗，并且由于没有了转折光栅，出射光栅就可以在有限的玻璃镜片上占据更大的面积，从而增大有效动眼框的范围。

WaveOptics 40度FOV的模组动眼框可以达到19 x 15 mm，是目前市面上的同类产品中最大的。

07 衍射光波导的优缺点分析

衍射光波导技术与几何光波导相比主要优势在于光栅在设计和生产上的灵活性，不论是利用传统半导体微纳米制造生产工艺的表面浮雕光栅，还是利用全息干涉技术制成的体光栅，都是在玻璃基底平面上加镀一层薄膜然后加工，不需要像几何光波导中的玻璃切片和粘合工艺，可量产性和良率要高很多。

另外，利用转折光栅或者二维光栅可以实现二维扩瞳，使得动眼框在鼻梁方向也能覆盖更多不同脸型的人群，给人体工程学设计和优化用户体验留了更大的容差空间。由于衍射波导在Y方向上也实现了扩瞳，使得光机在Y方向的尺寸也比几何光波导的光机减小了。

在几何光波导中，需要在镜面阵列中的每个镜面上镀不同R/T比的多层膜，来实现每个出瞳的出光均匀，需要非常繁冗的多步工艺。而对于衍射光栅来说，只需要改变光栅的设计参数例如占空比、光栅形状等，将最终结构编辑到光刻机、电子束曝光机、或者全息干涉的掩膜(mask)里，便可一步“写”到光栅薄膜上，来实现多个出瞳的出光均匀。

然而，衍射光波导技术也有它的不足，主要来源于衍射元件本身对于角度和颜色的高度选择性，这在图5中有所解释。

首先需要在多个衍射级别的情况下优化某一个方向上的衍射效率从而降低光在其他衍射方向上的损耗。

拿表面浮雕光栅的入射光栅来说，图6(a)中对称的矩形光栅结构衍射到左边的光并不会被收集传播到眼睛里，相当于浪费了一半的光。因此一般需要采用如图4(b)中的倾斜光栅(slanted grating)或者三角形的闪耀光栅(blazed grating)，使得往眼睛方向衍射的光耦合效率达到最高。这种倾斜的表面浮雕光栅在生产工艺上比传统矩形光栅要求更高。

然后就是如何对付色散问题，如图5中提到的，同一个衍射光栅对于不同的波长会对应不同的衍射角度。

由于来自光机的是红绿蓝(RGB)三色，每个颜色包含不同的波长波段。当它们通过入射光栅发生衍射后，如图7(a)所示，假设我们优化的是+1级的衍射光即T+1, 对于不同的波长衍射角θ+1T就会不同，即R>G>B。

图 7. 衍射光波导中的色散问题: (a) 单层光波导和光栅会引起出射光的“彩虹效应”, (b) 多层光波导和光栅提高了出射光的颜色均匀性。

由于这个角度的不同，光每完成一次全反射所经历的路程长度也会不同，红色全反射的次数少于绿色，而蓝色全反射次数最多。由于这个差异，图7(a)中的光在最终遇到出射光栅时(请看指向眼镜的箭头)，蓝色会被耦合出3次(即出瞳扩成3个)，绿色2次，红色1次，这会导致眼睛移动到动眼框的不同位置看到的RGB色彩比例是不均匀的。

另外，即使同一颜色的衍射效率也会随着入射角度的不同而浮动，这就导致在整个视场角(FOV)范围内红绿蓝三色光的分布比例也会不同，即出现所谓的“彩虹效应”。

为了改善色散问题，可以如图7(b)所示将红绿蓝三色分别耦合到三层波导里面，每一层的衍射光栅都只针对某一个颜色而优化，从而可以改善最终在出瞳位置的颜色均匀性，减小彩虹效应。

但是由于RGB LED每个颜色内部也不是单一的波长，而是覆盖了一小段波长段，仍然会有轻微的彩虹效应存在，这是衍射光栅的物理特性导致的，色彩均匀性问题只能通过设计不断优化但不能完全消除。

最近问世的Hololens II 则将LED光源换成了光谱很窄的激光光源，会极大地减小彩虹效应。为了使得眼镜片更轻薄，市面上大部分产品将红绿色(RG)并入一层波导传播。也有勇于探索的厂商使用一些新型光栅设计将RGB三色都并入一层波导，例如波导公司Dispelex，但目前全彩的demo只有30度左右FOV。

总结一下，衍射这个物理过程本身对于角度和波长的选择性导致了色散问题的存在，主要表现为FOV和动眼框内的颜色不均匀即“彩虹效应”。光栅设计优化过程中，对于所覆盖颜色波段和入射角(即FOV)范围很难兼顾，如何用一层光栅作用于RGB三色并且能实现最大的FOV是业内面临的挑战。

08 衍射光波导的分类

目前表面浮雕光栅(SRG)占市场上衍射光波导AR眼镜产品的大多数，得益于传统光通信行业中设计和制造的技术积累。

它的设计门槛比传统光学要高一些，主要在于衍射光栅由于结构进入微纳米量级，需要用到物理光学的仿真工具，然后光进入波导后的光线追踪(ray tracing)部分又需要和传统的几何光学仿真工具结合起来。

它的制造过程先是通过传统半导体的微纳米加工工艺(Micro/Nano-fabrication)，在硅基底上通过电子束曝光(Electron Beam Lithography)和离子刻蚀(Ion Beam Etching)制成光栅的压印模具(Master Stamp)，这个模具可以通过纳米压印技术(Nanoimprint Lithography)压印出成千上万个光栅。

纳米压印需要先在玻璃基底(即波导片)上均匀涂上一层有机树脂(resin)，然后拿压印模具盖下来，过程很像“权力游戏”里古时候寄信时用的封蜡戳，只不过这里我们需要用紫外线照射使resin固化，固化后再把“戳”提起来，波导上的衍射光栅就形成啦。

这种resin一般是在可见光波段透明度很高的材料，而且也需要与波导玻璃类似的高折射率指数(index)。表面浮雕光栅已经被Microsoft, Vuzix, Magic Leap等产品的问世证明了加工技术的高量产性，只不过精度和速度都可靠的电子束曝光和纳米压印的仪器都价格不菲，并且需要放置在专业的超净间里，导致国内有条件建立该产线的厂商屈指可数。

在做全息体光栅(VHG)波导方案的厂家比较少，包括十年前就为美国军工做AR头盔的Digilens，曾经出过单色AR眼镜的Sony，还有由于被苹果收购而变得很神秘的Akonia，还有一些专攻体光栅设计和制造的厂家。

他们所用的材料一般都是自家的配方，基本是感光树脂(Photopolymer)和液晶(Liquid Crystal)或者两者混合。制作过程也是先将一层有机薄膜涂在玻璃基底上，然后通过两个激光光束产生干涉条纹对薄膜进行曝光，明暗干涉条纹会引起材料不同的曝光特性，导致薄膜内出现了折射率差(Δn, index contrast)，即生成了衍射光栅必备的周期性。

由于体光栅由于受到可利用材料的限制，能够实现的Δn有限，导致它目前在FOV、光效率、清晰度等方面都还未达到与表面浮雕光栅同等的水平。但是由于它在设计壁垒、工艺难度和制造成本上都有一定优势，业内对这个方向的探索从未停歇。

09 总结

好了，说了这么多，让我们比较下光波导的各个技术方案来看看究竟花落谁家，为了方便大家横向比较我们总结了一个比较详细的表格。

其中几何光波导基于传统光学的设计理念和制造工艺，并且实现了一维扩瞳。它的龙头老大是以色列公司Lumus，目前demo了55度FOV，成像亮度和质量都非常好。

但遗憾的是几何光波导的制造工艺非常繁冗，导致最终的良率堪忧，由于市面上还没有出现达到消费级别的AR眼镜产品，它的可量产性还是一个未知数。

衍射光波导得益于微纳米结构和“平面光学”的技术发展，能够实现二维扩瞳。其中主流的表面浮雕光栅被多家明星公司使用并用消费级产品证明了它的可量产性，其中HoloLens II达到了52度FOV。

另外一种全息体光栅也在平行发展中，如果能够在材料上突破瓶颈以提升光学参数，未来量产也很有希望。我们认为，衍射光波导具体说表面浮雕光栅方案是目前AR眼镜走向消费市场的不二之选。

但是由于衍射光栅设计门槛高和“彩虹效应”的存在，做出理想的AR眼镜仍然任重道远，需要业内各个产业链的共同努力，Rokid AR团队也致力与大家一起探索AR眼镜这一核心技术的突破与应用，以期为用户带来真正轻薄便携、体验优秀的AR眼镜。

AR显示技术发展为什么这么难？

DAQRI首席技术官Daniel Wagner、DAQRI首席光学设计工程师Louahab Noui和DAQRI研究总监Adrian Stannard将尝试解释视场为什么不太可能在短期内实现大幅扩展。本文另一个更为重要的目标是，说明视场只是对AR显示器重要的大约24个参数中的一个。其他参数的重要性不弱于FOV，同时尚未得到解决或可以独立解决。实际上，目前大多数AR显示技术早已存在于军事或工业场景，而最近的进展更多是降低了相关的成本，全新的突破较少。具体整理如下：

1. AR显示器的种类

目前主要有两种AR显示技术：光学透视和视频透视。行业在过去已经探索过这两种选择，但由于后者的局限性十分显著，目前几乎所有商用AR设备都采用光学透视显示器。

1.1 光学透视显示器

光学透视显示器允许用户“直接”（通过一组光学元件）感知现实世界。这种AR显示器是通过为来自现实世界的光线添加额外光线来呈现虚拟内容。由于这是一种添加操作，所以不可能显示黑色或令现实世界变暗。所以，今天的无源光学系统无法显示黑色虚拟内容或绘制阴影。确实有实验设备能够以每像素级别阻止入射光，但它们远离实际应用尚有十分遥远的距离，所以本文不作考虑。

今天主要存在两种主要类型的光学透视显示器：波导和自由空间系统（组合器）。就目前而言，波导（见下图）显然在高端领域占据主导地位，而且上述提到的所述设备都是基于波导：投影仪在波导的一个位置（内耦合）插入图像。由于全内反射（Total Internal Reflection；TIR），它将在波导内反弹（就如同在光纤电缆之中），然后在另一个位置（外耦合）朝向眼睛出射。波导十分受欢迎，因为它们能够实现简练的平面设计，但会带来一系列的（图像质量）问题。

左边是基于波导的光学透视显示器；右边是基于自由空间系统的光学透视显示器

当今最流行的波导替代方案是自由空间系统。由于采用自由形式元件，其设计过于复杂，但从光学角度来看比波导简单很多，所以可以产生更高的图像质量。另外，一旦完全原型化，它们的生产成本将远低于波导。对基于自由空间系统的显示器而言，一个常见的误解似乎是它们通常必须很大才能实现大视场（如Meta2）。

波导的光学效率低，所以需要强大的投影仪。目前的实现方式是将作为光源的LED和作为图像调制器的LCOS组合起来。自由空间系统通常足以应用OLED，后者具有自发光的特性，可实现更小的投影仪设计。

1.2 视频透视显示器

对于视频透视显示器，一对摄像头将记录真实世界视图，然后再通过不透明显示器进行显示，如OLED或LCD。虚拟内容是通过常见的视频混合技术进行添加，这意味着可以进行任何类型的操作，包括显示黑色虚拟内容和令现实世界变暗。

视频透视显示器的原理

可以进行适当视频混合的能力绝对是视频通过光学透视的优势。尽管如此，现在基本所有的AR设备都采用光学透视。原因十分简单：在视频透视的情况下，我们在本文中讨论的所有挑战都适用于真实视图和虚拟内容。

相比之下，光学透视仅适用于虚拟内容，而通过巧妙的UI设计我们可以更好地进行控制。动态范围是一个明显例子：尽管具有巨大动态范围的人眼可以看到一个位于阳光之下的人和一个位于阴影之中的人相邻站立，但今天的相机和显示器无法解决这个问题。要么阴影中的人过暗，要么阳光下的人太亮。

另外，大视场是必要项，这不仅是为了匹配所部署的摄像头系统，同时是为了模仿如肉眼所见的真实世界视场。另外，存在安全和人类因素等需要解决的问题。所以，本文的其余部分只探讨光学透视显示。

2. 设计参数

我们在本文假设视场只是AR显示器的众多基本设计参数之一。所述的大多数设计参数与F视场同样重要。下面我们列出了最重要的属性：

①视场

②视窗大小

③亮度，透明度和占空时间

④对比度

⑤均匀性和色彩质量

⑥分辨率

⑦现实世界畸变

⑧虚拟图像畸变

⑨人眼安全

⑩适眼距

⑪色差

⑫深度感知

⑬体积，重量和形状参数

⑭光学效率

⑮延迟

⑯杂散光

我们可以相对轻松地以其他作为代价来改进一个参数。例如，如果可以接受大体积和小视窗，增加视场将不是什么难事。但大多数用户可能不希望使用这样的设备。另一方面，在小型显示器中实现大视场和大视窗非常具有挑战性。类似地，较大的视窗需要更多的光线来实现相同的感知亮度，所以需要更强大的光源。

下面描述的大多数参数今天都未达到最理想的状态。所以，设备厂商的目标是全方位地提升它们。但正如刚才提到的一样，在不牺牲其他参数的情况下改进一个参数已经十分困难。这种权衡的主要原因是所谓的系统光学扩展量。这是一个几何不变量，如下面的公式所定义。类似于能量守恒，我们需要维持光学扩展量守恒。在最简单的形式中，光束所通过的面积和光束所占有的立体角的乘积必须是常数。

光学扩展量守恒：h2越高，Ω2则越小

在图片中，高度为h1的对象用作光源。对于所示透镜系统的几何形状，得到的图像高度h2> h1，而对象侧的立体角Ω2小于Ω1。换句话说，如果面积扩大，则立体角减小，反之亦然。更正式的光学扩展量定义为：

其中n是介质的折射率，θ是面积dA的发射（或接收）光束的角度。我们注意到光学扩展量没有的标准符号，但“G”和“dG”经常用于光学领域。类似术语出现在称为拉格朗日不变量的近轴极限中：

其中h1和h2是对象和图像高度，u1和u2分别是对象和图像射线角度。G的替代表达式有时用于包含NA（数值孔径）的显微镜物镜：

如果为获得恒定视场而尝试扩大出射光瞳，光学扩展量将影响光引擎设计的效率和投影仪尺寸。以下图的简单投影仪设计为例，焦距为f的准直透镜准直宽度为x的微型显示面板（限制在一个维度）。无论是波导还是自由空间系统，投影仪的视场都是我们希望尝试实现和通过显示器中继的目标。

基于准直微显示面板的简单头显投影仪

投影仪的高度（出射光瞳）由透镜的直径确定，而投影仪的视场θ由以下等式确定：

为了增加给定显示器的视场，我们需要减小f或增加x，但根据光学扩展量守恒，增加立体角将减小图像尺寸。另外，透镜半径不能大于其曲率半径，而这又决定了它的焦距（通常使用镜子，因此只有一个表面具有功率）。所以这里存在一种权衡，而我们可以通过更大的显示面板进行解决，但这又会使得投影仪和照明系统更大，因为在准直光源时会出现相同的问题。所以，光电发射显示面板非常具有吸引力。

波导十分欢迎，因为它们支持“瞳孔扩展”或“瞳孔复制”，从而使得光学扩展量关系不会直接受到影响。但这会产生其他后果，如图像质量，效率和亮度。当选择用于投影仪的扫描激光系统时，你同时会遇到其他复杂的情况，因为投影仪的出射光瞳非常小。扩展这种投影仪的一种方法是，将中介屏幕作为辅助光源，但这会增加体积（因为需要额外的中继透镜），增加光斑，并且会降低效率。另一种瞳孔扩展方法是采用波导，但如果没有眼动追踪和主动校正功能，你将难以抑制伪影。

2.1 视场

尽管人人似乎都渴望更大的视场，但这必须与其他方面进行仔细平衡。更大视场的需求很大程度上取决于头显设计目的。对于诸如游戏这样的消费者用例，更大的视场将能增加沉浸感。有40度×30度的视场对大多数专业用例而言已经足够（如维护和检查等），因为焦域小，而其他方面更为重要（如增加安全性）。

各种AR/VR设备的视场和人类视场。为简单起见，所有视场都绘制成矩形。注意，实际的AR/VR设备视场和人类视场都不是矩形。

如上图所示，今天的AR显示器仅覆盖人类视场的一小部分。受益于更简单光学设置的VR设备则更接近覆盖整个人类视场。

视场，视窗和适眼距紧密相关，如下面简化的方程式所示：

其中s是光学表面的尺寸（如宽度），b是视窗尺寸，r是适眼距，v是视场。下图说明了这种关系。

光学表面尺寸（s），适眼距（r），视窗尺寸（b）和视场（v）的关系

假设视场是40度，适眼距是20mm，视窗尺寸是20mm，显示器表面需要35mm宽。假设视场是90度，其他参数类似，则显示器表面需要达到60mm。对于DigiLens宣称的150度（对角线）波导，显示器的对角线需要达到170mm。对于4：3的形状参数，显示器需要为大约135mm×100mm，而且是单眼。

从左到右的波导尺寸：35mm，60mm和135mm

从上图中可以看出，即便是60mm宽的波导都已经相当大，而135mm宽的波导根本不可行。它不仅大得可笑，而且这种宽视场必须纳入双目重叠，这意味着两个波导必须重叠。显然，要达到这样的视场，平面显示器表面将不再有效，并且需要考虑曲面组合器选项。（尽管并非不可能）但曲面波导目前只是一个研究课题，离实用尚有十分遥远的距离。

2.2 视窗尺寸

视窗是近眼显示器前面的区域，可允许用户“正确地”感知显示内容。视窗之外的显示内容可能会失真，颜色可能错误，或者内容可能根本就无法感知。尽管行业将其称为“视窗”，但这一区域的3D形状不是盒状而是圆锥形，并且会随着距显示器的距离变大而变薄。尽管视窗是AR和VR显示领域的常见术语，但光学元件领域更常用的术语是“出瞳”，其中瞬时视场等于总视场。

眼睛是黑色，视窗是绿色，显示器则为蓝色

在使用双筒望远镜或显微镜时，大多数人应该都会注意到出射瞳孔过小的问题：除非每只眼睛能够精确定位在目镜前面的正确位置，否则你将看不到任何一切。这种“不待见”行为的原因是，较小的出瞳导致更高的光效率（进入双筒望远镜的光线集中在另一侧的小范围区域），而这显然是双筒望远镜的理想属性。

那么，视窗到底要多大呢？视窗的最小实际尺寸显然是人眼瞳孔尺寸（通常假设为大约4mm），而这通常是双筒望远镜的设计目标。双筒望远镜的视场非常小，所以瞳孔保持相对固定。但对于AR/VR显示器的，用户的眼睛可以自由移动。为了支持这种眼睛运动，视窗需要在每个方向增加至少数毫米。

眼球运动不是扩大视窗的唯一要求。不同人有着不同的瞳距（IPD）。为了支持这种差异化，我们需要机械调节（如双筒望远镜）或光学调节（通过进一步增加视窗宽度）。对于移动端设备而言，移动式组件存在非常大的问题，尤其是在需要精确校准的时候。由于机械调整不是一个好选择，所以视窗宽度需要进一步增加至少10mm，理想情况下是20mm。

由于波导的输入光瞳通常不是非常大，所以行业开发了各种技术来增加出射光瞳的尺寸，如瞳孔扩张或瞳孔复制。衍射波导具有天然的优势，而反射波导在两个方向扩展视窗（2D瞳孔扩展）则非常具有挑战性。结果，半反射波导通常具有比衍射波导小的视窗。

设计大视窗通常非常具有挑战性，并且会对其他设计参数产生巨大的影响。例如。视窗尺寸直接影响显示区域（波导）的所需尺寸。另外，正如在双筒望远镜的示例一样，为了实现相同的感知亮度，较大的视窗需要更多的光输出。

2.3 亮度，透明度和占空时间

简单来说，显示亮度定义了显示器的亮度是否足够支持用户在特定情况下清楚地感知虚拟内容。透明度则关于有多少现实世界光线能够到达眼睛。对于AR，理想情况是非模糊区域达到100％。对于VR，它通常为零。占空时间定义了每帧像素点亮的时间。占空时间可以以毫秒或帧时间百分比进行度量。这三个主题在很大程度上独立于用户视点，但技术上密切相关。我们将在本节中一起讨论。

对移动AR设备而言，显示亮度绝对是一个极具挑战性的话题。今天几乎所有的AR头显的显示亮度都非常有限：Hololens和DAQRI Smart Glasses的显示亮度约为300 nits，而Magic Leap One的显示亮度仅为200 nits。由于显示器亮度非常具有挑战性，所以今天大多数的AR眼镜通常都是经过调配，只限于室内使用，而且在户外很快变得不可用，尤其是在阳光直射的情况下。为了减轻这个问题，大多数AR头显都采用会降低透明度，并因而减少到达用户眼睛的环境光线数量的有色面板，从而令显示器相对更加光亮。尽管这对于消费者来说或许可以接受，但大多数专业领域都不能容忍低显示透明度。

除了有色面板，大多数光学设计都会阻挡大量的现实世界光线。例如，Birdbath设计（原ODG和现Nreal）会格挡大部分的入射光线。

Karl Guttag的博客有关于这方面的介绍（这里和这里）。根据Guttag的说法，Hololens只允许约40％的环境光线到达眼睛，MagicLeap One仅为约15％，而在2019年初亮相的Nreal眼镜则是25％左右。幸运的是，人眼具有大约1：109的巨大动态范围，所以我们能够应对这种亮度降低。但在黑暗环境中，这种亮度降低可能是产生问题。

由于占空时间定义了每帧允许像素发光的时间长度，所以它与显示亮度密切相关。占空时间为100％意味着显示器连续发光。对于60Hz显示器，这意味着每帧大约16ms。但在这样长时间内显示相同的像素值将导致运动伪影（“拖尾”）。比方说我们假设显示器的水平视场是40度，水平方面1280像素分辨率，以及每秒60度的头部旋转。在这种情况下，头部大约每毫秒旋转2个像素。所以当占空时间为16ms时，每个像素将在32个像素的长度中产生“空间拖尾”（参见下图）。

左右两边为相同的图像，但右图出现了水平运动模糊

但幸运的是，在专心查看细节时，我们人类头部会更加稳定，所以实际上AR显示器通常可以接受4ms或更低的像素占空时间。

60Hz帧率的占空时间。左边是16ms，右边是4ms

LCOS面板是由单独的LED点亮，而这可以非常光亮，所以可以实现高透明度，占空时间低于1ms（各颜色）的光亮显示器。另一方面，OLED更暗，所以当占空时间过短并且同时需要高透明度时，OLED显示器很快就会出现多个问题。以上图为例，当占空时间为16ms时，显示器更亮，但会出现拖影。当占空之间为4ms时，拖影情况会减少，但显示器会过暗。

当占空时间为4ms时：左边是120Hz帧率，右边是240Hz

当帧率为60Hz（约16ms）时，4ms的绝对占空时间将导致显示像素仅在约25％的时间内有效。结果，显示亮度将降低四倍。如果显示器以120Hz运行，4ms的占空时间意味着像素依然在大约50％的时间内发光。类似地，240Hz可以实现约100％的占空时间。但对于移动设备及其显示面板而言，这种高帧速率并不现实。

2.4 对比度

对比度没有正式的定义或衡量方法。但是，大多数人都能理解对比度。简单来说，对比度描述了显示器同时产生更亮和更暗像素的能力，如：

如果显示器的对比度较差，则无法同时显示亮内容和暗（透明）内容。根据显示器的整体亮度，它要么无法显示明亮区域，要么本应为暗（透明）的区域没有变暗。对于光学透视显示器，透明度取代了黑色的作用：在对比度差的AR显示器中，你可以看到透明区域显示为深灰色。换句话说：只要AR显示器不够亮，对比度差的负面影响同样有限。但随着AR显示器的亮度提升，它们将需要更高的对比度。

对比度取决于显示面板和光学系统。LCOS往往具有低对比度，通常是为1：100至1：200。OLED具有相对较高的对比度，可以达到1：1.000.000或更高，这就是它们如今受到家用电视欢迎的原因。但在两种情况下，光学元件（棱镜，透镜，波导）将导致对比度的进一步降低。例如对基于LCOS的系统而言，最终对比度很容易就会低于1：100。

2.5 均匀性和颜色质量

颜色质量定义了显示器能够再现颜色的准确程度。例如，由GPU渲染成红色的像素会显示屏中显示为红色吗？为了实现适当的色彩再现，我们需要进行校准（包括伽玛）。由于AR显示器通常是添加光线，所以感知颜色同时取决于虚拟内容所叠加的场景。

与对比度相同，颜色质量可能存在非常大的差异，具体取决于显示器的位置：例如，取决于它是位于显示器的左侧还是右侧，像素颜色看起来可能相当不同。这种伪影通常依赖于视图，这意味着用户瞳孔的位置同样会有影响，并且需要眼动追踪进行解决。

均匀性描述了位于不同显示器位置的像素颜色变化：对于完美的显示器，通过相同RGB值渲染的每个像素看起来都完全相同。实际上，亮度，对比度，颜色和其他属性取决于显示器位置以及查看像素的角度。

尽管自由形式组合器（如Meta2）和半反射波导（如Lumus）的均匀性通常都非常好，但衍射波导显示器（如Hololens和MagicLeap）明显受到均匀性问题的影响。这种充满中等灰度像素级数的显示器会出现各种色调（见下图）。

衍射波导的颜色问题。显示器会出现各种色调，而非均匀的白色或灰色色调。底部明显出现了亮度不均匀。

2.6 分辨率

显示分辨率描述了可以显示多少不同的像素。这是一个有着众多文章介绍的属性之一。显示分辨率的最终目标是达到人类视觉极限或略微超过大约一弧分（1/60度）。

由于市场对提升规格的需求，今天大多数智能手机的分辨率远高于人眼在正常情况所能感知的分辨率。例如在40厘米远查看显示屏尺寸为14厘米的智能手机，这意味着手机屏幕在人眼视场范围内大约为20度，所以长边不需要超过1200像素。但是，今天依然有一系列的智能手机的显示分辨率要比这个数字高出50%。

视场为30度×20度的AR显示器大约需要1800×1200像素。但今天的VR显示器位于90度×60度的范围内，所以实现人眼极限需要5400×3600像素。这意味着每秒生成和显示大约20万像素75次，或每秒15亿像素……

对于智能手机，用户直接看着屏幕（忽略手机膜）。所以没有光学元件会以负面方式影响显示面板提供的像素质量。对于AR和VR设备，尽管复杂的光学系统是位于用户眼睛和显示面板之间，但它们会严重降低图像质量。感知分辨率（到达眼睛的分辨率）可以显著低于显示面板分辨率。正如Karl Guttag所说，MagicLeap One的有效分辨率仅为其面板分辨率的一半。类似地，Hololens显示器在从LCOS到眼睛的光路中损失了大量的分辨率。

所以，只要光学系统是显示面板的限制因素，分辨率通常没有什么意义。

2.7 真实世界畸变

对于光学透视显示器，用户是通过显示器的光学元件感知现实世界。在大多数AR设备中，所述元件构成了下面的子集：

显示视觉增强所需的虚拟图像的波导，如HoloLens。

或者将投影图像反射到眼睛的自由形式组合器，如Meta2。

设备外部的面罩用于保护电子元件和光学元件。

将虚拟图像焦平面从无限远移动到更为可行位置的推/拉透镜，如2米（如DAQRI Smart Glasses的反射波导）。

在一侧或两侧保护脆弱波导的附加塑料，如Hololens。

其中一些元件具有额外的，不受待见的光学属性。例如，波导以将光线弯曲（引导）到正确的方向，但它同时会影响真实世界的光线，而理想情况下光线不应该受到影响。类似地，面罩或推/拉透镜的设计或由于有限的质量而使光线变形。

当然，大家都希望能够尽可能少地扭曲现实世界视点，但在实践中，限制重量和成本的愿望需要可能会产生明显伪影的妥协。

2.8 虚拟图像畸变

光学工程师旨在设计一种有着最大可能图像质量的光学路径，而这同时包括最小化畸变：在完美的示例中，显示面板的矩形像素网格将显示为等量矩形像素网格。在诸如看着矩形智能手机这样的直接视图场景中，这一点很少有纳入考虑。在诸如AR显示器这样的复杂光学设置中，为了优化其他参数，图像畸变通常成为需要忍住的要素。

幸运的是，与现实世界畸变相比，只要显示器合理校准（畸变很大程度上是取决于视图），虚拟内容的畸变可以有效地进行解决。通过恰当的校准，所述畸变可以作为渲染管道的一部分进行处理，而处理成本很低或者为零。不过，取决于系统的光学畸变量，这可以带来显著的伪影，比方说特定区域的显示分辨率出现大幅降低。

通常来说，波导的畸变相当低，这样至少消费者用例可能会予以忽略（没有通过数字方式进行校准和校正）。自由空间组合器（和VR显示器一样）通常会生成需要进行恰当处理的严重畸变。由于畸变图像非常不规则，所以显示面板的有效区域可能同样会减少。下图是自由空间设计的示例性畸变网格。可以注意到，网格的一部分落在显示面板之外，并且用户不能观察到显示面板的一部分（没有网格的黑色区域）。下图同时说明了顶部和底部之间的分辨率差异。

自由空间组合器的示例性失真。图片是沿到显示面板的光路追踪矩形网格图像生成

2.9 人眼安全

在谈论AR显示器时，两种类型的人眼安全十分重要：确保眼睛不受AR显示器的影响；确保AR显示器保护眼睛免受外部伤害。

确保眼睛不受AR显示器伤害听起来像是不费吹灰之力。显然，任何产品都必须满足这个要求。但对于距离最脆弱的人体器官仅几厘米的近眼显示器而言，我们必须特别小心。这变得尤为重要，因为大多数AR显示器是将玻璃元件作为光学堆叠的一部分。在发生撞击时，玻璃元件可能会破碎并伤害用户。所以，我们需要将所有玻璃元件整合至不易破碎的护盖之中。

尽管这听起来十分明显，但事实并非总是如此。例如，最近发布的联想ThinkReality就把反射性波导波导直接放在用户眼睛前面，没有任何护盖。由于这种波导是由众多以水平条纹粘在一起的小玻璃元件构成，所以它们很容易损坏并对用户造成伤害。

保护眼睛免受外界伤害通常只商业和工业环境中的要求。对于所述领域，诸如ANSI Z87.1之类的眼睛保护安全标准描规定了评为安全眼镜所需承受的力类型。

2.10 适眼距

与视窗相同，适眼距没有通用的定义。简单来说，它是指瞳孔到AR显示器最近点的支持距离。由于并非所有用户都具有相同的头形，所以在实践中需要支持一定范围的适眼距，从而限定视窗的厚度（沿着观察方向）。

适眼距是瞳孔到光学表面最近点的距离

通常来说，优选足够支持常规眼镜的适眼距，这样存在视力问题的用户就无需购买定制透镜。但如前所述，视窗实际上不是一个方形，而是圆锥形，并且会随着显示器的距离变大而变薄。所以，支撑大适眼距，以及宽度和高度足够大的视窗非常具有挑战性。

2.11 外围视觉

当谈到AR眼镜时，我们关注的不仅只是一个视场，而是两个视场：AR眼镜用于显示虚拟内容的可视觉增强区域，这是大多数文章和规范所指的视场；但人类可以感知的视场范围要大于当前AR显示器的可视觉增强区域，而我们将可视觉增强区域之外的视场称为外围视场。另外，我们需要确保不能过分遮挡外围视场。

人类视场是单眼约150度×120度，双眼加起来是220度×120度。将显示器放在眼睛前面会造成额外的遮挡，所以一个重要的设计目标是将这种遮挡保持在最低限度。下面是人眼视图（绿色），无遮挡视图（红色）和可视觉增强视图（蓝色）的尺寸对比示意图。为简单起见，所有区域都绘制为矩形。

人类视场（绿色）与AR设备的示例性视场和实际视觉增强视图进行比较。绿色和红色之间的区域表示设备所遮挡的视场。红色和蓝色之间的区域表示用户可以感知的真实环境区域，但无法进行视觉增强。

因此，除了最大化可视觉增强视场（蓝色区域）之外，第二个目标是最大化非遮挡视场（红色区域）。要做到这一点，任何遮挡视图的元素都需要向外拉。这包括显示器部分（如投影仪），以及诸如传感器这样的元件或诸如镜臂这样的支撑结构。

与上面的简化示例图不同，实际的视场不是矩形。如下图所示，视场主要受眉毛，鼻子和脸颊的限制：红色和黄色的组合区域描绘了左眼视场。类似地，绿色和黄色区域描绘了右眼的视场。黄色区域则描绘了双眼重叠，亦即双眼都可以观察到的视场。

左图：左眼和右眼的人类视场；右图：左图是通过使用虚拟头部模型进行光线投射生成

2.12 色差

透镜的折射率随光波长而变化，这导致不同的“颜色相关”焦距。在相机中，这一般是通过组合多个透镜来进行补偿，但由于尺寸限制，这对AR显示器而言通常是不可能的事情。所以，色差是AR显示器中引人注目的问题。尽管可以在软件中校正一定的像差（通过适当的校准），但其他效果更难以解决（取决于视图）或者不能校正。一如既往，最佳的途径是尽可能地以光学方式而非数字方式来减少伪影。

左图：红色和蓝色由于色差而分解；右图：通过相应地扭曲每个颜色通道进行数字校正

2.13 深度感知

有多种人类视觉线索可以允许我们感知深度。对于AR显示器，两个最重要的线索是视觉辐辏（眼睛旋转以观察相同的对象）和视觉调节（瞳孔聚焦对象）。它们是神经耦合，而不匹配的视觉辐辏和视觉调节会造成用户不适，亦即所谓的视觉辐辏调节冲突（VAC）。

大多数人在观看3D电影时都会注意到VAC：尽管焦点永远不会改变（电视或投影屏幕不会移动），但由于我们的眼睛看到略有不同的图像（立体内容），我们依然能够感受到3D效果。在电影院中，焦平面由房间设置给出：如果你所坐的位置距离投影墙10米，焦平面就固定为10米。在这个距离下，人类几乎不能根据瞳孔焦点区分距离。所以，只要立体内容停留在这个距离或更远，画面看起来就会自然。

对于AR显示器，焦平面是光学路径的设计参数：即便显示器与眼睛的距离只有几厘米，焦距平面都总是设置得更远，因为人类无法聚焦于这么短的距离，而且这没有任何意义，因为虚拟内容会出现在更远距离。

下面的图例说明了正常视图，虚拟现实和增强现实之间的差异：在正常视觉辐辏和视觉调节同步的情况下，两者都调整到相同的距离；对于虚拟现实，视觉辐辏始终位于相同的距离（通常约为两米），而视觉调节取决于以立体形式渲染的屏幕内容；对于增强现实，两者的冲突甚至可以更大：通过虚拟内容增强的对象看起来是与视觉调节同步，但对于真实对象和虚拟对象的视觉辐辏可能非常不同。

理想情况下，我们能够为每个像素选择不同的焦距，而且行业已经演示了朝这个方向发展的实验系统。但是，这种系统需要非常长的时间才能达到商用水平。

正常视图（左），虚拟现实（中）和增强现实（右）的视觉辐辏和视觉调节

如果我们必须使用单个焦平面的AR显示器，设计师就需要决定放置它的位置。最适合大多数场景的情况似乎是2米左右。焦平面应该为大致平坦且对所有颜色相同。这不是一个简单的设计目标，所以在测量今天的AR显示器时，你会注意到实际的焦点“平面”既不平坦，对所有颜色也不相同。

2.14 尺寸，重量和形状参数

显示器尺寸和眼镜尺寸是当今AR设备最具挑战性的设计参数之一。由于要求大视场和大视窗，所以很难令显示器变小。这就像要求一辆小型卡车同时具备大卡车的运载吨位。大型显示器会导致整体体积庞大，从而又造成AR眼镜实用性较差。眼镜越大，用户越容易撞到什么。

另外，较大的显示器通常会导致更重的光学元件。由于质量和折射率要求，当今AR显示器的众多光学元件都是由玻璃制成，而随着尺寸的增加，玻璃很快就会变得太重。

在2018年举行的Oculus Connect 5大会中，迈克尔·亚伯拉什指出AR眼镜的重量不应该超过70克。尺寸和重量不是独立于其他属性的参数。人体头部可以舒适地承受比70克更重的重量（如果重量分布均匀）。尽管承受很轻的重量都会很快造成鼻梁受伤，但耳朵可以承受更多的重量，而且头顶更加坚硬。重量分布比重量本身更为重要。例如，Meta2眼镜不是很重，但由于糟糕的重量分布，它给前额施加了非常大的压力。

2.15 光学效率

光学效率是指发光元件所发出的光线有多少实际到达用户眼睛。令人惊讶的是，今天大多数基于波导的显示器在光学效率方面都非常低，大部分仅为约百分之一。幸运的是，组合LCOS和LED的投影仪足够亮，可以为波导提供足够的光量。所以，OLED不是当今波导的选择。另一方面，对于组合器显示器（如Meta2），我们可以通过组合器元件具有的透明度来很好地控制光学效率：组合器反射率越高，它的光学效率就越高。但这同时会反射更多的环境光，所以到达眼睛的环境光更少（透明度降低）。

波导是今天占主导地位的AR显示技术。由于LCOS十分光亮但存在低对比度问题，而有着高对比度的OLED则存在低亮度问题，大多数人把目光投向了微型LED，因为这种类型的显示器有望实现更高的亮度水平。行业已经演示了分辨率和尺寸足以支持AR显示器的微型LED面板，但迄今为止都只是单色面板。要实现支持全RGB的类似规格面板，行业尚需多年的时间发展。

2.16 延迟

运动到光子延迟定义了从出现一个事件（运动）到显示器显示相应更新所需的时间。例如，当用户将头部向右旋转时，显示器索显示的内容必须相应地“向左移动”。对AR而言，延迟不是一个经过充分研究的主题，这主要是因为行业直到最近才实现了具有足够低延迟的系统。但人们普遍认为，对于光学透视显示器，5毫秒或更短的延迟已经足够。

由于延迟问题，标注在快速头部运动期间可能会从清晰位置（左侧）移动到不清晰的位置或错误位置（右侧）

除了算法和其他电子组件，延迟主要是受显示面板（OLED，LCOS）和显示协议（MIPI，DisplayPort，HDMI）影响。延迟和显示面板的选择是一个复杂的主题，因为它对电子组件和软件设计产生了巨大的影响。例如，执行线序（“滚动”）更新的OLED和执行色序（“全局”）更新的LCOS有着完全不同的数据传输和运动补偿策略。

2.17 杂散光

大多数用户和眼镜厂商都渴望一种形状与太阳眼镜类似的AR眼镜。尽管这听起来十分简单，但人们经常会忽视一个问题：杂散光。

AR眼镜的敞开程度越高，越多来至多余方向和光源的光线就能够进入系统。尽管AR显示器通常能够很好地应对来自前方的环境光，但来自侧面或用户后方的光线会引起严重问题。常规眼镜通常不会反射太多光线，所以问题不大。但AR显示器必须反射和弯曲光线，所以更容易受到杂散光的影响。衍射波导特别受其影响，来自侧面的光线会议彩虹伪影的形式出现在显示器（参见下面的右图）。反射波导的性能更好，但同样存在这方面的问题。某些设计可以减少杂散光，但对于其他设计而言，这个问题不像衍射技术那样容易解决。

左图：来自两边的杂散光正反射进入用户眼睛；右图：因杂散光造成的伪影

2.18 视觉舒适度

在过去五十年间的头显发展中，业界投入了大量的努力来解决人类因素问题，尤其是立体图形显示器。视觉辐辏和视觉调节是一个众所周知的问题，另外还存在与双眼视觉相关的其他问题，而它们会对舒适性产生巨大影响。其中一个是被称为双目垂直角差。当双目显示器之间存在垂直视差或倾斜时，双目垂直角差就会出现。人类视觉系统难以忍受这一问题，并且可能会导致头晕，恶心，甚至呕吐。有时人们认为视觉辐辏调节冲突是造成这种症状的原因，但实际上这是显示器之间的轻微错位。1986年的美国海军训练文本指出，为了避免眼睛疲劳，双目镜筒轴的垂直偏差δ不应超过2弧分。

图像的垂直偏差，亦即双目垂直角差。这可能会导致用户不适。右眼需要稍微旋转才能整合的双目图像。

另一个可以影响舒适度的领域是双目重叠量。例如，不必将左右图像场完全重叠。实际上，通过故意不重叠双目显示来增加有效视场是一种常见的做法，这主要有两种方式：眼睛发散重叠和眼睛会聚重叠。通常，人类视觉系统可以容忍这种情况，因为由于鼻子的影响，左眼和右眼看到的现实世界图像不完全重叠。但在产生不适之前，用户之间有着不同程度的部分重叠。90％的部分重叠可以接受，而当重叠减少到70％时，表示不适的用户数量有所增加。

部分重叠：左图是眼睛发散部分重叠；右图是眼睛会聚部分重叠

质量中心是另一个重要元素。尽管不是非视觉要素，但不适当的设计可能会给用户带来不必要的颈部不适。需要合理安排显示组件和驱动电子的放置，这可以帮助最小化重心的任何偏移。如果用户需要在一定角度范围内向上和向下查看，这可能是十分关键的一点。

3. 其他

除了本文探讨的话题之外，还存在尚未进入商业系统的其他光学设计选项。今天大多数设备都能够在固定距离显示一个焦平面。Magic Leap One则更进一步，能够显示两个焦平面，但在显示器质量和透明度方面付出了巨大的代价。然而，人类能够区分大约十二种焦距，而目前的方法只能实现一两个。所以，业界已经开始研究可调节的焦平面，但对于大多数AR设备而言，迄今为止所演示的方法都过于复杂。

尚未进入商业系统的另一个功能是：在光学透视显示器中绘制黑色像素。今天的无源光学元件无法实现这一点，因为它们混合现实和虚拟的工作纯粹是添加性质。对于黑色像素，我们需要能够以每像素和每帧水平格挡真实世界光线。尽管LCD层可能是一种解决方案，但它会将显示器的透明度降低一半，并产生极化环境光的问题，所以这通常不是一种可行的解决方案。

我们同时没有探讨功耗和散热的话题。人类对靠近眼睛和脸部的热源非常敏感。所以，头显在面部和太阳穴区域消散的热量不应高超过一瓦特。基本上，今天所有的AR设备都产生了过多的热量。为了提高显示器的亮度，光学设计必须变得更加有效，而不仅仅只是增加显示器光源的功率。

4. 对未来的期待

一个常见的要求是扩大视场和降低眼镜尺寸（实现太阳镜般的形状参数），而这显然不利于改进我们上面讨论的大多数参数。与电子设备不同，小型化通常不是光学设计的选择或优势，因为它将带来缩小的参数，如焦距，视窗尺寸或适眼距。

除了少数参数之外，新的突破技术不太可能推动上面的大多数要素。例如，全彩微型LED的出现将使得更亮的小型投影仪成为可能，但这对整体显示器尺寸的影响有限。另一方面，光学领域的技术不太可能出现急剧的改变。

所以，我们需要很长一段时间才能实现具备太阳镜形状参数，大视场，高亮度，支持户外用例，以及其他远见者所畅想的元素的AR眼镜。与电池技术领域类似，我们更有可能看到各参数的逐年提升。

更多推荐

田中贵金属工业开发了用于丝网印刷的“低温共烧纳米银膏材”

技术前沿：LoRa物联网连接技术——卫星、导弹都能组网

智能汽车行业专题报告：华为芯网云融合，智能汽车Tier1实至名归

京东方、TCL华星再次同时拿下三星新机屏幕订单

技术前沿：OLED（有机发光二极管）显示技术