第八章 Display Referred 和 Scene Referred

Andy Guo原创
  • Color
  • 十分钟系列
  • Color
  • Color Science
  • 色彩空间
  • 色彩科学
  • ACES
  • Color Space
  • Display Referred
  • Scene Referred
大约 15 分钟

第八章 Display Referred 和 Scene Referred

今天我们来聊一聊 Display ReferredScene Referred

只要对色彩科学有兴趣或者研究的人一定都听过这两个名词(当然,可能被翻译成为了中文,叫做“显示相关”和“场景相关”)不是特别理解的人可能会有这样的结论:

  • Display Referred 是和显示器相关的……至于怎么个相关法?总之就是相关啦!
  • Scene ReferredDisplay Referred 要牛逼一些……

没错,上面两个粗略的理解都是正确的。但是如果能够更清楚的明白二者之间的不同,我们就可以更好的理解色彩空间。并且,没准你会从另外一个角度对 linear、gamma 有更深的体会。甚至自己就能够解释:“为什么VFX 要用Linear 类型的色彩空间来制作,而DI、绘画需要使用带有Gamma 的色彩空间呢?”

8.1 从真实世界开始

世界一切的起源都是现实本身。所以为什么能够分出Display ReferredScene Referred ,也要从一点点物理开始。【莫慌!】先假设你已经知道了一些基本的知识:

  • 光是一种能量
  • 人眼对于亮度的感知并不是线性的

好了,有了上面的两点,我们来想象一下下面的场景:假设我们有一个“完美”的灰卡。那么假设外界的光照强度是1.0,那么灰卡应该反射多少光线的能量呢?【这里都简化为完美的情况来讨论】

Screen Shot 2017-11-29 at 10.32.31

只要有点经验的人就会说0.18。因为灰板的反射率是18%,所以入射能量为1.0 的时候,反射的能量就是 1.0 x 18% = 0.18

这是从物理的角度来考虑问题,但是如果从人眼的角度来考虑,又是怎样的呢?

大家又知道,18% 的灰板大家习惯称为“中灰”。

“中灰”的“中”有两个含义:

  • 第一个含义是表示“中性”,也就是不存在色偏;
  • 第二个含义是“中间”,也就是看起来的亮度是一半。

这就出现了分歧:对于物理来说,明明只反射了18% 的能量,但是人眼看起来却觉得是50%

很多人都会立刻回答:“这是由于进化过程中,眼睛采用了对数感知。所以对于暗部的光线会敏感,而对高亮会相对不敏感”。

没错,最终的结论是这样的,但是更深的考虑下去,就会发现,这一个重要的分水岭!

8.2 Scene Referred (场景相关)

其实Scene Referred 的理解是很简单的,因为他就是描述了现实世界

“Scene Referred 表示图像中的数值可以(近似)的认为就是真实场景中光照的强度”

由于Scene Referred 图像可以认为还原了真实场景中光照的强度,那么就会拥有如下的特性:

  • Scene Referred 图像基本都是Linear 的。(光的强度就是线性的)
  • Scene Referred 图像基本都是HDR 的。(没人规定光照强度的上限,所以动态范围是非常大的)

由于是描述真实的物理,所以基本上所有的“艺术”创作都不能生成这样的图像。

比方说绘画,你看到的颜色,都是经过人眼非线性处理之后的感觉,并不是真实的光的强度。

还是拿上面“中灰”的例子来说,比方说你调出了“中灰”的颜色,对于你的感知是50%,而真实的强度是18%。

反之,只有测量仪器、CG渲染引擎…… 这类设备才能够生成Scene Referred 图像。

因为测量仪器就是在检测光线能量本身,CG 渲染引擎更是尽可能的在模拟整个世界本身。

8.3 Display Referred (显示相关)

Display Referred 就相对麻烦很多。由于是科普文章就简化为:

“Display Referred 是指图像数值已经经过某种变化,变化后的数值可以直接呈现在相应色域的显示设备上,并且符合人眼的感受”

可以看出Display ReferredScene Referred 有点对立,因此Display Referred 的特点如下:

  • Display Referred 图像基本都是有Gamma 的
  • Display Referred 图像的动态范围会受制于显示设备

我们基本可以认为所有从网上找到的照片都是属于Display Referred 的。

更宽泛的来说,如果一张图片在各种显示器直接看起来就是“正常”的,我们可以认为这样图片就是Display Referred

8.4 转换

既然存在了两个不同的东西,人们往往都是希望他们之间可以相互的转换。就好像如果有两种语言,就会出现翻译一样,DisplayScene 之间也是可以转换的(后面都省略referred,因为打字太累了)。

我们还是回想一下最开始灰卡的例子。

真实能量18% 对应人眼感受的50%,这不就是一种转换的关系么?

如果我有时间,就可以找到物理中0.01%~99.99% 的能量是如何对应人眼的感受,这样的话,我们就能够得到一条曲线,这条曲线就是从物理到人眼的对应关系。也就是SceneDisplay 的对应关系了!

Screen Shot 2017-11-29 at 11.19.20

测量的越是精密,得到的曲线肯定是有点弯弯曲曲的,但是为了计算的简便(没错,又是为了简便),就用一个简单的公式进行拟合。

上面的曲线是方程: y=x12.4y= x^\frac{1}{2.4}

latex-image-1

可以看到当输入为0.18 的时候,得到的结果是0.489,接近0.5。这也就是当年为什么Rec 709 使用gamma 2.4 的原因之一。

但是既然说到转换,就要考虑转换的过程是不是会造成损失?

一般来说,从Scene 到Display 都是没有问题的,因为Scene 是真实的物理,范围大、信息足,可以认为是从“大”范围缩小到“小”范围,我们可以通过插值、映射等等方式留下我们需要的信息,减少或者放弃我们不需要的信息。

但是反过来就有问题了,Display 到Scene 的时候,由于Display 可能已经舍弃了某些信息,当从“小”范围转换到“大”范围的时候,我们就无法得知不存在的部分

(可以想象一下,我可以把真实的风景拍成sRGB 照片,风景中的太阳的亮度是10000,湖水的反光是100,但是拍成照片之后,二者记录的数值都是1。当我想要从这张照片恢复真实场景的强度时,我就无法得到真实的太阳亮度和湖水亮度……)

OETF 和 EOTF

估计有些人看到过这两个英文缩写,如果没看过的,那么我推荐跳过这一部分,因为越看越迷糊……

OETF 是指 Opto-Electronic Transfer Function,直译过来就是光电转换方程

EOTF 就是 Electro-Optical Transfer Function,直译过来就是电光转换方程

这两个一正一反,正好描述了光线强度到信号之间的转换

如果我们来看Rec 709 色彩空间,他的OETF 就是gamma 2.4。所以说gamma 的变化可以认为是OETF 的一个特殊情况。

Screen Shot 2017-11-29 at 11.33.42

说到OETF 可能有需要带上一点Capture Referred(摄影机相关)。

老年间,数字摄影机的能力还不是那么强,无法动不动就捕捉13+ stop 的动态范围,信号处理的速度也不那么快,存储容量带宽也不是那么宽裕。

因此为了更好的记录暗部的细节,所以摄影机会把真实的场景光线强度通过某种变化,让暗部的信息有更多的编码来存储。

最常见的就是Rec 709gamma 2.4

编码之后的电信号就会通过各种传输方式到达显示终端。显示终端会用自己的EOTF 反变换,把电信号解码还原出自身显示的光线强度。最后人看到了“正常的图像”。

但是随着人类对于色彩科学研究的加深以及计算机处理能力的提高,我们可以使用更为复杂的OETF 来进行有效的编码,更为有效的利用编码范围。同时随着显示设备的多样化,EOTF 的反变化也是越来越复杂。

如果拿Alexa 的摄影机来说,LogC 曲线其实就是ArriOETF,使用了这种类似Log 的编码方式,可以更有效的记录人眼敏感的范围。

还有 DolbyPQ (或者应该说是SMPTE 2084)曲线,也是OETF,目的都是一样的。

一句话(不完全正确)的概括:

OETF 有点像给线性的能量加上一些类似Gamma 的变换,得到了变化后的编码数值,方便后续的记录、传输

EOTF 正好相反,将编码后的数值反编码,得到尽可能接近真实场景光照的结果

EOTF 会受到显示设备自身能力的制约。

比方说就算我数学上还原了真实的光照强度,但是SDR 显示器的最高亮度只有100nit,那么我不可能重现太阳那种亮度。

相反的,为了照顾这些超过的亮度,EOTF 可能还要做出一些补偿计算,让稍稍超过的部分可以进入到显示器的能力范围之内。

如何得到一个OETFEOTF 这明显超过了科普的范围,因此就到此为止了。

8.5 ACES 在这方面的优势

如果理解了上面DisplayScene 的区别,应该就可以理解ACES 对于统一色彩流程的优势了。我们在制作过程中常见的素材种类有:

  • 数字摄影机拍摄的素材
  • CG 渲染引擎生成的图像
  • 传统的图片(网络下载、PS 绘画……)

如果我们有一种方式能够把这些素材都还原成为真实场景光照,那么匹配、合成、渲染就会无缝链接到一起了。

幸运的是,如果采用ACES 的色彩管理方式,绝大多数的数字摄影机RAW 厂家都提供了ACESIDT(phantom、BMD 你们加油啊……)

CG 渲染引擎本来就是模拟真实世界的物理情况,所以也可以得到真实的Scene 图像。

传统图片是个难点,但是从目前来看,在可以记录的范围中,还原的情况还是可以的。(当然会有一些蜜汁问题,这里就不深入讨论了)

可以把以前的工作方式认为是操作编码后的数值,而现在就好像我们真的在同一个真实世界中进行光线的操作,当光线的能量相同的时候,这些素材就肯定是匹配的。这种操作本质上更加的科学。

8.6 结束语

SceneDisplay 两种工作方式各有优势:

  • Display 显得更加直观
  • Scene 是更加的科学

VFX 常说的“Linear 工作流”本质就是Scene 的工作方式。

没有最好的工作方式,最重要的是理解SceneDisplay,然后根据项目的需要,做出最符合需求的选择。

没准是完全的ACES、没准是完全的Display,更可能的是二者的结合。在不同的环节选择不同的色彩工作方式,才是坠吼的!

后排睡着同学醒醒,下课啦!

温馨提示

现在有 Andy 十分钟色彩科学合集售卖open in new window

十分钟色彩科学面包多二维码

购买后加微信muyanru345,拉入Andy 铁粉儿群,可在群里对学习工作中的色彩疑问进行讨论。

上次编辑于:
贡献者: muyanru,Yanru Mu