Understanding color & the in-camera Image Processing Pipeline for Computer Vision Part1 - 雨的博客

前言
Part1 (General)
- Motivation
- Review of color & color spaces
参考资料

前言

Understanding color & the in-camera Image Processing Pipeline for Computer Vision 是Brown在ICCV2019上的一个tutorial，是很好的Computational photography的入门材料。本文为Part1，主要是color和color space的相关内容。

Part1 (General)

Motivation

过去我们在研究相机、图像相关问题时，往往会有以下假设：

Camera = light-measuring device（光测量设备）
Image = radiant energy measurement（光辐射能量分布的量化）

有很多的计算机视觉的问题都是基于以上的假设进行研究的，包括Shape from shading、Image matching、HDR imaging等等。

Digital cameras:

相机不仅仅是一个光测量设备
现代相机用同样的参数拍同样的东西会有不同的风格
现代的相机设计的初衷并不是成为一个光测量设备，而是为了拍出“好看”的照片（视频）
相机内部会做大量的图像处理工作

这个教程的目标是讨论消费级相机上的一般图像处理步骤。

Review of color & color spaces

什么是Color

色彩是一种光的视觉效应。色彩依赖于object发射或者反射的可见光，经过人的视觉系统处理后，得到可见光对应的视觉效应
Color不是object的主要物理属性
可见光和视觉效应不是一一映射
小结：色彩是可见光分布在视觉系统作用后产出的感受

光的本质是电磁波，而可见光就是电磁波谱中很短的一段

色彩的生理基础和SPD

在眼睛中用于感受光的细胞有两种，视杆（rod）细胞和视锥（cone）细胞

视杆细胞不区分光线波长，主要在低光时起作用，分布在视网膜中心凹的边缘
视锥细胞则对波长敏感，按照敏感波长为三种：长、中、短，分布在视网膜的中间

上图是不同视锥细胞的敏感分布，横轴是波长，纵轴是敏感度。可以看到长和中视锥细胞的敏感曲线很接近，这是因为他们是从同一种细胞突变过来的，在那之前人类都是红绿色盲。

Spectral Power Distribution

可见光，其本质就是一段电磁波的分布，用光谱能量分布（Spectral power distribution，SPD）来表示，其横轴是波长，纵轴就是不同波长对应光的强度。

由此我们可以看出，对于眼睛接收到的可见光，三种不同的视锥细胞会给出三种信号，而我们看到的色彩就是依靠这三种信号重建出来的。所以，我们看到的色彩空间实际上就是无穷维的SPD在三维上的投影，这也解释了为什么我们在表示色彩时总是会取三个参数。

容易想到，这种高维向低维投影时，会出现不同SPD对应同一颜色，这种现象就叫做条件等色（metamer），如下图所示，虽然SPD不同，但看起来却是一样的颜色。

格拉斯曼定律

事实上，在了解生理结构之前，人们就经验性地知道了可以通过三种颜色混合出其他颜色，并且得到了一些结论。

一个重要的理论是格拉斯曼定律（Grassmann’s law）。这里提及这个定律是因为它给出了一个很重要的经验结论：人眼看到的色彩具有很强的线性加和性质。

活体实验来量化色彩

闪烁混合测试

目的是得到人对不同波长光的感受亮度。下面是人眼对不同波长光的敏感度的分布曲线，这条曲线又被称为光度函数（luminosity function）

色彩匹配实验

目的是量化所有的可见颜色。

在1920年代，W. David Wright（Wright 1928）和John Guild（Guild 1931）独立进行了这一系列视觉实验，在实验中，让健康的志愿者来担任“标准观察者”，并使用2度视场角的圆形屏幕（固定视场角是因为视锥细胞集中分布于视网膜的中心凹区域，从而对色彩最敏感）。屏幕的一半投上测试单色光，另一半投上可调整的光。

可调整的光是三种单色光的混合，他们波长固定（700 nm, 546 nm, 435 nm）强度可调节，并称这三个波长为原色。选择546.1 nm和435.8 nm的原色是因为它们是汞蒸气放电的颜色，容易复现，而选择700 nm是因为眼睛在700 nm处对光线的变化不敏感，波长的误差对感知的影响不大。

对于每个波长下的测试光，观察者可以分别调整三种原色光的强度，直到两侧的颜色看起来一样，并记录下三个原色光分别的强度。

在实验中发现，有些测试光，无论怎样调节三原色也无法匹配。在这样的情况下，要求观察者在测试光内加入一种可变强度的原色光来进行匹配，并将这个原色光的系数看作负值。

通过这样的方法，可以将人类感知色彩的范围完全覆盖 。

CIE RGB、CIE XYZ、CIE xyY色彩空间

纵坐标表示为了匹配横坐标所对应的单色光需要的三原色的强度系数。可以看到大约430 nm到530 nm的单色光需要红色的参与才能达成匹配。

这样的函数被称为CIE RGB颜色匹配函数，它的输入是一个波长，输出则是一个代表着强度混合系数的三维向量

CIE RGB函数包含了负值，为了方便使用，1931年CIE研究并定义了新的权威基准，被称为CIE XYZ，这套基准由CIE RGB数据变换得到。

CIE XYZ空间很棒，它不依赖于设备，不同电子设备可以将他们自己对颜色的表达映射到CIE XYZ空间上，从而（至少在理论上）得到了一种设备之间匹配的权威色彩空间。

有时候我们还会用明度（luminance）和色度（chromaticity）来讨论颜色，一个说的是感受到的明暗，一个说的是色调（hue）和饱和度（saturation），由此又发展出CIE xyY空间。令x = X/( X + Y + Z)、y = Y/( X + Y + Z)，第三个参数取和原来一样的Y（也是明度函数），这样就得到了CIE xyY空间。

在使用时，还经常将其投影到X + Y + Z = 1平面上，得到的图就叫CIE xy色度图