震惊！！！酷家乐商品颜色检索系统首次披露

一、导读

在很多搜索的场景中，我们希望能通过颜色来快速筛选自己中意的结果，比如在电商网站购买衣服时，买家希望筛选出自己偏爱颜色的衣服。对应到酷家乐的工具中，设计师希望能通过颜色筛选出自己想要找的模型，比如在沙发类目下通过红色来召回所有的红色沙发。

二、问题剖析

该问题为典型的Dominant Color问题，什么叫Dominant Color？简单举例：Google有提供一个API可以提取一幅图片的Dominant Colors，其实就是一幅图片的主要颜色。

一般基于图像分割（如硬分割中的K-Means与软分割的代表Fuzzy C-Means）可提取出图片主色。但对于实际的业务问题，我们需要得出人眼观感的主要颜色，这正是问题的难点，因为人眼观感会受到诸如背景色、反光、感兴趣区域等影响。比如

这样一幅图片，分割出的结果会有大占比的灰白色背景以及反射光干扰最终的结果，但人眼一眼望过，留下的印象是这是个蓝色沙发，所以单纯做图片的颜色分割并不能适应我们的业务场景，针对我们的业务问题需要特别处理。

三、算法设计与实现

1. 算法流程

Resize:：为了加快处理速度，图片统一等比例调整；
Segment：采用MeanShift和FloodFill进行图片分割；
Merge：将分割好的图片相同颜色区域合并；
Gaussian Score：给每个区域进行Gaussian权重打分，然后按打分排序；
Select：选择我们感兴趣的Dominant Colors；
Tag：根据给定标准色将分出的主色划分到某一标准色；

2. MeanShift

基本原理

MeanShift，即均值漂移算法，在聚类、图像平滑、分割、跟踪等方面有着广泛的应用。通俗解释：对于给定的一定数量样本，任选其中一个样本，以该样本为中心点划定一个圆形区域，求取该圆形区域内样本的质心，即密度最大处的点，再以该点为中心继续执行上述迭代过程，直至最终收敛。
Step1 在d维空间中，任选一个点，以该点为圆心，r为半径做一个球(d>2时为高维球)，落在该球内的所有点和圆心可以产生一个向量，向量以圆心为起点以落在球内的点为终点，这些向量都相加，结果就是MeanShift向量。

Step2 再以向量的终点为圆心，再做一个高维球（如下图），重复以上步骤，就可得到一个向量。

Step3 最终，可以收敛到概率密度最大的地方。

当然，MeanShift还可以扩展，比如加入核函数等。

工程实现

生产化实现时基于OpenCV，实现为pyrMeanShiftFiltering，严格来说并不是做图像分割，而是进行图像在色彩层面的平滑滤波，它可以中和色彩分布相近的颜色，平滑色彩细节，侵蚀掉面积较小的颜色区域。
物理空间x, y两维，物理空间漂移半径sp；色彩空间r, g, b三维，色彩空间漂移半径sr。所以该函数在迭代时，不停地在五维球内去计算向量，更新输出图像上对应的初始原点的色彩值为本轮迭代的终点的色彩值，如此完成一个点的色彩均值漂移。

关键参数：sp, sr，二者设值越大，对图像色彩的平滑效果越明显。举例：

3. FloodFill

基本原理

FloodFill，即漫水填充，是一种用特定的颜色填充联通区域，通过设置可连通像素的上下限以及连通方式来达到不同的填充效果的方法。漫水填充经常被用来标记或分离图像的某些部分以便对其进行进一步处理或分析，也可以用来从输入图像获取掩码区域，掩码会加速处理过程，或只处理掩码指定的像素点，操作的结果总是某个连续的区域。
形象化地解释，可以考虑往一幅图上泼水，把颜色差异明显的区域想像成在边界处有堤坝，当水从某个像素点开始流动，那么很容易浸润相同颜色的像素点（因为同属一个区域），而水将无法流过颜色差异较大的区域。
在这里，我们使用FloodFill只是用来把一块块的颜色区域确定下来！

工程实现

生产化实现时基于OpenCV，实现为floodFill。这里涉及到三个关键参数：

`maks`：漫水填充不会填充掩模mask的非零像素区域。例如，一个边缘检测算子的输出可以用来作为掩膜，以防止填充到边缘
`loDiff`：表示当前观察像素值与其部件邻域像素值或者待加入该部件的种子像素之间的亮度或颜色之负差（lower brightness/color difference）的最大值
`upDiff`：表示当前观察像素值与其部件邻域像素值或者待加入该部件的种子像素之间的亮度或颜色之正差（lower brightness/color difference）的最大值

举例：

请忽略FloodFill后图片中的色块颜色，设置的是随机值，进行FloodFill只是为了确定颜色的连通域；
比较后面两幅图可以看出，当颜色容差设置的较大时，相近的颜色会被水漫过

4. Merge

经过FloodFill后颜色的连通域已经确定，但即使是相同的颜色，也有可能分布在不同的连通域里，所以要对这些相同的颜色进行合并。举例，如下图中的黄色花区域经过FloodFill之后形成各自的连通域，但其实应该合并为同一种颜色区域。在合并时需要指定合并的色差范围，在一定色差范围内的区域被认定为同一种颜色。

到这一步，对于图片颜色的分割已经完成，剩余的工作是如何找出真正的主色！

5. Gaussian Score

在这一步，我们对合并后的颜色区域进行打分，打分的前提假设是：对于商品的图片，人眼感兴趣的颜色位于图片中央。所以对颜色区域进行权重计算的规则是：离中心越近的像素点其权重越高，权重值按照二维高斯函数求得，任何一个颜色区域最终会得到其区域内所有像素点的分数，将区域内像素点的权重值平均后作为该颜色区域的打分。基于颜色的分数排序，可以得到一幅图片的主要颜色顺序。