Подтвердить что ты не робот

Найти доминирующий цвет изображения

Я хочу найти доминирующий цвет на изображении. Для этого я знаю, что я должен использовать гистограмму изображения. Но я не уверен в формате изображения. Какой из rgb, hsv или серого изображения следует использовать?

После вычисления гистограммы я должен найти максимальное значение на гистограмме. Для этого я должен найти ниже максимальное значение binVal для изображения hsv? Почему мой результат изображения содержит только черный цвет?

float binVal = hist.at<float>(h, s);

EDIT:

Я пробовал приведенный ниже код. Я рисую h-s гистограмму. И мои результирующие изображения здесь. Я ничего не обнаружил после двоичного порога. Возможно, я нахожу максимальное значение гистограммы.

enter image description hereenter image description here

cvtColor(src, hsv, CV_BGR2HSV);

// Quantize the hue to 30 levels
// and the saturation to 32 levels
int hbins = 20, sbins = 22;
int histSize[] = {hbins, sbins};
// hue varies from 0 to 179, see cvtColor
float hranges[] = { 0, 180 };
// saturation varies from 0 (black-gray-white) to
// 255 (pure spectrum color)
float sranges[] = { 0, 256 };
const float* ranges[] = { hranges, sranges };
MatND hist;
// we compute the histogram from the 0-th and 1-st channels
int channels[] = {0, 1};

calcHist( &hsv, 1, channels, Mat(), // do not use mask
         hist, 2, histSize, ranges,
         true, // the histogram is uniform
         false );
double maxVal=0;
minMaxLoc(hist, 0, &maxVal, 0, 0);

int scale = 10;
Mat histImg = Mat::zeros(sbins*scale, hbins*10, CV_8UC3);
int maxIntensity = -100;
for( int h = 0; h < hbins; h++ ) {
    for( int s = 0; s < sbins; s++ )
    {
        float binVal = hist.at<float>(h, s);
        int intensity = cvRound(binVal*255/maxVal);
        rectangle( histImg, Point(h*scale, s*scale),
                    Point( (h+1)*scale - 1, (s+1)*scale - 1),
                    Scalar::all(intensity),
                    CV_FILLED );
        if(intensity > maxIntensity)
            maxIntensity = intensity;
    }
}
std::cout << "max Intensity " << maxVal << std::endl;
Mat dst;
cv::threshold(src, dst, maxIntensity, 255, cv::THRESH_BINARY);

namedWindow( "Dest", 1 );
imshow( "Dest", dst );
namedWindow( "Source", 1 );
imshow( "Source", src );

namedWindow( "H-S Histogram", 1 );
imshow( "H-S Histogram", histImg );
4b9b3361

Ответ 1

Решение

  • Найти гистограмму H-S
  • Найти пиковое значение H (с использованием функции minmaxLoc)
  • Разделить изображение 3 канала (h, s, v)
  • Применить к порогу.
  • Создать изображение по каналу merge 3

Ответ 2

В качестве альтернативы вы можете попробовать k-means. Рассчитайте k кластеры с помощью k ~ 2..5 и возьмите центр тяжести самой большой группы в качестве доминирующего цвета.

Документ python OpenCv имеет иллюстрированный пример, который довольно хорошо доминирует в цвете (-ах):

0ZrAR.jpg

Ответ 3

Вот несколько советов, с которых можно начать.

  • Все 3 канала в RGB вносят свой вклад в цвет, поэтому вам придется каким-то образом выяснить, где три различных гистограммы все на максимуме. (Или их сумма максимальна, или как там.)
  • HSV имеет всю информацию о цвете (ну, Hue) в одном канале, поэтому вам нужно рассмотреть только одну гистограмму.
  • Оттенки серого отбрасывает всю информацию о цвете, поэтому в значительной степени бесполезен для найти цвет.

Попробуйте преобразовать в HSV, затем рассчитайте гистограмму на канале H.

Как вы говорите, вы хотите найти максимальное значение в гистограмме. Но:

  • Вы можете рассмотреть диапазон значений вместо одного, скажем, из 20-40 вместо просто 30. Попробуйте разные размеры диапазона.
  • Помните, что Hue имеет круглую форму, поэтому H=0 и H=360 одинаковы.
  • Попробуйте построить гистограмму следующим образом:
    http://docs.opencv.org/doc/tutorials/imgproc/histograms/histogram_calculation/histogram_calculation.html
    чтобы увидеть, если ваши результаты имеют смысл.
  • Если вы используете диапазон оттенков, и вы найдете диапазон, максимальный, вы можете либо просто использовать середину этого диапазона в качестве доминирующего цвета, либо вы можете найти среднее значение цветов в этом диапазоне и использовать его.

Ответ 4

Здесь используется подход Python, использующий K-Means Clustering для определения доминирующих цветов в изображении с помощью sklearn.cluster.KMeans()


Входное изображение

Результаты

С n_clusters=5, здесь представлены наиболее доминирующие цвета и процентное распределение

[14.69488554 34.23074345 41.48107857] 13.67%
[141.44980073 207.52576948 236.30722987] 15.69%
[ 31.75790423  77.52713644 114.33328324] 18.77%
[ 48.41205713 118.34814452 176.43411287] 25.19%
[ 84.04820266 161.6848298  217.14045211] 26.69%

Визуализация каждого цветового кластера

enter image description here

Сходство с n_clusters=10,

[ 55.09073171 113.28271003  74.97528455] 3.25%
[ 85.36889668 145.80759374 174.59846237] 5.24%
[164.17201088 223.34258123 241.81929254] 6.60%
[ 9.97315932 22.79468111 22.01822211] 7.16%
[19.96940211 47.8375841  72.83728002] 9.27%
[ 26.73510467  70.5847759  124.79314278] 10.52%
[118.44741779 190.98204701 230.66728334] 13.55%
[ 51.61750364 130.59930047 198.76335878] 13.82%
[ 41.10232129 104.89923271 160.54431333] 14.53%
[ 81.70930412 161.823664   221.10258949] 16.04%

enter image description here

import cv2, numpy as np
from sklearn.cluster import KMeans

def visualize_colors(cluster, centroids):
    # Get the number of different clusters, create histogram, and normalize
    labels = np.arange(0, len(np.unique(cluster.labels_)) + 1)
    (hist, _) = np.histogram(cluster.labels_, bins = labels)
    hist = hist.astype("float")
    hist /= hist.sum()

    # Create frequency rect and iterate through each cluster color and percentage
    rect = np.zeros((50, 300, 3), dtype=np.uint8)
    colors = sorted([(percent, color) for (percent, color) in zip(hist, centroids)])
    start = 0
    for (percent, color) in colors:
        print(color, "{:0.2f}%".format(percent * 100))
        end = start + (percent * 300)
        cv2.rectangle(rect, (int(start), 0), (int(end), 50), \
                      color.astype("uint8").tolist(), -1)
        start = end
    return rect

# Load image and convert to a list of pixels
image = cv2.imread('1.jpg')
image = cv2.cvtColor(image, cv2.COLOR_BGR2RGB)
reshape = image.reshape((image.shape[0] * image.shape[1], 3))

# Find and display most dominant colors
cluster = KMeans(n_clusters=5).fit(reshape)
visualize = visualize_colors(cluster, cluster.cluster_centers_)
visualize = cv2.cvtColor(visualize, cv2.COLOR_RGB2BGR)
cv2.imshow('visualize', visualize)
cv2.waitKey()