Подтвердить что ты не робот

Как найти средний цвет изображения в Python с OpenCV?

Я пробовал этот код:

import cv2
image = cv2.imread("sample.jpg")
pixel = image[200, 550]
print pixel

Но я получаю ошибку как:

'Nonetype' no attributes error getitem

Эта ошибка появляется после выполнения третьей строки кода.

4b9b3361

Ответ 1

Как исправить ошибку

Есть две возможные причины возникновения этой ошибки:

  1. Имя файла написано с ошибкой.
  2. Файл изображения не находится в текущем рабочем каталоге.

Чтобы решить эту проблему, вы должны убедиться, что имя файла написано правильно (выполните проверку с учетом регистра на всякий случай) и файл изображения находится в текущем рабочем каталоге (здесь есть две опции: вы можете изменить текущий рабочий каталог в вашей IDE или укажите полный путь к файлу).

Средний цвет против доминирующего цвета

Затем, чтобы рассчитать "средний цвет", вы должны решить, что вы подразумеваете под этим. На изображении в градациях серого это просто среднее значение уровней серого по всему изображению, но в цветах нет такого понятия, как "среднее". Действительно, цвета обычно представлены через трехмерные векторы, в то время как уровни серого являются скалярами. Хорошо усреднять скаляры, но не имеет смысла усреднять векторы.

Разделение изображения на хроматические компоненты и получение среднего значения для каждого компонента - возможный путь. Однако такой подход может дать бессмысленный цвет. То, что вы действительно хотите, это доминирующий цвет, а не средний цвет.

Реализация

Позвольте пройти код медленно. Начнем с импорта необходимых модулей и чтения изображения:

import cv2
import numpy as np
from skimage import io

img = io.imread('/img/8290756f2f65c46a0d638f95cf573a2e.png')[:, :, :-1]

Затем мы можем вычислить среднее значение для каждого хроматического канала, следуя методу, аналогичному методу, предложенному @Ruan B.:

average = img.mean(axis=0).mean(axis=0)

Затем мы применяем кластеризацию k-средних для создания палитры с наиболее представительными цветами изображения (в этом игрушечном примере для n_colors было установлено значение 5).

pixels = np.float32(img.reshape(-1, 3))

n_colors = 5
criteria = (cv2.TERM_CRITERIA_EPS + cv2.TERM_CRITERIA_MAX_ITER, 200, .1)
flags = cv2.KMEANS_RANDOM_CENTERS

_, labels, palette = cv2.kmeans(pixels, n_colors, None, criteria, 10, flags)
_, counts = np.unique(labels, return_counts=True)

И, наконец, доминирующий цвет - это цвет палитры, который чаще всего встречается на квантованном изображении:

dominant = palette[np.argmax(counts)]

Сравнение результатов

Чтобы проиллюстрировать различия между обоими подходами, я использовал следующий пример изображения:

lego

Полученные значения для среднего цвета, то есть цвета, составляющими которого являются средние значения трех хроматических каналов, и цвета, рассчитанного с помощью кластеризации k-средних, преобладающего цвета, довольно различны:

In [30]: average
Out[30]: array([91.63179156, 69.30190754, 58.11971896])

In [31]: dominant
Out[31]: array([179.3999  ,  27.341282,   2.294441], dtype=float32)

Давайте посмотрим, как эти цвета выглядят, чтобы лучше понять различия между обоими подходами. В левой части рисунка ниже отображается средний цвет. Очевидно, что вычисленный средний цвет не правильно описывает содержание цвета исходного изображения. На самом деле в исходном изображении нет ни одного пикселя с таким цветом. Правая часть рисунка показывает пять наиболее представительных цветов, отсортированных сверху вниз в порядке убывания важности (частоты появления). Эта палитра дает понять, что доминирующим цветом является красный, что согласуется с тем фактом, что наибольшая область однородного цвета в исходном изображении соответствует красной части Lego.

Results

Этот код используется для генерации рисунка выше:

import matplotlib.pyplot as plt

avg_patch = np.ones(shape=img.shape, dtype=np.uint8)*np.uint8(average)

indices = np.argsort(counts)[::-1]   
freqs = np.cumsum(np.hstack([[0], counts[indices]/counts.sum()]))
rows = np.int_(img.shape[0]*freqs)

dom_patch = np.zeros(shape=img.shape, dtype=np.uint8)
for i in range(len(rows) - 1):
    dom_patch[rows[i]:rows[i + 1], :, :] += np.uint8(palette[indices[i]])

fig, (ax0, ax1) = plt.subplots(1, 2, figsize=(12,6))
ax0.imshow(avg_patch)
ax0.set_title('Average color')
ax0.axis('off')
ax1.imshow(dom_patch)
ax1.set_title('Dominant colors')
ax1.axis('off')
plt.show(fig)

TL; DR ответ

Таким образом, несмотря на то, что вычисление среднего цвета - как предложено в @Ruan B. ответ - является технически правильным с математической точки зрения, полученный результат может неадекватно представлять цветовое содержание изображения. Более разумный подход заключается в определении доминирующего цвета посредством векторного квантования (кластеризации).

Ответ 2

Мне удалось получить средний цвет, используя следующее:

import cv2
import numpy
myimg = cv2.imread('image.jpg')
avg_color_per_row = numpy.average(myimg, axis=0)
avg_color = numpy.average(avg_color_per_row, axis=0)
print(avg_color)

Результат:

[ 197.53434769  217.88439451  209.63799938]

Великий ресурс, на который я ссылался

Ответ 3

Здесь хорошая статья, объясняющая различия между усреднением, использованием цветовой частоты и k-средних кластеров с образцами изображений и результатов.

Ответ 4

Другой подход - использование K-Means Clustering для определения доминирующих цветов в изображении с помощью sklearn.cluster.KMeans()


.Входное изображение

Результаты

С n_clusters=5, здесь представлены наиболее доминирующие цвета и процентное распределение

[76.35563647 75.38689122 34.00842057] 7.92%
[200.99049989  31.2085501   77.19445073] 7.94%
[215.62791291 113.68567694 141.34945328] 18.85%
[223.31013152 172.76629675 188.26878339] 29.26%
[234.03101989 217.20047979 229.2345317 ] 36.03%

Визуализация каждого цветового кластера

enter image description here

Сходство с n_clusters=10,

[161.94723762 137.44656853 116.16306634] 3.13%
[183.0756441    9.40398442  50.99925105] 4.01%
[193.50888866 168.40201684 160.42104169] 5.78%
[216.75372674  60.50807092 107.10928817] 6.82%
[73.18055782 75.55977818 32.16962975] 7.36%
[226.25900564 108.79652434 147.49787087] 10.44%
[207.83209569 199.96071651 199.48047163] 10.61%
[236.01218943 151.70521203 182.89174295] 12.86%
[240.20499237 189.87659523 213.13580544] 14.99%
[235.54419627 225.01404087 235.29930545] 24.01%

enter image description here

import cv2, numpy as np
from sklearn.cluster import KMeans

def visualize_colors(cluster, centroids):
    # Get the number of different clusters, create histogram, and normalize
    labels = np.arange(0, len(np.unique(cluster.labels_)) + 1)
    (hist, _) = np.histogram(cluster.labels_, bins = labels)
    hist = hist.astype("float")
    hist /= hist.sum()

    # Create frequency rect and iterate through each cluster color and percentage
    rect = np.zeros((50, 300, 3), dtype=np.uint8)
    colors = sorted([(percent, color) for (percent, color) in zip(hist, centroids)])
    start = 0
    for (percent, color) in colors:
        print(color, "{:0.2f}%".format(percent * 100))
        end = start + (percent * 300)
        cv2.rectangle(rect, (int(start), 0), (int(end), 50), \
                      color.astype("uint8").tolist(), -1)
        start = end
    return rect

# Load image and convert to a list of pixels
image = cv2.imread('1.png')
image = cv2.cvtColor(image, cv2.COLOR_BGR2RGB)
reshape = image.reshape((image.shape[0] * image.shape[1], 3))

# Find and display most dominant colors
cluster = KMeans(n_clusters=5).fit(reshape)
visualize = visualize_colors(cluster, cluster.cluster_centers_)
visualize = cv2.cvtColor(visualize, cv2.COLOR_RGB2BGR)
cv2.imshow('visualize', visualize)
cv2.waitKey()