Отрицательный размер размера, вызванный вычитанием 3 из 1 для 'Conv2D'

Я использую Keras с Tensorflow как backend, вот мой код:

import numpy as np
np.random.seed(1373) 
import tensorflow as tf
tf.python.control_flow_ops = tf

import os
from keras.datasets import mnist
from keras.models import Sequential
from keras.layers.core import Dense, Dropout, Activation, Flatten
from keras.layers.convolutional import Convolution2D, MaxPooling2D
from keras.utils import np_utils

batch_size = 128
nb_classes = 10
nb_epoch = 12


img_rows, img_cols = 28, 28

nb_filters = 32

nb_pool = 2

nb_conv = 3


(X_train, y_train), (X_test, y_test) = mnist.load_data()

print(X_train.shape[0])

X_train = X_train.reshape(X_train.shape[0], 1, img_rows, img_cols)
X_test = X_test.reshape(X_test.shape[0], 1, img_rows, img_cols)


X_train = X_train.astype('float32')
X_test = X_test.astype('float32')
X_train /= 255
X_test /= 255


print('X_train shape:', X_train.shape)
print(X_train.shape[0], 'train samples')
print(X_test.shape[0], 'test samples')


Y_train = np_utils.to_categorical(y_train, nb_classes)
Y_test = np_utils.to_categorical(y_test, nb_classes)

model = Sequential()

model.add(Convolution2D(nb_filters, nb_conv, nb_conv,
border_mode='valid',
input_shape=(1, img_rows, img_cols)))
model.add(Activation('relu'))
model.add(Convolution2D(nb_filters, nb_conv, nb_conv))
model.add(Activation('relu'))

model.add(MaxPooling2D(pool_size=(nb_pool, nb_pool)))
model.add(Dropout(0.25))

model.add(Flatten())
model.add(Dense(128))
model.add(Activation('relu'))
model.add(Dropout(0.5))
model.add(Dense(nb_classes)) 
model.add(Activation('softmax')) 

model.compile(loss='categorical_crossentropy', optimizer='adadelta', metrics=["accuracy"])


model.fit(X_train, Y_train, batch_size=batch_size, nb_epoch=nb_epoch,
verbose=1, validation_data=(X_test, Y_test))

score = model.evaluate(X_test, Y_test, verbose=0)

print('Test score:', score[0])
print('Test accuracy:', score[1])

и ошибка Trackback:

Using TensorFlow backend.
60000
('X_train shape:', (60000, 1, 28, 28))
(60000, 'train samples')
(10000, 'test samples')
Traceback (most recent call last):
  File "mnist.py", line 154, in <module>
    input_shape=(1, img_rows, img_cols)))
  File "/usr/local/lib/python2.7/dist-packages/keras/models.py", line 276, in add
    layer.create_input_layer(batch_input_shape, input_dtype)
  File "/usr/local/lib/python2.7/dist-packages/keras/engine/topology.py", line 370, in create_input_layer
    self(x)
  File "/usr/local/lib/python2.7/dist-packages/keras/engine/topology.py", line 514, in __call__
    self.add_inbound_node(inbound_layers, node_indices, tensor_indices)
  File "/usr/local/lib/python2.7/dist-packages/keras/engine/topology.py", line 572, in add_inbound_node
    Node.create_node(self, inbound_layers, node_indices, tensor_indices)
  File "/usr/local/lib/python2.7/dist-packages/keras/engine/topology.py", line 149, in create_node
    output_tensors = to_list(outbound_layer.call(input_tensors[0], mask=input_masks[0]))
  File "/usr/local/lib/python2.7/dist-packages/keras/layers/convolutional.py", line 466, in call
    filter_shape=self.W_shape)
  File "/usr/local/lib/python2.7/dist-packages/keras/backend/tensorflow_backend.py", line 1579, in conv2d
    x = tf.nn.conv2d(x, kernel, strides, padding=padding)
  File "/usr/local/lib/python2.7/dist-packages/tensorflow/python/ops/gen_nn_ops.py", line 396, in conv2d
    data_format=data_format, name=name)
  File "/usr/local/lib/python2.7/dist-packages/tensorflow/python/framework/op_def_library.py", line 759, in apply_op
    op_def=op_def)
  File "/usr/local/lib/python2.7/dist-packages/tensorflow/python/framework/ops.py", line 2242, in create_op
    set_shapes_for_outputs(ret)
  File "/usr/local/lib/python2.7/dist-packages/tensorflow/python/framework/ops.py", line 1617, in set_shapes_for_outputs
    shapes = shape_func(op)
  File "/usr/local/lib/python2.7/dist-packages/tensorflow/python/framework/ops.py", line 1568, in call_with_requiring
    return call_cpp_shape_fn(op, require_shape_fn=True)
  File "/usr/local/lib/python2.7/dist-packages/tensorflow/python/framework/common_shapes.py", line 610, in call_cpp_shape_fn
    debug_python_shape_fn, require_shape_fn)
  File "/usr/local/lib/python2.7/dist-packages/tensorflow/python/framework/common_shapes.py", line 675, in _call_cpp_shape_fn_impl
    raise ValueError(err.message)
ValueError: Negative dimension size caused by subtracting 3 from 1 for 'Conv2D' (op: 'Conv2D') with input shapes: [?,1,28,28], [3,3,28,32].

Сначала я увидел несколько ответов, проблема с версией Tensorflow, поэтому я обновляю Tensorflow до 0.12.0, но все еще существует, это проблема с сетью или что-то мне не хватает, что должно выглядеть input_shape?

Обновление Здесь ./keras/keras.json:

{
    "image_dim_ordering": "tf", 
    "epsilon": 1e-07, 
    "floatx": "float32", 
    "backend": "tensorflow"
}

Ответ 1

Ваша проблема связана с image_ordering_dim в keras.json.

Из документа Обработка изображений Keras:

dim_ordering: один из {"th", "tf"}. Режим "tf" означает, что изображения должны иметь форму (образцы, высота, ширина, каналы), режим "th" означает, что изображения должны иметь форму (образцы, каналы, высота, ширина). По умолчанию используется значение image_dim_ordering, найденное в вашем конфигурационном файле Keras по адресу ~/.keras/keras.json. Если вы никогда не устанавливаете это, то это будет "TF".

Keras отображает операцию свертки на выбранный бэкэнд (theano или тензорный поток). Однако оба бэкэнда сделали разные варианты для упорядочения размеров. Если ваш пакет изображений состоит из N изображений размером HxW с каналами C, theano использует порядок NCHW, а тензор потока - порядок NHWC.

Keras позволяет вам выбирать, какой порядок вы предпочитаете, и будет выполнять преобразование для сопоставления с бэкэндами позади. Но если вы выберете image_ordering_dim="th" он ожидает упорядочения в стиле Theano (NCHW, тот, который у вас есть в вашем коде), а если image_ordering_dim="tf" он ожидает упорядочения в стиле тензорного потока (NHWC).

Так как ваш image_ordering_dim установлен в "tf", если вы измените ваши данные в стиль тензорного потока, он должен работать:

X_train = X_train.reshape(X_train.shape[0], img_cols, img_rows, 1)
X_test = X_test.reshape(X_test.shape[0], img_cols, img_rows, 1)

а также

input_shape=(img_cols, img_rows, 1)

Ответ 2

FWIW, я неоднократно получал эту ошибку с некоторыми значениями strides или kernel_size, но не со всеми, с backend и image_ordering, уже установленными как tensorflow, и они все исчезли, когда я добавил padding="same"

Ответ 3

Просто добавьте это:

from keras import backend as K
K.set_image_dim_ordering('th')

Ответ 4

Я столкнулся с той же проблемой, но она была решена путем изменения функции conv2d:

'
if K.image_data_format=='channels_first':
    x_train = x_train.reshape(x_train.shape[0], 1,img_cols,img_rows)
    x_test = x_test.reshape(x_test.shape[0], 1,img_cols,img_rows)
    input_shape = (1,img_cols,img_rows)
else:
    x_train = x_train.reshape(x_train.shape[0],img_cols,img_rows,1)
    x_test = x_test.reshape(x_test.shape[0],img_cols,img_rows,1)
    input_shape = (img_cols,img_rows,1)
model.add(Convolution2D(32,(3, 3), input_shape = input_shape, activation="relu"))
'

Ответ 5

У меня такая же проблема. Тем не менее, каждый слой Conv3D, который я использую, уменьшает размер ввода. Таким образом, включение одного параметра padding = 'same' во время объявления слоя Conv2D/3D решило проблему. Вот демо-код

model.add(Conv3D(32,kernel_size=(3,3,3),activation='relu',padding='same'))

Уменьшение размера фильтра также может решить проблему.