Мне нужно определить, может ли данная строка интерпретироваться как число (целое число или плавающая точка) в инструкции SQL. Как в следующем:
SELECT AVG(CASE WHEN x ~ '^[0-9]*.?[0-9]*$' THEN x::float ELSE NULL END) FROM test
Я обнаружил, что Postgres 'соответствие шаблону можно было бы использовать для этого. И поэтому я адаптировал выражение, приведенное в это место, чтобы включить числа с плавающей запятой. Это мой код:
WITH test(x) AS (
VALUES (''), ('.'), ('.0'), ('0.'), ('0'), ('1'), ('123'),
('123.456'), ('abc'), ('1..2'), ('1.2.3.4'))
SELECT x
, x ~ '^[0-9]*.?[0-9]*$' AS isnumeric
FROM test;
Выход:
x | isnumeric
---------+-----------
| t
. | t
.0 | t
0. | t
0 | t
1 | t
123 | t
123.456 | t
abc | f
1..2 | f
1.2.3.4 | f
(11 rows)
Как вы можете видеть, первые два элемента (пустая строка ''
и единственный период '.'
) ошибочно классифицируются как числовой тип (которых они не являются). На данный момент я не могу приблизиться к этому. Любая помощь ценится!
Обновить На основе этого ответа (и его комментариев) я адаптировал шаблон для:
WITH test(x) AS (
VALUES (''), ('.'), ('.0'), ('0.'), ('0'), ('1'), ('123'),
('123.456'), ('abc'), ('1..2'), ('1.2.3.4'), ('1x234'), ('1.234e-5'))
SELECT x
, x ~ '^([0-9]+[.]?[0-9]*|[.][0-9]+)$' AS isnumeric
FROM test;
Что дает:
x | isnumeric
----------+-----------
| f
. | f
.0 | t
0. | t
0 | t
1 | t
123 | t
123.456 | t
abc | f
1..2 | f
1.2.3.4 | f
1x234 | f
1.234e-5 | f
(13 rows)
Есть еще некоторые проблемы с научной нотацией и с отрицательными числами, как я вижу сейчас.