Подтвердить что ты не робот

Обнаружение плохих json-данных в PHP json_decode()?

Я пытаюсь обрабатывать плохие данные json при анализе через json_decode(). Я использую следующий script:

if(!json_decode($_POST)) {
  echo "bad json data!";
  exit;
}

Если $_POST равно:

'{ bar: "baz" }'

Затем json_decode обрабатывает ошибку и выдает "плохие данные json!"; Однако, если я устанавливаю $_POST на что-то вроде "недопустимых данных", это дает мне:

Warning: json_decode() expects parameter 1 to be string, array given in C:\server\www\myserver.dev\public_html\rivrUI\public_home\index.php  on line 6
bad json data!

Нужно ли писать пользовательский script для обнаружения действительных данных json или есть какой-то другой отличный способ обнаружить это?

4b9b3361

Ответ 1

Вот пара вещей о json_decode:

  • он возвращает данные или null, когда есть ошибка
  • он также может возвращать null, когда нет ошибки: когда строка JSON содержит null
  • появляется предупреждение, в котором есть предупреждение - предупреждение о том, что вы хотите исчезнуть.


Для решения проблемы предупреждения было бы использовать оператор @ (я не часто рекомендую его использовать, поскольку он делает отладку намного сложнее... Но здесь не так много выбора):

$_POST = array(
    'bad data'
);
$data = @json_decode($_POST);

Затем вам нужно будет проверить, если $data is null - и, чтобы избежать случая, когда json_decode возвращает null для null в строке JSON, вы можете проверить json_last_error, который (цитирование):

Возвращает последнюю ошибку (если она есть) произошел в результате последнего разбора JSON.


Это означает, что вам придется использовать какой-то код, например:

if ($data === null
    && json_last_error() !== JSON_ERROR_NONE) {
    echo "incorrect data";
}

Ответ 2

Вы также можете использовать json_last_error: http://php.net/manual/en/function.json-last-error.php

который, как говорится в документации:

Возвращает последнюю ошибку (если она есть) во время последнего JSON кодирование/декодирование.

вот пример

json_decode($string);

switch (json_last_error()) {
    case JSON_ERROR_NONE:
        echo ' - No errors';
    break;
    case JSON_ERROR_DEPTH:
        echo ' - Maximum stack depth exceeded';
    break;
    case JSON_ERROR_STATE_MISMATCH:
        echo ' - Underflow or the modes mismatch';
    break;
    case JSON_ERROR_CTRL_CHAR:
        echo ' - Unexpected control character found';
    break;
    case JSON_ERROR_SYNTAX:
        echo ' - Syntax error, malformed JSON';
    break;
    case JSON_ERROR_UTF8:
        echo ' - Malformed UTF-8 characters, possibly incorrectly encoded';
    break;
    default:
        echo ' - Unknown error';
    break;
}

Ответ 3

Вот как Guzzle обрабатывает json

    /**
 * Parse the JSON response body and return an array
 *
 * @return array|string|int|bool|float
 * @throws RuntimeException if the response body is not in JSON format
 */
public function json()
{
    $data = json_decode((string) $this->body, true);
    if (JSON_ERROR_NONE !== json_last_error()) {
        throw new RuntimeException('Unable to parse response body into JSON: ' . json_last_error());
    }

    return $data === null ? array() : $data;
}

Ответ 4

Я просто сломал себе голову над синтаксической ошибкой json в том, что оказалось совершенным json: {"test1":"car", "test2":"auto"} из строки с кодировкой url.

Но в моем случае некоторые из вышеперечисленных были закодированы html, так как добавление html_entity_decode($string) делало трюк.

$ft = json_decode(html_entity_decode(urldecode(filter_input(INPUT_GET, 'ft', FILTER_SANITIZE_STRING))));

Надеюсь, это спасет кого-то еще некоторое время.

Ответ 5

Начиная с PHP 7.3, функция json_decode будет принимать новую опцию JSON_THROW_ON_ERROR, которая позволит json_decode генерировать исключение вместо возврата null при ошибке.


Пример:

try {  
  json_decode("{", false, 512, JSON_THROW_ON_ERROR);  
}  
catch (\JsonException $exception) {  
  echo $exception->getMessage(); // displays "Syntax error"  
}

Ответ 6

/**
 * 
 * custom json_decode 
 * handle json_decode errors
 * 
 * @param type $json_text
 * @return type
 */
public static function custom_json_decode($json_text) {

    $decoded_array = json_decode($json_text, TRUE);
    switch (json_last_error()) {
        case JSON_ERROR_NONE:
            return array(
                "status" => 0,
                "value" => $decoded_array
            );


        case JSON_ERROR_DEPTH:
            return array(
                "status" => 1,
                "value" => 'Maximum stack depth exceeded'
            );

        case JSON_ERROR_STATE_MISMATCH:
            return array(
                "status" => 1,
                "value" => 'Underflow or the modes mismatch'
            );

        case JSON_ERROR_CTRL_CHAR:
            return array(
                "status" => 1,
                "value" => 'Unexpected control character found'
            );

        case JSON_ERROR_SYNTAX:
            return array(
                "status" => 1,
                "value" => 'Syntax error, malformed JSON'
            );

        case JSON_ERROR_UTF8:
            return array(
                "status" => 1,
                "value" => 'Malformed UTF-8 characters, possibly incorrectly encoded'
            );

        default:
            return array(
                "status" => 1,
                "value" => 'Unknown error'
            );
    }
}

Ответ 7

Я только что провел час, рассматривая все возможные решения на этой странице. Я взял на себя смелость объединить все эти возможные решения в одну функцию, чтобы сделать ее более быстрой и легкой для отладки и отладки.

Я надеюсь, что это может быть полезным для кого-то еще.

<?php
/**
 * Decontaminate text
 *
 * Primary sources:
 *  - https://stackoverflow.com/info/17219916/json-decode-returns-json-error-syntax-but-online-formatter-says-the-json-is-ok
 *  - https://stackoverflow.com/info/2348152/detect-bad-json-data-in-php-json-decode
 */
function decontaminate_text(
  $text,
  $remove_tags = true,
  $remove_line_breaks = true,
  $remove_BOM = true,
  $ensure_utf8_encoding = true,
  $ensure_quotes_are_properly_displayed = true,
  $decode_html_entities = true
){

  if ( '' != $text && is_string( $text ) ) {
    $text = preg_replace( '@<(script|style)[^>]*?>.*?</\\1>@si', '', $text );
    $text = str_replace(']]>', ']]&gt;', $text);

    if( $remove_tags ){
      // Which tags to allow (none!)
      // $text = strip_tags($text, '<p>,<strong>,<span>,<a>');
      $text = strip_tags($text, '');
    }

    if( $remove_line_breaks ){
      $text = preg_replace('/[\r\n\t ]+/', ' ', $text);
      $text = trim( $text );
    }

    if( $remove_BOM ){
      // Source: https://stackoverflow.com/a/31594983/1766219
      if( 0 === strpos( bin2hex( $text ), 'efbbbf' ) ){
        $text = substr( $text, 3 );
      }
    }

    if( $ensure_utf8_encoding ){

      // Check if UTF8-encoding
      if( utf8_encode( utf8_decode( $text ) ) != $text ){
        $text = mb_convert_encoding( $text, 'utf-8', 'utf-8' );
      }
    }

    if( $ensure_quotes_are_properly_displayed ){
      $text = str_replace('&quot;', '"', $text);
    }

    if( $decode_html_entities ){
      $text = html_entity_decode( $text );
    }

    /**
     * Other things to try
     * - the chr-function: https://stackoverflow.com/a/20845642/1766219
     * - stripslashes (THIS ONE BROKE MY JSON DECODING, AFTER IT STARTED WORKING, THOUGH): https://stackoverflow.com/a/28540745/1766219
     * - This (improved?) JSON-decoder didn't help me, but it sure looks fancy: https://stackoverflow.com/a/43694325/1766219
     */

  }
  return $text;
}

// Example use
$text = decontaminate_text( $text );

// $text = decontaminate_text( $text, false ); // Debug attempt 1
// $text = decontaminate_text( $text, false, false ); // Debug attempt 2
// $text = decontaminate_text( $text, false, false, false ); // Debug attempt 3

$decoded_text = json_decode( $text, true );
echo json_last_error_msg() . ' - ' . json_last_error();
?>

Я буду поддерживать это здесь: https://github.com/zethodderskov/decontaminate-text-in-php/blob/master/decontaminate-text-preparing-it-for-json-decode.php