Подтвердить что ты не робот

Кодирование ключей хэша: почему я попадаю сюда с Devel:: Peek:: Дамп два разных результата?

Почему я могу попасть сюда с Devel:: Peek:: Дамп двух разных результатов?

#!/usr/bin/env perl
use warnings;
use 5.014;
use utf8;
binmode STDOUT, ':encoding(utf-8)';
use Devel::Peek;

my %hash1 = ( 'müller' => 1 );
say Dump $_ for keys %hash1;

my %hash2;
$hash2{'müller'} = 1;
say Dump $_ for keys %hash2;

Вывод:

SV = PV(0x753270) at 0x76d230
  REFCNT = 2
  FLAGS = (POK,pPOK,UTF8)
  PV = 0x759750 "m\303\274ller"\0 [UTF8 "m\x{fc}ller"]
  CUR = 7
  LEN = 8

SV = PV(0x753270) at 0x7d75a8
  REFCNT = 2
  FLAGS = (POK,FAKE,READONLY,pPOK)
  PV = 0x799110 "m\374ller"
  CUR = 6
  LEN = 0
4b9b3361

Ответ 1

Оба этих скаляра содержат точно такую ​​же строку. Единственное различие заключается только в том, как строка хранится внутри.

Я предполагаю, что ключ нормализуется, чтобы упростить сравнение при попытке найти ключ в хеше.

Ответ 2

Это не ответ, я считаю, что ответ ikegami правильный. Я просто хотел добавить некоторые наблюдения с некоторым кодом.

Я выполнил следующий код с 5.10 по 5.15, и поведение было непротиворечивым.

use utf8;
use Test::More;

{
    my %h = ('müller' => 1);
    my $k = (keys %h)[0];
    ok(utf8::is_utf8($k), 'UTF-8 Latin-1 hash key has SvUTF8 set');
}

{
    my %h = ('müller' => 1);
       $h{'müller'} = 2;
    my $k = (keys %h)[0];
    ok( ! utf8::is_utf8($k), 'UTF-8 Latin-1 hash key does not has SvUTF8 set after assignment');
}

{
    my %h = ('☺' => 1);
       $h{'☺'} = 2;
    my $k = (keys %h)[0];
    ok(utf8::is_utf8($k), 'UTF-8 (> Latin-1) hash key has SvUTF8 set after assignment');
}

done_testing;

Если ожидается второе испытание, это будет первое молчаливое понижение, о котором я знаю. Я предполагаю, что p5p имеет окончательный ответ, является ли это ошибкой оптимизации или ожидаемым поведением. (sv_dump выглядит как оптимизация (POK, FAKE, READONLY, pPOK))