Подтвердить что ты не робот

Случайно перетасовывающие строки в Linux/Bash

У меня есть файлы в Linux. Например, 2 и мне нужно перетасовать файлы в один файл.

Например

$cat file1
line 1
line 2
line 3
line 4
line 5
line 6
line 7
line 8

и

$cat file2
linea one
linea two
linea three
linea four
linea five
linea six
linea seven
linea eight

И позже, когда я перетасовываю два файла, я могу получить что-то вроде:

linea eight
line 4
linea five
line 1
linea three
line 8
linea seven
line 5
linea two
linea one
line 2
linea four
line 7
linea six
line 1
line 6
4b9b3361

Ответ 1

Вы должны использовать команду shuf= =

cat file1 file2 | shuf

Или с Perl:

cat file1 file2 | perl -MList::Util=shuffle -wne 'print shuffle <>;'

Ответ 2

Сортировка: (аналогичные строки будут объединены)

cat file1 file2 | sort -R

Шуфа:

cat file1 file2 | shuf

Perl:

cat file1 file2 | perl -MList::Util=shuffle -e 'print shuffle<STDIN>'

BASH:

cat file1 file2 | while IFS= read -r line
do
    printf "%06d %s\n" $RANDOM "$line"
done | sort -n | cut -c8-

Awk:

cat file1 file2 | awk 'BEGIN{srand()}{printf "%06d %s\n", rand()*1000000, $0;}' | sort -n | cut -c8-

Ответ 3

Просто заметьте пользователям OS X, которые используют MacPorts: команда shuf является частью coreutils и устанавливается под именем gshuf.

$ sudo port install coreutils
$ gshuf example.txt # or cat example.txt | gshuf

Ответ 4

Здесь однострочный, который не полагается на shuf или sort -R, который у меня не был на моем mac:

while read line; do echo $RANDOM $line; done < my_file | sort -n | cut -f2- -d' '

Это итерация по всем строкам в my_file и перепечатка их в рандомизированном порядке.

Ответ 5

Вам здесь не нужны трубы. Сортировка сама по себе делает это с файлом (файлами) в качестве параметров. Я бы просто сделал

sort -R file1

или если у вас несколько файлов

sort -R file1 file2

Ответ 6

Я бы использовал shuf.

другой вариант, сортировка gnu имеет:

   -R, --random-sort
          sort by random hash of keys

вы можете попробовать:

cat file1 file2|sort -R

Ответ 7

Это сработало для меня. Он использует Shuffle Fisher-Yates.

randomize()
{   
    arguments=("[email protected]")
    declare -a out
    i="$#"
    j="0"

while [[ $i -ge "0" ]] ; do
    which=$(random_range "0" "$i")
    out[j]=${arguments[$which]}
    arguments[!which]=${arguments[i]}
    (( i-- ))
    (( j++ ))
done
echo ${out[*]}
}


random_range()
{
    low=$1
    range=$(($2 - $1))
    if [[ range -ne 0 ]]; then
        echo $(($low+$RANDOM % $range))
    else
        echo "$1"
    fi
}

Ответ 8

Это явно смещенный ранд (примерно половина времени, когда список начинается с первой строки), но для некоторой базовой рандомизации с использованием только встроенных команд bash, я думаю, это нормально? Просто напечатайте каждую строку да/нет, затем напечатайте остальные...

shuffle() {
    local IFS=$'\n' tail=
    while read l; do
        if [ $((RANDOM%2)) = 1 ]; then
            echo "$l"
        else
            tail="${tail}\n${l}"

        fi
    done < $1
    printf "${tail}\n"
}