Подтвердить что ты не робот

Устранить частично дублированные строки по столбцу и сохранить последний

У меня есть файл, который выглядит так:

2011-03-21 name001 line1
2011-03-21 name002 line2
2011-03-21 name003 line3
2011-03-22 name002 line4
2011-03-22 name001 line5

для каждого имени, я хочу только его последний вид. Итак, я ожидаю, что результатом будет:

2011-03-21 name003 line3
2011-03-22 name002 line4
2011-03-22 name001 line5

Может ли кто-нибудь дать мне решение с помощью bash/awk/sed?

4b9b3361

Ответ 1

Этот код получает строки uniq вторым полем, но с конца файла или текста (например, в вашем примере)

tac temp.txt | sort -k2,2 -r -u

Ответ 2

awk '{a[$2]=$0} END {for (i in a) print a[i]}' file

Если порядок внешнего вида важен:

  • Основываясь на первом виде:

    awk '!a[$2] {b[++i]=$2} {a[$2]=$0} END {for (i in b) print a[b[i]]}' file
    
  • Исходя из последнего вида:

    tac file | awk '!a[$2] {b[++i]=$2} {a[$2]=$0} END {for (i in b) print a[b[i]]}'
    

Ответ 3

sort < bar > foo
uniq  < foo > bar

теперь нет дублированных строк

Ответ 4

EDIT: Здесь версия, которая фактически отвечает на вопрос.

sort -k 2 filename | while read f1 f2 f3; do if [ ! "$f2" = "$lf2" ]; then echo "$f1 $f2 $f3"; lf2="$f2"; fi; done