Подтвердить что ты не робот

Получение HTML-источника или расширенного текста из буфера обмена X

Как получить богатый текст или исходный код HTML из буфера обмена X? Например, если вы скопируете какой-либо текст из веб-браузера и вставьте его в композер, он будет вставлен как HTML, со ссылками и т.д. Тем не менее, xclip -o для одного и того же выбора просто выводит обычный текст, переформатированный таким же образом, как и для elinks -dump. Я хотел бы вытащить HTML и в текстовый редактор (в частности, vim).

Я спросил тот же вопрос на superuser.com, потому что я надеялся, что есть утилита для этого, но я не получил никаких информационных ответов. API-интерфейс X-буфера обмена для меня еще является загадочным зверем; любые советы по взлому чего-то, чтобы вытащить эту информацию, приветствуются. Мой язык выбора в наши дни - Python, но в целом все в порядке.

4b9b3361

Ответ 1

В X11 вам необходимо связаться с владельцем выбора, узнать о поддерживаемых форматах и ​​затем запросить данные в определенном формате. Я думаю, что самый простой способ сделать это - использовать существующие инструментальные средства для окон. Например. с Python и GTK:

#!/usr/bin/python

import glib, gtk

def test_clipboard():
    clipboard = gtk.Clipboard()
    targets = clipboard.wait_for_targets()
    print "Targets available:", ", ".join(map(str, targets))
    for target in targets:
        print "Trying '%s'..." % str(target)
        contents = clipboard.wait_for_contents(target)
        if contents:
            print contents.data

def main():
    mainloop = glib.MainLoop()
    def cb():
        test_clipboard()
        mainloop.quit()
    glib.idle_add(cb)
    mainloop.run()

if __name__ == "__main__":
    main()

Результат будет выглядеть следующим образом:

$ ./clipboard.py 
Targets available: TIMESTAMP, TARGETS, MULTIPLE, text/html, text/_moz_htmlcontext, text/_moz_htmlinfo, UTF8_STRING, COMPOUND_TEXT, TEXT, STRING, text/x-moz-url-priv
...
Trying 'text/html'...
I asked <a href="http://superuser.com/questions/144185/getting-html-source-or-rich-text-from-the-x-clipboard">the same question on superuser.com</a>, because I was hoping there was a utility to do this, but I didn't get any informative responses.
Trying 'text/_moz_htmlcontext'...
<html><body class="question-page"><div class="container"><div id="content"><div id="mainbar"><div id="question"><table><tbody><tr><td class="postcell"><div><div class="post-text"><p></p></div></div></td></tr></tbody></table></div></div></div></div></body></html>
...
Trying 'STRING'...
I asked the same question on superuser.com, because I was hoping there was a utility to do this, but I didn't get any informative responses.
Trying 'text/x-moz-url-priv'...
http://stackoverflow.com/questions/3261379/getting-html-source-or-rich-text-from-the-x-clipboard

Ответ 2

Чтобы дополнить @rkhayrov answer, для этого уже существует команда: xclip. Или, точнее, там патч к xclip, который был добавлен до xclip позже в 2010 году, но еще не выпущен, но это делает. Итак, предполагая, что ваша ОС, например, Debian, поставляется с заголовком subversion xclip:

Чтобы указать цели для выбора CLIPBOARD:

$ xclip -selection clipboard -o -t TARGETS
TIMESTAMP
TARGETS
MULTIPLE
SAVE_TARGETS
text/html
text/_moz_htmlcontext
text/_moz_htmlinfo
UTF8_STRING
COMPOUND_TEXT
TEXT
STRING
text/x-moz-url-priv

Чтобы выбрать конкретную цель:

$ xclip -selection clipboard -o -t text/html
 <a href="#" onclick="location.href='https://stackoverflow.com/users/200540/rkhayrov'; return false;" title="3017 reputation" class="comment-user">rkhayrov</a>
$ xclip -selection clipboard -o -t UTF8_STRING
 rkhayrov
$ xclip -selection clipboard -o -t TIMESTAMP
684176350

И xclip также может устанавливать и иметь выбор (-i вместо -o).