Подтвердить что ты не робот

Selenium webdriver: Как найти ВСЕ атрибуты элементов?

В модуле Selenium Python, когда у меня есть объект WebElement, я могу получить значение любого из его атрибутов с помощью get_attribute():

foo = elem.get_attribute('href')

Если атрибут с именем 'href' не существует, возвращается None.

Мой вопрос: как я могу получить список всех атрибутов, которые имеет элемент? Кажется, что не существует методов get_attributes() или get_attribute_names().

4b9b3361

Ответ 1

Невозможно использовать API-интерфейс selenium webdriver, но вы можете выполнить код javascript для получения всех атрибутов:

driver.execute_script('var items = {}; for (index = 0; index < arguments[0].attributes.length; ++index) { items[arguments[0].attributes[index].name] = arguments[0].attributes[index].value }; return items;', element)

Демо:

>>> from selenium import webdriver
>>> from pprint import pprint
>>> driver = webdriver.Firefox()
>>> driver.get('https://stackoverflow.com')
>>> 
>>> element = driver.find_element_by_xpath('//div[@class="network-items"]/a')
>>> attrs = driver.execute_script('var items = {}; for (index = 0; index < arguments[0].attributes.length; ++index) { items[arguments[0].attributes[index].name] = arguments[0].attributes[index].value }; return items;', element)
>>> pprint(attrs)
{u'class': u'topbar-icon icon-site-switcher yes-hover js-site-switcher-button js-gps-track',
 u'data-gps-track': u'site_switcher.show',
 u'href': u'//stackexchange.com',
 u'title': u'A list of all 132 Stack Exchange sites'}

Для полноты решения альтернативным решением было бы получить тег outerHTML и проанализировать атрибуты с помощью парсера HTML. Пример (с помощью BeautifulSoup):

>>> from bs4 import BeautifulSoup
>>> html = element.get_attribute('outerHTML')
>>> attrs = BeautifulSoup(html, 'html.parser').a.attrs
>>> pprint(attrs)
{u'class': [u'topbar-icon',
            u'icon-site-switcher',
            u'yes-hover',
            u'js-site-switcher-button',
            u'js-gps-track'],
 u'data-gps-track': u'site_switcher.show',
 u'href': u'//stackexchange.com',
 u'title': u'A list of all 132 Stack Exchange sites'}

Ответ 2

Ниже представлен список всех атрибутов и их (иногда переведенных на строки) значений для меня, используя, по крайней мере, драйвер PhantomJS или Chrome:

elem.get_property('attributes')[0]

Чтобы просто получить имена:

x.get_property('attributes')[0].keys()

Ответ 3

Вот моя попытка ответить. Я проверил его только в окне поиска на главной странице google. Я использовал @alecxe ответ выше "outerHTML" Получив html, я использовал регулярное выражение ([a-z]+-?[a-z]+_?)='?"? для соответствия именам атрибутов. Я думаю, что регулярное выражение просто нужно будет изменить, чтобы соответствовать все большему числу случаев. Но главное имя, которое нам нужно, - "что стоит за знаком равенства".

Учитывая веб-элемент

def get_web_element_attribute_names(web_element):
    """Get all attribute names of a web element"""
    # get element html
    html = web_element.get_attribute("outerHTML")
    # find all with regex
    pattern = """([a-z]+-?[a-z]+_?)='?"?"""
    return re.findall(pattern, html)

Проверьте его на приведенном ниже коде

import re
from selenium import webdriver

driver = webdriver.Firefox()
google = driver.get("http://www.google.com")

driver.find_element_by_link_text("English").click()
search_element = driver.find_element_by_name("q")
get_web_element_attribute_names(search_element)

выход:

['class', 'id', 'maxlength', 'name', 'autocomplete', 'title', 'value', 'aria-label', 'aria-haspopup', 'role', 'aria-autocomplete', 'style', 'dir', 'spellcheck', 'type']