Подтвердить что ты не робот

HTML Agility Pack

Я пытаюсь использовать HTML Agility Pack, чтобы получить текст описания изнутри:

<meta name="description" content="**this is the text i want to extract and store in a string**" />

И кто-то из Stackoverflow некоторое время назад предложил использовать HTMLAgilityPack. Но я не знаю, как его использовать, и документация для него, которая была найдена (включая документы, содержащиеся в загрузках), имеет неверные ссылки и поэтому не может просмотреть документацию.

Может кто-нибудь, пожалуйста, помогите мне решить это?

4b9b3361

Ответ 1

Использование очень похоже на XmlDocument; вы можете использовать MSDN на XmlDocument для широкого обзора; вы также можете изучить синтаксис xpath (MSDN).

Пример:

HtmlDocument doc = new HtmlDocument();
doc.Load(path); // or .LoadHtml(html);
HtmlNode node = doc.DocumentNode.SelectSingleNode("//meta[@name='description']");
if (node != null) {
    string desc = node.GetAttributeValue("content", "");
    // TODO: write desc somewhere
}

Второй аргумент GetAttributeValue - это значение по умолчанию, возвращаемое в случае, если атрибут не найден.

Ответ 2

общедоступная строка HtmlAgi (строковый url, строковый ключ)   {

    var Webget = new HtmlWeb();
    var doc = Webget.Load(url);
    HtmlNode ourNode = doc.DocumentNode.SelectSingleNode(string.Format("//meta[@name='{0}']", key));

    if (ourNode != null)
    {


            return ourNode.GetAttributeValue("content", "");

    }
    else
    {
        return "not fount";
    }

}