Мне нужен шаблон регулярного выражения для поиска ссылок на веб-страницы в HTML.
Сначала я использую @"(<a.*?>.*?</a>)"
для извлечения ссылок (<a>
), но я не могу извлечь из него href
.
Мои строки:
-
<a href="www.example.com/page.php?id=xxxx&name=yyyy" ....></a>
-
<a href="#" onclick="location.href='http://www.example.com/page.php?id=xxxx&name=yyyy'; return false;" ....></a>
-
<a href="#" onclick="location.href='https://www.example.com/page.php?id=xxxx&name=yyyy'; return false;" ....></a>
-
<a href="www.example.com/page.php/404" ....></a>
1, 2 и 3 действительны, и они мне нужны, но номер 4 для меня недействителен
(?
и =
существенно)
Спасибо всем, но мне не нужен синтаксический анализ <a>
. У меня есть список ссылок в формате href="abcdef"
.
Мне нужно получить href
ссылок и отфильтровать его, мои любимые URL должны содержать ?
и =
как page.php?id=5
Спасибо!