C# Парсим страницы
Довольно часто приходится работать с различными сайтами, извлекать какую либо информацию и использовать ее в своем приложении. Такая процедура обычно называется парсингом. Это очень часто может пригодиться вам в вашей практике для реализации различных идей. В этой статье я хочу показать, как эффективно и совсем не сложно извлекать необходимые данные с помощью регулярных выражений. Для работы с регулярными выражениями нам необходимо указать using System.Text.RegularExpressions; Для начала рассмотрим пример извлечения данных с помощью простых регулярных выражений. Предположим, что нам необходимо извлечь информацию, которая заключена между тегами <div class=»my_class»>Some info</div> Для этого создаем строковую переменную в которую поместим наш шаблон string pattern = «<div class=»my_class»>(.*)</div>»; где (.*) указываем на месте данных которые хотим извлечь. После этого прописываем
Match result; result = Regex.Match(text, pattern);
Таким образом в переменной result у нас содержаться все совпадения по нашему регулярному выражению. Что бы получить конкретно, то что было между тегом обращаемся к массиву art.Groups[1]
Понравилась статья? Жми: | Поделиться в соц. сетях |
Нельзя ли попльзоватся картинкой в голове?