Хотите прямо сейчас получить бесплатный видеокурс по программированию для начинающих?

C# Парсим страницы

Сентябрь 7, 2013

parsing

Довольно часто приходится работать с различными сайтами, извлекать какую либо информацию и использовать ее в своем приложении. Такая процедура обычно называется парсингом. Это очень часто может пригодиться вам в вашей практике для реализации различных идей. В этой статье я хочу показать, как эффективно и совсем не сложно извлекать необходимые данные с помощью регулярных выражений. Для работы с регулярными выражениями нам необходимо указать using System.Text.RegularExpressions; Для начала рассмотрим пример извлечения данных с помощью простых регулярных выражений. Предположим, что нам необходимо извлечь информацию, которая заключена между тегами <div class=»my_class»>Some info</div> Для этого создаем строковую переменную в которую поместим наш шаблон string pattern = «<div class=»my_class»>(.*)</div>»;    где  (.*)  указываем на месте данных которые хотим извлечь. После этого прописываем

Match result;
result = Regex.Match(text, pattern);

Таким образом в переменной result у нас содержаться все совпадения по нашему регулярному выражению. Что бы получить конкретно, то что было между тегом обращаемся к массиву art.Groups[1]





						
						
						
					


Один комментарий к записи C# Парсим страницы

  1. yuriy on 10.09.2013 at 23:42

    Нельзя ли попльзоватся картинкой в голове?

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *

Поддержите проект

Хит продаж:

Случайный анекдот

Моя вторая книга

Что это???

Программирование для Android:

Мы вконтакте

Помощь сайту

Понравился сайт? Он сильно нуждается в раскрутке.

Чтобы помочь в раскрутке - опубликуйте ссылку на сайт (или любую его страницу) на любом другом сайте в интернете. Тогда сайт станет чуточку популярнее.

Или просто нажмите на кнопки социальных сетей которые стоят в конце каждой статьи

Вместе мы сможем сделать программирование более популярным и более понятным для всех!

Заранее спасибо!
Артём Кашеваров.