Как получить исходный код HTML страницы (Delphi)
Часто бывает нужно написать приложение берущее какие то данные из интернета, но как к этому подступиться ломают голову многие. Также если вы хотите создать парсер то тоже не понятно с чего начать.
А тут на самом деле все просто — нужно просто написать приложение которое будет забирать исходный код страницы прямо с интернет сайта! Но для начала мы научимся получать этот самый исходный HTML код.
Как получить исходный код любой веб страницы рассказывается в моем новом видео:
Как видите все делается очень просто всего при помощи вызова всего одной функции:
1 | memo1.text:= idHTTP1.Get('http://programmerinfo.ru/'); |
Результат выполнения которой возвращает длииииииииную строку из всего HTML кода.
И еще важная деталь, о которой я забыл упомянуть в видео, если вдруг запрос от сервера на котором размещен сайт не удастся, то код ответа от сервера можно всегда посмотреть вызвав функцию:
1 | kodoshibki:=idhttp1.Response.ResponseText; |
Функция возвращает ответ в виде строки(string).
Если запрос был удачный то код ответа будет 200 что означает отсутствие ошибки. Если страница не найдена то 404. Остальные коды ошибок можно посмотреть тут: programmerinfo.ru/httperror/
В следующем видео разберем как считать с страницы то что нам нужно.
P.S. Следующее видео тут — programmerinfo.ru/htmlcut/
Понравилась статья? Жми: | Поделиться в соц. сетях |
a что делать если у меня уже есть 3 сайта их что закрывать нужно не понятно
А как получить реальные данные странички, например, на ASP написана страница, туда подгружается таблица, в HTML есть только фрэймы. А нужен текст из таблицы
Фрейм всегда берется с какой-то другой HTML странички. нужно посмотреть что это за страница и делать запрос именно к ней.
Дорогой Артем ,интересный урок ,и вдохновившись им решил написать маленькую програмку на которая будет переодически выводить цены определенной продукции на интернет-магазине amazon.com .однако встави полную ссылку продукции заметил что выдается ошибка 301 как правило . Похоже что до открытия страницы в браузере происходят переадресации , а конечная ссылка не видна…
Что вы думаете по этому поводу? Спасибо.
Здравствуйте, у нас на сайте был урок по обработке редиректов, вот он programmerinfo.ru/htmlred/ там и научитесь обрабатывать чтоб все было ОК. Удачи Вам!
Таким способом код многих страниц не грузится просто, появляется ошибка даже если свойство IDHTTP HandleRedirects установлено в true.