Внешний вид сайта:

Общая информация

Полезность страницы:
0/100

На данной вкладке вам необходимо указать общую информацию о сайте источнике и информацию для отображения задания в интерфейсе парсера. Выглядит данная вкладка так:

parser-19

Название - в данном поле нужно указать название, которое будет отображаться в списке заданий.  Это название самого задания и вы можете назвать его так, как вам этого захочется.

Источник - это поле используется для сортировки заданий в интерфейсе парсера. Для каждого источника указывайте одинаковое значение, чтобы иметь возможночть сортировки заданий по источнику.

URL - начальная страница, на которой размещен список интересующих вас публикаций. Обязательное поле. На указанной вами странице будет производиться поиск ссылок на публикации с послледующей их загрузкой.

Кодировка сайта - если кодировка сайта отлична от UTF-8, укажите ее в этом поле. если сайт имеет кодировку UTF-8, то ничего указывать не надо, оставьте это поле пустым. Если вместо текста парсер возвращает набор непонятных символов - укажите верную кодировку. Узнать кодировку сайта-источника можно посмотрев исходный код страницы и найдя в разделе <head> стриницы соответствующее поле:

<meta charset="windows-1251">

Если кодировка сайта UTF-8, не заполняйте это поле, т.к. попытка преобразования из UTF-8 в UTF-8 приведет к таким же печальным последствиям.

Количество получаемых публикаций - введите количество публикаций, которое вы бы хотели получить с сайта-источника за один запуск задания. Влияет как на ручной запуск задания, так и на выполнение задания в автоматическом режиме. Важно: учитывайте возможности вашего сервера и сервера, на котором расположен источник. Не пытайтесь получить получить 100 статей сразу и немедленно.

Периодичность выполнения, минут - укажите периодичность выполнения задания в автоматическом режиме. Если запуск парсера по CRON-у включен, то задание будет выполнено каждые N минут, где N - указанное вами значение.

Иллюстрации обязательны - при выборе данной опции все публикации, для которых отсутствует картинка-тизер будут отбракованы парсером. Данная опция позволяет публиковать только те статьи, для которых иллюстрации присутствуют и не получать из источника статьи без иллюстраций.

Дополнить страницу Вы можете помочь другим людям дополнив эту страницу вашими знаниями по данному вопросу!
03:50

Комментарии

Нет комментариев. Ваш будет первым!