Внешний вид сайта:

Полный текст статьи

Получение полного текста статьи также ничем не отличается от настройки получения заголовка. Однако данное поле имеет гораздо больше дополнительных настроек, предназначенных для форматирования и очистки полученного текста. Их мы и рассмотрим подробно.

Загрузка изображений

parser-38

При выборе данной опции все изображения, размещенные в теле полученной парсером статьи будут загружены на сервер. Для загрузки изображений применяются стандартные средства InstantCMS, файлы располагаются в тех же папках, что и превью к статьям. Изображения загружаются в оригинальном размере. Если вы отключили эту опцию, то картинки из тела статьи не будут загружены на ваш сервер, а URL картинок в теле статьи указывать на оригиналы изображений на сайте-источнике.

Добавление аттрибутов к картинкам

parser-39

Вы можете добавить ко всем изображениям в теле статьи любые аттрибуты. Например, если ввести в данное поле строку

rel="lightbox"

, то все картинки в статье будут иметь вид:

<img src="..." rel="lightbox">

Данная функция предназначена для оформления картинок в теле статьи нужными CSS-классами и взаимодействия с различными скриптами просмотра изображений и галереями. Также не исключено и другое применение данной возможности.

Замена тегов в теле статьи

parser-40

Данная опция позволяет производить массовую замену тегов в тексте статьи. Простейшим примером использования данной функции является замена тегов <div> на теги <p> или наоборот с целью адаптации контента под верстку вашего сайта. Однако применение данной функции может быть и другим и ограничено только вашей фантазией. Для замены одного тега другим используйте выражение искомый тег=>конечный тег, где искомый тег - это тег, который нужно заменить, конечный тег - тег, на который нужно произвести замену. Данная функция выполняет замену тегов не затрагивая их ID, CSS-классы и другие аттрибуты. Например, применение команды div=>p к фрагменту кода

<div id="paragraph" class="article">Тут любой текст</div>

преобразует его в следующий фрагмент:

<p id="paragraph" class="article">Тут любой текст</p>

Для перечисления множества команд используйте разделитель " || ". Таким образом список команд должен выглядеть примерно так:

div=>p || i=>b || span=>div

Удаление/замена мусора

parser-41

Данная опция предназначена для удаления/замены ненужных вкраплений из текста статьи. Также может быть использована для замены каких-либо элементов своими. Например выражение

По материалам=><br/><br/>По материалам

добавляет перенос строки перед фразой "По материалам", а фраза

class="intro"=>style="display:none;"

прячет элемент с классом "intro" от глаз пользователя.

Удаление пустых элементов

parser-42

Данная опция удаляет из текста безанкорные ссылки. Иногда из-за ошибок верстки или как ловушка для копипастеров в тексте статьи размещаются ссылки, не содержащие анкора. Такие ссылки имеют вид

<a href="ссылка"></a>

и визуально не видны на странице. Этим и пользуются некоторые владельцы сайтов, размещая такие ссылки в статьях для незадачливых копипастеров. При включении данной опции все подобные ссылки будут вырезаны из текста статьи.

parser-43

Наверное вам хоть раз, да приходилось встречать примерно такой код страниц:

parser-44

Вы не поверите, но строки 768-773 на этом скриншоте это всего лишь фрагмент секции HEAD страницы, а секция BODY начинается далеко за пределами 2000 строк. Думаю в БД сайта вам не нужен такой код да и работать с ним тоже приятного мало. Поэтому, если вы имеете дело с подобным сайтом-источником, просто включите эту опцию. Она приведет код полученного контента в компактный и удобочитаемый вид.

09:36

Комментарии

Нет комментариев. Ваш будет первым!