Полный текст статьи
Получение полного текста статьи также ничем не отличается от настройки получения заголовка. Однако данное поле имеет гораздо больше дополнительных настроек, предназначенных для форматирования и очистки полученного текста. Их мы и рассмотрим подробно.
Загрузка изображений
При выборе данной опции все изображения, размещенные в теле полученной парсером статьи будут загружены на сервер. Для загрузки изображений применяются стандартные средства InstantCMS, файлы располагаются в тех же папках, что и превью к статьям. Изображения загружаются в оригинальном размере. Если вы отключили эту опцию, то картинки из тела статьи не будут загружены на ваш сервер, а URL картинок в теле статьи указывать на оригиналы изображений на сайте-источнике.
Добавление аттрибутов к картинкам
Вы можете добавить ко всем изображениям в теле статьи любые аттрибуты. Например, если ввести в данное поле строку
rel="lightbox"
, то все картинки в статье будут иметь вид:
<img src="..." rel="lightbox">
Данная функция предназначена для оформления картинок в теле статьи нужными CSS-классами и взаимодействия с различными скриптами просмотра изображений и галереями. Также не исключено и другое применение данной возможности.
Замена тегов в теле статьи
Данная опция позволяет производить массовую замену тегов в тексте статьи. Простейшим примером использования данной функции является замена тегов <div> на теги <p> или наоборот с целью адаптации контента под верстку вашего сайта. Однако применение данной функции может быть и другим и ограничено только вашей фантазией. Для замены одного тега другим используйте выражение искомый тег=>конечный тег, где искомый тег - это тег, который нужно заменить, конечный тег - тег, на который нужно произвести замену. Данная функция выполняет замену тегов не затрагивая их ID, CSS-классы и другие аттрибуты. Например, применение команды div=>p к фрагменту кода
<div id="paragraph" class="article">Тут любой текст</div>
преобразует его в следующий фрагмент:
<p id="paragraph" class="article">Тут любой текст</p>
Для перечисления множества команд используйте разделитель " || ". Таким образом список команд должен выглядеть примерно так:
div=>p || i=>b || span=>div
Удаление/замена мусора
Данная опция предназначена для удаления/замены ненужных вкраплений из текста статьи. Также может быть использована для замены каких-либо элементов своими. Например выражение
По материалам=><br/><br/>По материалам
добавляет перенос строки перед фразой "По материалам", а фраза
class="intro"=>style="display:none;"
прячет элемент с классом "intro" от глаз пользователя.
Удаление пустых элементов
Данная опция удаляет из текста безанкорные ссылки. Иногда из-за ошибок верстки или как ловушка для копипастеров в тексте статьи размещаются ссылки, не содержащие анкора. Такие ссылки имеют вид
<a href="ссылка"></a>
и визуально не видны на странице. Этим и пользуются некоторые владельцы сайтов, размещая такие ссылки в статьях для незадачливых копипастеров. При включении данной опции все подобные ссылки будут вырезаны из текста статьи.
Наверное вам хоть раз, да приходилось встречать примерно такой код страниц:
Вы не поверите, но строки 768-773 на этом скриншоте это всего лишь фрагмент секции HEAD страницы, а секция BODY начинается далеко за пределами 2000 строк. Думаю в БД сайта вам не нужен такой код да и работать с ним тоже приятного мало. Поэтому, если вы имеете дело с подобным сайтом-источником, просто включите эту опцию. Она приведет код полученного контента в компактный и удобочитаемый вид.
Комментарии