Как защитить контент сайта от парсинга

Не успела я написать длинную новую статью для своего сайта, как уже минут через 10 пришло уведомление, что она уже опубликована на постороннем сайте. Что? Как вообще такое может быть? В интернете случаются еще и не такие чудеса. Многие кудесники, руки у которых растут из одного места, называть которые не буду, не хотят ничего делать своими руками.

Их логика такова: зачем тратить время и силы на написание контента, когда его можно взять и украсть у других авторов. Платформа Вордпресс имеет такой баг, ведь все статьи автоматически транслируются в RSS ленты. И как не закрывай эту ленту, как не уменьшай количество видимых в ней статей, все равно есть устройства, которые позволяют «вытягивать» контент на другие сайты.

Эти устройства называются парсерами. По своей сути парсер — это специальная программа, котора позволяет прикрепиться к сайту-донору и тянуть с него новый контент, который там появляется. Есть ли возможность избежать этого? В принципе в интернете все возможно и прямой копипаст запрещен. Но это не всех останавливает.

Какие есть способа защиты контента

  • WP Copy Protect — специальный плагин, который не дает напрямую выделить и скопировать текст на странице, чтобы вставить ее на другой сайт или блог. Скопировать содержание страницы на сайте, где установлен данный плагин может только администратор. Только одна невозможность выделить текст в статье, уже дает некоторое преимущество и спасает от «самоделкиных». Конечно, таким плагином не избавишься от профессиональных воров контента. Но от школьников, которые растаскивают статьи вполне можно защититься.
  • Блокировка парсера по Ip — это способ куда более продвинутый. Если заблокировать доступ к сайту с определенных Ip адресов, то парсер, которые установлен на сервере и имеет свой Ip, не сможет вообще открыть сайт. А раз не сможет открыть сайт, то и не сможет стянуть контент.

Как определить Ip адрес парсера

Тут все просто. У Вордпресс есть функция оповещений, из которой я и узнала, что моя статья уже размещена на другой блоге в интернете. Эти уведомления появляются в админ-панели Вордпресса. Увидеть эти уведомления можно после авторизации на сайте под паролем администратора. Они будут отображаться на вкладке «Комментарии». Как только сайт обнаружит чужую публикацию контента с Вашего сайта, тут же придет оповещение.

Как заблокировать Ip парсера

Для этого нужно внести вот такую строчку в файл «.htaccess», который находится в панели хостинга в разделе с основными файлами Вашего сайта. Обычно это папка «public_html». Нужно открыть этот файл и внести в него вот такую строчку:

Order allow,deny
Allow from All
Deny from 88.99.28.98

Где цифры в последней строчке «88.99.28.98» и есть номер Ip адреса, которому мы хотим запретить доступ. Иногда стоит заблокировать не только 1 Ip адрес, но и всю сетку (группу адресов). Для этого можно просто удалить последнюю цифру. Тогда будет заблокирована целая подсеть.

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *