Тарифы Услуги Сим-карты

Что такое рефспам. Побеждаем реферальный спам в Google Analytics

Мы выпустили новую книгу «Контент-маркетинг в социальных сетях: Как засесть в голову подписчиков и влюбить их в свой бренд».

Подписаться

Реферальный спам – это вид спама через реферера – участника партнёрской программы, который зарегистрировался после приглашения другого пользователя. Это имитация переходов из поиска, т.е. в лог-файлах фиксируются визиты пользователей, которые на самом деле ни разу не посещали страницу. В записях Яндекс.Метрики и Google Analytics можно увидеть просмотры сайта от тех доменов, которые не имеют к нему никакого отношения.

Больше видео на нашем канале - изучайте интернет-маркетинг с SEMANTICA

Особенности рефспама

Такие действия – разновидность бесплатной рекламы того ресурса, с которого фиксируются переходы. Вас обманным путем привлекают к себе на сайт.

Объясним на простом примере. Нам всегда интересно узнать, кто уделяет нам внимание, и этим пользуются любители накручивать поведенческие факторы. Если кто-то постоянно лайкает ваши фотографии, оставляет хвалебные комментарии, вы рано или поздно зайдете в аккаунт этого пользователя, чтобы посмотреть, кто же это такой и почему проявляет столько интереса к вам. И наверняка будете разочарованы, когда вместо живого человека увидите фейковый аккаунт с подписью «Накрутка лайков, подписчиков, продвижение в Instagram». Так же и с рефспамом. Вы видите в отчетах источник регулярного стабильного трафика. Переходите по адресу, чтобы узнать, что это за ресурс, и найти на нем ссылку на свой сайт. Но ссылки там нет и никогда не было, а все посетители фейковые, и никаких переходов на ваш сайт на самом деле не совершали. Трафик ложный и исходит не от реальных пользователей, а от .

Самый очевидный показатель того, что источник переходов ложный – странные доменные имена, например: share-buttons.com, buttons-for-website.com. Когда вы кликаете по ссылкам, вы видите ресурсы с бесполезным или даже вредоносным содержимым. В отчетах Google Analytics такой источник переходов помечают статусом «не определен».

Для чего используют рефспам

При использовании реферального спама или по логам, обращение к вашему ресурсу происходит автоматически. В лучшем случае с сайта вытянут пару килобайт или совсем ничего, если подключение происходило с использованием функции открытия соединения.

Рефспам – это умышленное искажение данных о количестве посещений и поведенческих факторах. В нашем блоге есть , из нее можно сделать вывод что любой спам – это обман. Он нужен владельцам сайтов для того чтобы увеличить количество переходов. Рефспам искусственно повышает данные о трафике, и поэтому владельцы сайтов надеются на увеличение позиций в выдаче. Но эффект обычно оказывается обратным. За мошеннические способы накрутки ПФ сайт рискует попасть под антифорд-фильтр. Из-за пессимизации сайт теряет трафик и позиции в выдаче.

Какой вред приносит реферальный спам

Самое безобидное в спаме по логам – замусоривание интернет-пространства. Более серьезные последствия – снижение позиций того сайта, на который направлен рефспам. Ложные переходы имеют стопроцентный показатель отказов, длительность сеанса практически нулевая. Сведения в отчетах по веб-аналитике искажаются, владелец сайта получает ложные сведения, и вместе с этим наблюдает падение позиций своего ресурса из-за снижения поведенческих факторов.

Как запретить рефспам на сайте

Самые популярные и крупные поисковые системы, такие как Яндекс и Google утверждают, что у них есть автоматическая защита от злоумышленников, и они не учитывают переходы с таких сайтов. Но на самом деле владельцы сайтов по прежнему жалуются на спам по логам. Особенно подвержены спаму владельцы плохо защищенных ресурсов. Например, если их ресурс находится на дешевом хостинге или имеет ненадежную CMS.

Избежать проблем с рефспамом можно. Для этого существует два способа:

Способ 1. Поставьте фильтры, чтобы в отчетах по аналитике вашего сайта не появлялись внешние ссылки

В отчетах Google Analytics можно полностью исключить реферальные переходы. Поставив фильтр, вы учитываете трафик только с вашего хоста. Главное – не забудьте учесть необходимый хостнейм, иначе трафик потеряется.

Порядок действий по установке фильтра:

  • Открываем отчет по переходам и отмечаем максимально допустимый временной промежуток.
  • Отмечаем «Имя хоста» как дополнительный параметр».

  • Когда вы видите результаты, среди них нужно выбрать те, которые относятся к вашему сайту, включая поддомены.
  • Выполните настройку фильтров, вписав ваш сайт в поле «Шаблон фильтра»:

Недостаток этого подхода – можно по невнимательности не включить все хосты, и тогда сведения в отчетах будут неправильными.

Способ 2. Исключите весь ненужный трафик из ваших отчетов

Другой тип фильтра, который убирает все переходы от спам-ботов.

  • Заходим в фильтры и выполняем настройку:

  • В поле «Шаблон фильтра» указываем определенное выражение. В случае, указанном на скриншоте, не будут учитываться переходы с darodar и priceg.
  • Если вы захотите добавить другие ресурсы, переходы с которых нужно исключить из отчета, пропишите их в круглых скобках через вертикальный слеш.

Сложность заключается в том, что число рефералов постоянно растет. Поэтому нужно регулярно отслеживать новые и обновлять список.

Очень часто мы отмечаем всплеск трафика на сайте, анализируя данные, собранные Google Analytics. Это воспринимается как интерес к ресурсу. И, разумеется, такой рост посещаемости не может не радовать.

Но это не всегда повод для радости. Позже мы обнаруживаем, что большая часть этого реферального трафика была отправлена от спамеров. Именно спам стал большой проблемой в последнее время.

Реферальный спам происходит, когда ваш сайт получает поддельные направления трафика от спам-ботов. Эта подделка трафика и записывается Google Analytics. Если вы замечаете в Аналитике трафик, полученный из спам источников, вам необходимо выполнить определенные действия, чтобы устранить эти данные из статистики.

Что такое бот?

Ботами принято называть программы, задача которых – выполнение повторяющихся задач с максимальной скоростью и степенью точности.

Традиционный вариант использования ботов - веб-индексация содержимого интернет-ресурсов, регулярно осуществляемая поисковиками. Но боты также могут использоваться и в злонамеренных целях. Например, для:

  • совершения мошенничества путем кликов;
  • аккумуляции адресов e-mail;
  • передачи содержания веб-сайтов;
  • распространения вредоносного программного обеспечения;
  • искусственного завышения трафика ресурса.
Анализируя задачи, для которых используются боты, можно разделить их на безопасные и опасные.

Опасные и безопасные боты

Пример хорошего бота - «Googlebot», используемый Google для сканирования и индексации веб-страниц в интернете.

Большинство ботов (будь то безопасные или опасные), не выполняют сценарии JavaScript, но некоторые это делают.

Поисковые боты, которые выполняют сценарии Javascript (как код аналитики Google) проявляются в отчетах Google Analytics и искажают показатели трафика (прямой трафик, реферальный трафик) и прочих метрических данных на основе сессий (показатель отказов, коэффициент конверсии и др).

Поисковые боты, которые не выполняют JavaScript (например, Googlebot), не искажают вышеуказанные данные. Но их посещения все равно записываются в логи сервера. Они также потребляют ресурсы сервера, ухудшают пропускную способность и способны негативно повлиять на скорость загрузки сайта.

Безопасные боты, в отличие от опасных, подчиняются директиве robots.txt. Они способны создавать поддельные учетные записи пользователей, рассылать спам, собирать адреса электронной почты и могут обходить CAPTCHA.

Опасные боты используют различные методы, усложняющие их обнаружение. Они могут влиять на веб-браузер (например, Chrome, Internet Explorer и т.д.), а также на трафик, поступающий от нормального сайта.

Невозможно сказать наверняка, какие опасные боты могут исказить данные аналитики Гугл, а какие - нет. Поэтому стоит рассматривать все опасные боты как угрозу целостности данных.

Спам-боты

Как понятно из названия, главная задача этих ботов – спам. Они посещают огромное количество веб-ресурсов ежедневно, отправляя HTTP запросы на сайты с поддельными заголовками реферера. Это позволяет им избежать обнаружения в качестве ботов.

Подделанный заголовок реферера содержит адрес веб-сайта, который спамер хочет продвигать, либо получать обратные ссылки.

Когда ваш сайт получает запрос HTTP от спам-бота с поддельным заголовком реферера, он сразу же записывается в журнале сервера. Если ваш журнал сервера имеет открытый доступ, то он может быть просканирован и проиндексирован Google. Система обрабатывает значение реферера в журнале сервера как обратную ссылку, которая в итоге влияет на ранжирование веб-сайта, продвигаемого спамером.

В последнее время алгоритмы индексации Google построены таким образом, чтобы не учитывать данные из логов. Это нивелирует старания создателей подобных ботов.

Спам-боты, имеющие возможность выполнять сценарии JavaScript, способны обходить методы фильтрации, используемые Google Analytics. Благодаря этой способности этот трафик отражается в аналитических отчетах Google.

Ботнет

Когда спам-бот использует ботнет (сеть зараженных компьютеров, расположенных локально или по всему миру), он может получить доступ к веб-сайту с помощью сотен различных IP-адресов. В этом случае черный список IP адресов или rate limiting (rate of traffic sent or received) становятся в значительной степени бесполезными.

Способность спам-бота искажать трафик на ваш сайт прямо пропорциональна размеру ботнета, который использует спам-бот.

При большом размере ботнета с отличающимися друг от друга IP-адресами, спам-бот может получать доступ к вашему веб-сайту без блокирования брандмауэром или другим традиционным механизмом безопасности.

Не все спам-боты отправляют заголовки реферера.

В этом случае трафик от таких ботов не появится как источник реферального трафика в отчетах Google Analytics. Он выглядит как прямой трафик, что делает его еще более трудным для обнаружения. Иными словами, всякий раз, когда реферер не передается, этот трафик обрабатывается в Google Analytics как прямой.

Spambot может создать десятки поддельных заголовков рефереров.

Если вы заблокировали один источник реферера, спам-боты отправят на сайт очередную подделку. Поэтому фильтры на спам в Google Analytics или.htaccess, не дают гарантии, что ваш сайт полностью заблокирован от спам-ботов.

Теперь вы знаете, что не все спам-боты являются опасными. Но некоторые из них действительно опасны.

Очень опасные спам-боты

Цель действительно опасных спам-ботов - не только исказить трафик вашего веб-ресурса, очистить содержимое или получить адреса e-mail. Их цель - заразить чужой компьютер вредоносным ПО, сделать вашу машину частью бот-сети.

Как только ваш компьютер интегрируется в сеть ботнета, он начинает использоваться для пересылки спама, вирусов и других вредоносных программ на другие компьютеры в сети Интернет.

Есть сотни и тысячи компьютеров по всему миру, которые используются реальными людьми, одновременно являясь частью ботнета.

Существует высокая вероятность, что ваш компьютер является частью ботнета, но вы не знаете об этом.

Если вы решили заблокировать ботнет, вы, скорее всего, блокируете трафик, поступающий от реальных пользователей.

Существует вероятность, что как только вы заходите на подозрительный сайт из вашего отчета реферального трафика, ваша машина заражается вредоносным ПО.

Поэтому не посещайте подозрительные сайты из отчетов аналитики, не установов надлежащей защиты (антивирусных программ, установленных на вашем компьютере). Предпочтительно использование отдельной машины специально для посещения таких сайтов. Как вариант, можно обратиться к системному администратору, чтобы справиться с этой проблемой.

Умные спам-боты

Некоторые спам-боты (как darodar.com) могут посылать искусственный трафик даже без посещения вашего сайта. Они делают это путем воспроизведения HTTP запросов, которые исходит от кода отслеживания Google Analytics, используя при этом ваш идентификатор веб-ресурса. Они не только могут отправить вам поддельный трафик, но также и поддельных рефереров. Например, bbc.co.uk. Так как BBC является законным сайтом, то когда вы видите этот реферер в своем отчете, вы даже не думаете, что трафик, поступающий с уважаемого сайта, может быть фальшивкой. На самом же деле никто с BBC не посещал ваш сайт.

Этим умным и опасным ботам не нужно посещать ваш веб-сайт или выполнять сценарии JavaScript. Поскольку они фактически не посещают ваш сайт, эти посещения не записываются в журнал сервера.

И, раз их посещения не записываются в журнал сервера, вы не можете заблокировать их с помощью любых средств (блокирование IP, пользователя, реферального трафика и т.д.).

Умные спам-боты сканируют ваш сайт в поисках идентификаторов веб-собственности. Люди, которые не используют Google Tag Manager, оставляют код отслеживания Google Analytics на своих веб-страницах.

Код отслеживания Google Analytics содержит ваш идентификатор веб-ресурса. Идентификатор крадется умным спам-ботом и может передаваться в использование другим ботам. Никто не станет гарантировать, что бот, укравший ваш идентификатор веб-ресурса и бот, посылающий вам искусственный трафик, - одно и то же «лицо».

Вы можете решить эту проблему, воспользовавшись Google Tag Manager (GTM).

Используйте GTM для отслеживания Google Analytics на вашем сайте. Если ID вашего веб-ресурса уже был заимствован, то решать эту проблему, скорее всего, уже слишком поздно. Все, что вы можете сделать сейчас, - использовать другой ID или ждать решения проблемы со стороны Google.

Не любой сайт попадает под атаку спам-ботов.

Изначально задача спам-ботов - обнаружение и использование уязвимых сторон веб-ресурса. Они атакуют слабо защищенные сайты. Соответственно, если вы разместили страничку на «бюджетном» хостинге или с помощью пользовательского CMS, у него велики шансы подвергнуться нападению.

Иногда сайту, который часто попадает под атаку опасных ботов, достаточно сменить свой веб-хостинг. Этот простой способ действительно может помочь.

Следуйте инструкциям ниже, чтобы обнаружить источники спама

1) Перейдите к отчету реферального трафика в вашем аккаунте Google Analytics и отсортируйте отчет по проценту отказов в порядке убывания:

2) Посмотрите на рефереров с 100% или 0% показателем отказов, а также на тех, у кого 10 или более сессий. Скорее всего, это спамеры.

3) Если один из ваших подозрительных рефереров принадлежат к списку нижеперечисленных сайтов, то это реферальный спам. Вам можно не проверять это самостоятельно:

buttons-for-website.com


7makemoneyonline.com


ilovevitaly.ru


resellerclub.com


vodkoved.ru


cenokos.ru


76brighton.co.uk


sharebutton.net


simple-share-buttons.com
forum20.smailik.org
social-buttons.com
forum.topic39398713.darodar.com

Исчерпывающий перечень источников спама можно скачать .

4) Когда не удалось подтвердить личность вашего подозрительного реферера, возьмите на себя риск и посетите сомнительный веб-сайт. Возможно, это действительно нормальный ресурс. Удостоверьтесь, что у вас есть антивирусное программное обеспечение, прежде чем посещать подобные сомнительные ресурсы. Они способны заразить ваш компьютер в момент перехода на их страницу.

5) После подтверждения идентичности опасных ботов следующий шаг заключается в блокировании их от посещения вашего сайта еще раз.

Как же можно ограничить свой сайт от спам-ботов?

Создайте аннотацию на вашем графике и напишите записку с объяснением, что вызвало необычный всплеск трафика . Можно будет сбрасывать этот трафик со счетов во время анализа.

Блокируйте реферальный спам, используя возможности Spambot . К файлу.htaccess (или веб-конфигурации, если используется IIS) добавьте указанный ниже код:

RewriteEngine On Options +FollowSymlinks RewriteCond %{HTTP_REFERER} ^https?://([^.]+\.)*buttons-for-website\.com\ RewriteRule .* – [F]

Этот код будет блокировать все HTTP и HTTPS направления от buttons-for-website.com, включая поддомены buttons-for-website.com.

Заблокируйте IP-адресиспользуемый спам-ботом . Возьмите.htaccess файл и дополните кодом, показанным ниже:

RewriteEngine On
Options +FollowSymlinks
Order Deny,Allow
Deny from 234.45.12.33

Примечание : Нет необходимости в копировании кода в ваш.htaccess - схема не сработает. Здесь продемонстрирован лишь пример, обеспечивающий блокировку IP-адреса в файле.htaccess.

Спам-боты способны использовать различные IP-адреса. Систематически пополняйте список IP-адресов спам-ботов, имеющихся на вашем сайте.

Подвергайте блокировке лишь IP-адреса, оказывающие влияние на сайт.

Бессмысленно стремиться заблокировать каждый из известных IP-адресов. Файл.htaccess превратится в очень громоздкий. Им станет трудно управлять, снизится производительность веб-сервера.

Заметили, что количество сток черного списка IР-адресов стремительно увеличивается? Налицо явный признак возникших проблем с безопасностью. Обратитесь к представителю веб-хостинга или системному администратору. Используйте Google, чтобы найти черный список для блокирования IP-адресов. Автоматизируйте эту работу, составив сценарий, способный самостоятельно находить и запрещать IP-адреса, чья вредоносность не подвергается сомнению.

Воспользуйтесь возможностью блокировки диапазонов IP-адресов, используемых ботами-спамерами . Когда есть уверенность, что конкретный диапазон IP-адресов используется спам-ботом, можно одним движением заблокировать сразу ряд IP-адресов, как показано ниже:

RewriteEngine On

Options + FollowSymlinks


Deny from 76.149.24.0/24


Allow from all

Здесь 76.149.24.0/24 - диапазон CIDR (CIDR - метод, используемый для представления диапазонов адресов).

Использование блокировки по CIDR результативнее блокирования конкретных IP-адресов, поскольку позволяет занимать минимум пространства на сервере.

Примечание: Вы можете скрыть в CIDR ряд IP адресов и наоборот открыть их с помощью этого инструмента: www.ipaddressguide.com/cidr

Блокируйте запрещенных пользователей, использующих спам-ботов . Анализируйте лог-файлы сервера еженедельно, обнаруживайте и блокируйте вредоносные агенты пользователей, использующих спам-ботов. После блокировки они не смогут получить доступ к веб-ресурсу. Возможность сделать это показана ниже:

RewriteEngine On


Options +FollowSymlinks


RewriteCond %{HTTP_USER_AGENT} Baiduspider


RewriteRule .* –

Воспользовавшись поисковой строкой Гугл, можно получить внушительный список ресурсов, которые поддерживают записи известных запрещенных агентов пользователей. Воспользуйтесь полученными сведениями для выявления таких агентов пользователей на вашем сайте.

Самый простой способ - написание сценария, позволяющего автоматизировать весь процесс. Составьте базу данных со всеми известными запрещенными агентами пользователей. Используйте скрипт, который будет автоматически идентифицировать и блокировать их, опираясь на данные из базы. Регулярно пополняйте базу данных новыми запрещенными пользовательскими агентами – появляются таковые с завидным постоянством.

Блокируйте только пользовательские агенты, реально влияющие на ресурс. Бессмысленно стремиться к блокировке каждого известного IP-адреса - это сделает файл.htaccess чересчур большим, им станет трудно управлять. Снизится и производительность сервера.

Пользуйтесь доступной в Google Analytics фильтрацей «Bot Filtering» - «Исключить хиты от известных ботов и пауков».

Проводите мониторинг логов сервера хотя бы еженедельно . Положить начало борьбе с опасными ботами реально на уровне сервера. Пока не удалось «отвадить» спам-ботов от посещения вашего ресурса, не исключайте их из аналитической отчетности Гугла.

Используйте брандмауэр . Firewall станет надежным фильтром между вашим компьютером (сервером) и виртуальным пространством. Он способен защитить веб-ресурс и от опасных ботов.

Получайте квалифицированную помощь от системного администратора . Круглосуточная защита клиентских веб-ресурсов от вредоносных объектов – его основная работа. У того, кто ответственен за безопасность сети, намного больше инструментов для отражения атак ботов, чем у владельца сайта. Если вами обнаружен новый бот, угрожающий сайту, незамедлительно проинформируйте о находке сисадмина.

Пользуйтесь Google Chrome для веб-серфинга . В случае, если брандмауэр не используется, для просмотра интернет-страниц лучше всего использовать Google Chrome.

Chrome также способен обнаружить вредоносное программное обеспечение. При этом он открывает веб-страницы оперативнее, нежели другие браузеры, не забывая сканировать их на наличие вредоносных программ.

Если вы используете Chrome, риск «подцепить» вредоносное ПО у вашего компьютера снижается. Даже когда заходите на подозрительный ресурс из отчетов реферального трафика Google Analytics.

Используйте пользовательские предупреждения при мониторинге неожиданных скачков посещаемости. Персонализированное оповещение в аналитике Google даст возможность оперативно обнаружить и нейтрализовать вредные запросы ботов, минимизируя их вредоносное воздействие на сайт.

Используйте фильтры, доступные в Google Analytics . Для этого на вкладке «Администратор» в столбце «Представления» нужно выбрать «Фильтры» и создать новый.

Справиться с настройкой фильтров довольно просто. Главное – знать, как это делается.

Можно использовать флажок «Bot Filtering», расположенный в разделе «View Settings» вкладки «Administrator». Это не повредит.

Несмотря на простоту использования фильтров в Google Analytics, мы все же не советуем использовать их на практике.

Для этого есть три веских причины:

  • Есть сотни и тысячи плохих ботов, огромное количество новых появляется ежедневно. Какое количество фильтров придется создавать и применять к вашим отчетам?
  • Чем большее число фильтров будет применяться, тем сложнее будет анализировать отчеты, полученные от аналитической службы Google.
  • Блокировка трафика спама в Google Analytics – это сокрытие, но не решение проблемы. Вы потеряете возможность оценивать степень искаженности трафика спам-ботами.

Аналогично, не блокируйте реферальный трафик с помощью «Referral exclusion list »- это не решит вашу проблему. Наоборот, этот трафик в последствии будет оцениваться как прямой, что приведет к потере возможности следить за воздействием спама на трафик вашего веб-ресурса.

После того, как спам-бот попал в статистику аналитического сервиса Google, данные о трафике будут искажены навсегда. Вы уже не сможете исправить его.

Заключение

Мы надеемся, что перечисленные выше рекомендации помогут вам избавиться от всех источников спама на Ваш сайт. Это можно сделать разными способами, мы же описали те, которые помогли многим ресурсам защитить свои данные в Google Analytics.

Теги: Добавить метки

В последнее время подобная картина знакома многим (особенно мелким компаниям, у которых в Google Analytics не так уж и много источников трафика):

Предприимчивые дельцы генерируют фейковые переходы на сайт и оставляют свой рефферер перехода или источник кампании, в надежде на то, что владелец аккаунта GA обратит на ссылку внимание и решит по ней перейти.

Перейдя по такой ссылке, человека будет ждать какой ни будь сайт, участвующий в одной из CPA сетей (например aliexpress). Разумеется, человек такой сайт закроет, однако, кука посещения у него останется. Весь расчет идет на то, чтобы "заразить" такими куками как можно больше людей и чтобы какая-то часть из посетителей совершила (сразу или в течение 30 дней) целевое действие на этом сайте.

Поскольку, покупать ничего на aliexpress мы не хотим, нужно как-то избавляться от этих ссылок, захламляющих наши отчеты в GA. Ниже несколько способов избавления от спама Google Analytics.

Исключаем источники

С помощью фильтра (не изменяет исторические данные)

Для того, чтобы исключить все ненужные нам источники - создадим новое представление (view), к которому мы применим наш фильтр (показанный на скриншоте):

Последний шаблон фильтра (собраны самые достающие источники) -

Darodar\.|semalt\.|buttons-for-website|blackhatworth|ilovevitaly|prodvigator|cenokos\.|free-share-buttons\.|buy-cheap-online\.|googlsucks\.|theguardlan\.|youporn-forum\.|get-free-traffic-now\.|ranksonic\.|adcash\.|simple-share-buttons\.|social-buttons\.|hulfingtonpost\.|best-seo-solution\.|buttons-for-your-website\. Не забывайте проверять свой фильтр, чтобы не исключить ничего лишнего.

upd: в шаблон фильтра влезает только 255 символов (поэтому проверка может выдавать ошибку), рекомендую разбить строчку на 2 фильтра или же пользоваться расширенным сегментом.

С помощью сегмента (изменяет исторические данные)

Создаем расширенный сегмент с такими настройками:

Исключаем в источнике/канале точно такие же источники - darodar\.|semalt\.|buttons-for-website|blackhatworth|ilovevitaly|prodvigator|cenokos\.|free-share-buttons\.|buy-cheap-online\.|googlsucks\.|theguardlan\.|youporn-forum\.|get-free-traffic-now\.|ranksonic\.|adcash\.|simple-share-buttons\.|social-buttons\.|hulfingtonpost\.|best-seo-solution\.|buttons-for-your-website\.

После применения такого сегмента можно наблюдать существенную разницу в отчетах:

Результат налицо. Надеюсь, эта статья будет полезна небольшим компаниям (стартапам), которые каждый день сталкиваются с этой проблемой.

Если вы знаете еще какие нибудь более удобные и автоматические способы - просьба делиться в комментариях.

Привет, вебмастера, блогеры, оптимизаторы и случайные гости!

Сегодня прекрасный весенний день! Самое время написать еще одну полезную .

Уверен, что этот пост будет интересен многим. Меня, например, заинтересовал подобный факт, и я решил разобраться в этом вопросе основательно.

Из названия статьи вы уже поняли, что речь пойдет о реферальном спаме и его влиянии на ваш веб-ресурс.

Что такое реферальный спам

Итак, что же такое реферальный спам? Реферальный спам это такой же , но его главное отличие от простого спама заключается в том, вам не впаривают определенный продукт или услугу, а просто оставляют замаскированную реферальную ссылку.

Если вы обладаете неким любопытством, то наверняка перейдете по этой ссылке. В основном подобные ссылки ведут на веб-ресурсы с другим адресом с помощью настроенного . На конечном сайте как раз и представлена информация об определенном продукте или услуге в качестве рекламы.

Кстати, куки файлы сохраняются в браузере довольно таки продолжительное время (до 1 года), поэтому даже если вы что-нибудь купите на этом сайте спустя некоторое время, то все равно на вас заработают.

Ну, а теперь хочу вам поведать основной принцип действия рефспамеров. Возможно, вам будет также интересно это узнать, как и мне в свое время.

Первым делом зайдите в статистику посещений своего блога: или Яндекс.Метрика. Обратите внимание на переходы с других сайтов на ваш блог, при которых отображаются 100% отказы и время посещения 0:00. Это и есть сайты-прокладки рефспамеров.

Посмотрите на бывшую статистику с моего блога:

Как действуют рефспамеры

Ну, а теперь делюсь с вами принципом действия рефспамера.

  1. Извлекает ID счетчика посещаемости из кода вашего блога или любым другим способом.
  1. Эмулирует заходы на ваш блог и накручивает статистику посещений. При этом никакого реального взаимодействия с вашим блогом не осуществляется.
  1. Ожидает действий от вебмастера. По замыслу рефспамера автор блога при виде большого количества переходов на свой блог со странными показателями (100% отказов) должен перейти по реферальной ссылке.
  1. Автор переходит по ссылке и тем самым ему без его согласия подсовывают необходимые файлы — куки, которые сохраняются в его браузере и на автомате превращают его в реферала. Ну, и при клике по ссылке автор перенаправляется с помощью редиректа на нужный сайт с рекламной информацией.

Как я уже упоминал ранее, подобная стратегия рассчитана на длительное время, потому как файлы куки долгое время могут храниться в браузере. Поэтому даже спустя определенное время при покупке автором продуктов или услуг, рефспамер может получить свои комиссионные. Однако это может быть и не покупка, а простое действие.

В настоящее время в рунете начали активно развиваться СРА партнерки. О них я скоро напишу статью, поэтому не забудьте подписаться на обновления моего блога.

Да и еще один момент. Как вы знаете на сегодняшний день в Интернете насчитывается очень большое количество различных сайтов и блогов. Умельцев, которые занимаются рефспамом гораздо меньше. Поэтому такая модель заработка может приносить солидную прибыль при правильном подходе.

Лично я не сторонник такого вида обогащения с помощью подобных махинаций. Мне кажется, в основном подобными аферами занимаются люди, которые больше ничего не умеют делать или не хотят развиваться.

Вред от реферального спама

Такой вот вопрос. Вреден ли реферальный спам? Ну, то что он не полезен это сто процентов. Однако в сети я не нашел подтверждения тому, что рефспам наносит вред сайтам и . Поэтому считаю этот вопрос открытым.

В теории поисковые системы в курсе этой проблемы, поэтому подобные «заходы на блог» не должны засчитываться и оказывать свое влияние на ранжирование блога в результатах поиска. Но каким образом это осуществляется в реале до сих пор никто не может точно сказать.

Как избавиться от реферального спама

Ну что тут посоветовать. Реферальный спам это просто один из видов обычного спама. А как вы боретесь с обычным спамом? Правильно. Лучшим способ борьбы это игнорирование. Достаточно будет просто не нажимать на предоставленные ссылки сайтов, которые прописываются у вас в счетчике посещаемости. Вот взгляните на мой пример:

Раньше очень часто прописывался вот этот домен со 100% отказами, пока я с ним не разобрался, но об этом позже.

Итак. Знаете, что предлагают поисковые системы для решения проблемы с реферальным спамом? Да просто добавить эти домены или их IP адреса в фильтры статистики счетчиков. Прикольно. Этот подход мне напомнил игру моего сына Данилка, когда он прячется от кого-то, закрывая при этом свои глаза ладошками, и свято верит в то, что его никто не заметит. Смешно, не правда ли? Вот и здесь так же.

Все что необходимо, так это добавить этот код в самый низ файла.htaccess и сохранить данный файл. Вот и все. Ну а теперь делюсь с вами кодом, который мне реально помог:

Options All SetEnvIfNoCase Referer "^http://(+.)?сайт рефспамера.*$" bad_site Order Allow,Deny Allow from all Deny from env=bad_site

После того, как я его установил, домены рефспамеров исчезли из статистики Google Analytics. Это рабочий способ, которым пользуюсь я лично и вам его советую на всякий пожарный. Вот так я прописал спам-домены у себя в файле.htaccess:

Ну, вот и все. Моя статья подходит к своему логическому завершению. Вам пригодилась информация, предоставленная в ней? Жду ваших ответов в комментах.

P.S. Если Вы интересуетесь антиквариатом — продажей старых вещей, то вот здесь вы найдёте

Наблюдаете большие объемы реферального спама в отчетах Google Analytics ? Реферальный спам – это способ передачи сайтам поддельной информации о реферале. Позже эти спам-ссылки, реализованные с помощью HTTP referer , отображаются в аналитике, и могут вынудить перейти на вредоносный сайт. Сегодня я хотел бы рассказать, как можно блокировать реферальный спам из WordPress в аккаунте Google Analytics .

Приступаем к работе с Google Analytics

Все мы хотим, чтобы о наших сайтах узнало как можно больше людей. Каждый вебмастер радуется, если какой-то другой сайт ссылается на его материалы. Реферальные спамеры извлекают из этого выгоду, и посылают вебмастерам поддельные реферальные ссылки, ведущие на автоматизированные скрипты и вредоносные ресурсы.

Позже эти ссылки отображаются в отчетах Google Analytics или других аналитических сервисах. Я думаю, каждый из нас хотя бы раз переходил по входящим ссылкам, чтобы проверить, с каких ресурсов на нас ссылаются. Но имейте в виду, что поддельные ссылки могут принести беду:

Почему реферальный спам – это опасно

Кто-то утверждает, что реферальный спам, реализованный с помощью подмены HTTP referer , абсолютно безопасен, если не переходить по этим ссылкам. Предположим, что вы не кликаете по таким ссылкам, но при этом есть и другие угрозы.

Если вы владеете небольшим или средним сайтом, то реферальный спам может угробить вашу отчетность в аналитических сервисах. Если вы решите вдруг продать свой сайт, и представите на бирже подобный отчет, то спам-ссылки, как минимум, испортят первое впечатление о вашем ресурсе.

Как бороться с реферальным спамом?

Прежде всего, необходимо воспользоваться специальными инструментами, которые позволяют следить за состоянием и безопасностью сайта. Одним из таких инструментов является Sucuri . Он не только защищает ресурса от вредоносного программного обеспечения и троянов, но и эффективно блокирует реферальный спам. Sucuri Website Firewall по умолчанию блокирует практически все известные источники спама. Разработчики этого проекта постоянно пополняет списки спамеров и ресурсов, и старается следить за их деятельностью.

Блокируем реферальный спам в WordPress с помощью плагина

Существует несколько WordPress-плагинов , которые помогают сократить объем реферального спама rewritecond HTTP referer до минимума. В таких плагинах зачастую используются веб-сервисы, которые активно мониторят списки источников реферального спама, и используют их для блокировки.

Первое, что следует сделать, это установить и активировать плагин SpamReferrerBlock . После активации перейдите в настройки и произведите настройку плагина:


На странице настройки плагина располагается текстовое поле для создания собственного черного списка заблокированных источников. Под этим полем вы увидите список сайтов, которые данный плагин активно мониторит и блокирует. Списки можно обновлять вручную:


Также можно делиться собственными черными списками с сообществом, пользуясь функцией загрузки, расположенной в самом низу.

Блокируем рефералов-призраков при помощи фильтров Google Analytics

Даже после описанных выше шагов вы все равно будете встречать реферальный спам в отчетах Google Analytics . Чаще всего они с помощью подмены HTTP referer отсылают свои запросы напрямую в Google Analytics при помощи трекинг-кода UA .

Трекинг-код используется в сервисе для идентификации сайта. Большинство владельцев ресурсов добавляют этот код в подвал или шапку сайтов на WordPress . Стоит отметить, что трекинг-код может увидеть любой, просмотрев исходный код страницы.

Блокировать такие сайты в Google Analytics можно следующим образом. Авторизуйтесь в аккаунт GA , а затем перейдите в меню Аудитории > Технологии > Сеть . После этого нужно будет выбрать «Имя хоста » как первичное значение и расширить результаты до месячного периода:


Перед вами откроется список, в котором будет представлено множество спамерских хостов. Вам нужно будет оставить лишь валидные хосты для вашего сайта.

Теперь пришло время создать фильтр, который будет включать в себя исключительно валидные хосты.

Перейдите в раздел «Администратор », а затем кликните по разделу «Фильтры »:


Здесь нужно будет нажать кнопку «Добавить фильтр ». В качестве типа фильтра выберите «Пользовательский », а затем поставьте отметку на пункте «Включить »:


Здесь можно будет указать валидные хосты в качестве паттерна фильтра при помощи Regex-строки . Формат очень прост: нужно использовать символ ^ перед каждым хостом, а также символ $ после него. Для разделения хостов используется символ | :

^wpbeginner.com$|^videos.wpbeginner.com$|^example.wpbeginner.com$

Для применения фильтра HTTP referer нажмите на кнопку подтверждения изменений. Придется подождать около 24 часов, прежде чем в отчетах Google Analytics произойдут какие-либо изменения.

Блокируем заядлых спамеров с помощью фильтров Google Analytics

semalt.com|buttons-for-website.com|blackhatworth.com|anticrawler.org

Не забывайте подтверждать все изменения, иначе фильтр не сработает.

Надеюсь, сегодняшняя статья поможет вам справиться с реферальным спамом в отчетах Google Analytics для WordPress — сайта.

Перевод статьи “How to Block WordPress Referrer Spam in Google Analytics ” был подготовлен дружной командой проекта