Semalt розкриває посібник з видалення підробленого трафіку зі свого сайту

Спам-направлення - це продукт спам-ботів, що надсилають фальшивий трафік безпосередньо в Google Analytics, таким чином відображаючись у створених звітах про трафік. Вживайте заходів для видалення спам-рефералів, якщо ви знайдете їх у звітах GA, щоб отримати точну статистику для сайту.

Артем Абгарян, старший менеджер з успішних клієнтів компанії Semalt Digital Services, ділиться тут деякими практичними питаннями з цього приводу.

Що таке бот?

Боти - це програми, розроблені для виконання завдань, які повторюються швидко та точно. Спочатку пошукові системи призначені для індексування сторінок в Інтернеті. Люди із шкідливим наміром впродовж багатьох років прийняли використання ботів, щоб допомогти їм створювати шахрайство за допомогою кліків, переносити вміст сайту, поширювати зловмисне програмне забезпечення, накопичуючи адреси електронної пошти та завищуючи трафік сайту.

Безпечні та злісні боти

Прикладом хорошого бота є Googlebot, який сканує та індексує сторінки для користувачів. Пошукові боти не запускають JavaScript (більшість з них). Тим не менш, ті, хто його використовує, виявляються у звітах GA, що може зашкодити представленню метрики. Якщо вони не запускають JavaScript, вони не впливають на звіти, але з’являються в журналах сервера, незважаючи на це. Однак вони можуть вплинути на швидкість завантаження, оскільки вони використовують серверні ресурси. Безпечні боти дотримуються директив, що містяться в robots.txt. Зловмисні боти, з іншого боку, реалізують різні стратегії, щоб перекрити ці вказівки.

Спам-боти

Їх основна мета - відвідати якомога більше веб-сайтів та надсилати спам із заголовками реферального обличчя, щоб уникнути виявлення. Заголовок підробленого реферала вбудовує посилання на переспрямування на сайт, який вони хочуть просувати. HTTP-запити від такого бота з’являються в журналах сервера та індексуються Google. Він виступає зворотним посиланням на сайт, коли він з’являється в журналі сервера. Google вніс зміни до своїх алгоритмів, щоб не індексувати дані з журналів серверів, тим самим стримуючи зусилля розробників спамботів. Спам-боти, запущені JavaScript, можуть пройти повний фільтр GA, саме тому вони відображають у звітах.

Botnet

Ботні мережі складаються з декількох заражених комп'ютерів для формування мережі, керованої спамером. Він використовує різні IP-адреси для атаки на один веб-сайт. Чим більший ботнет, тим вищий рівень успішності проникнення. Трафік з ботнету є прямим трафіком, оскільки він надходить з іншого комп'ютера, що ускладнює його виявлення. Блокування одного не мало би великого впливу, оскільки його місце займає інше.

Сильно шкідливі спам-боти

Їх головне призначення - набрати комп’ютер, щоб бути частиною ботнету, заразивши його шкідливим програмним забезпеченням. Потім комп'ютер використовується для розповсюдження тієї ж шкідливої програми на інші комп'ютери. Блокування ботнету може стримувати вхідний трафік від реальних відвідувачів. Підозрілі переадресації із звіту про трафік рефералів здебільшого призводять до цих веб-сайтів, що заражають зловмисне програмне забезпечення. Уникайте натискання таких посилань, якщо не встановлено ефективне програмне забезпечення проти зловмисного програмного забезпечення або окремий комп'ютер.

Розумні спам-боти

Ці веб-сайти надсилають трафік в Google Analytics, використовуючи його код відстеження разом з ідентифікатором сайту. Вони також включають деякі підроблені реферати у звіті про рух, які можуть не підозрюватися. Їх діяльність ніколи не відображається в журналах сервера, і немає можливості їх блокувати, оскільки вони надсилають дані безпосередньо в інструмент аналітики. Люди, які не використовують Менеджерів тегів Google, на своєму веб-сайті мають код відстеження GA, який виступає ідентифікатором веб-власності. Менеджер тегів Google - це ефективний інструмент для видалення спам-рефератів у цьому випадку. Спам-боти здебільшого атакують сайти, у яких є вразливості вихідного коду, або сайти з обмеженими заходами безпеки.

Виявлення джерел спаму

Перейдіть до звітів про трафік Google і використовуйте коефіцієнти відмов як елемент сортування у порядку зменшення. Ті, хто має 100% або 0% відмов, повинні підозрюватись у спамі. Крім того, існує вичерпний список вже встановлених спамерів, з якими можна порівняти, не роблячи аналізу вручну. Наступний крок - їх блокування.

Обов’язково створіть позначення на графіку звіту, пояснюючи, де в цей час трапився вибух трафіку.

1. Використовуйте механізм перезапису для файлу .htaccess і використовуйте можливості Spambot, щоб видалити спам-реферал, внісши в нього зміни. Якщо ви впевнені в IP-адресі, яку використовує спам, включіть її до коду та забороніть їй доступ. Ця можливість може бути використана для блокування діапазонів IP-адреси. Робіть це лише в тому випадку, якщо ви впевнені, що спамбот використовує кілька IP-адрес для виконання однієї дії. Також забороніть користувачам, яким відомо, що використовують спам-боти.

2. Функція фільтрування ботів: встановіть прапорець, щоб запропонувати виключити відомих ботів та павуків.

3. Моніторинг журналів серверів: відлякуйте ботів, регулярно відвідуючи сайт. Використовуйте брандмауер для захисту комп'ютера від віртуального простору, фільтруючи веб-джерела від спам-ботів.

4. Адміністратор системи повинен мати можливість запропонувати професійну допомогу.

5. Код ItSAlive допомагає утримати показники від Google та Яндекс від втручання спам-ботів.

6. Google Chrome здатний виявляти зловмисне програмне забезпечення та підходить для перегляду, якщо немає брандмауера.

7. Оповіщення користувачів - це персоналізовані сповіщення від Google, які сповіщають про несподіваний приріст трафіку.

8. Фільтри Google Analytics. Створіть нові фільтри у розділі перегляду на вкладці Адміністратор у GA.

mass gmail