SpamFireWall — заборона доступу до сайту для спам ботів

Кожен власник веб-сайту або веб-майстер стикався з таким лихом, як спам в коментарях або формах контактів, а також реєстрація спам-ботів під виглядом користувачів. У результаті форма на сайті обробляє ці повідомлення, що витрачає ресурси сервера. Деякі спам боти завантажують сторінки сайту для обходу антиспам-захисту, з-за чого ресурсів витрачається ще більше. На невеликих обсягах це непомітно, але коли веб-сайт в добу отримує тисячі подібних запитів, це може істотно впливати на навантаження процесора сервера.

Зараз ми розповімо про нову опції в антиспам-плагінах для CleanTalk, яка дозволяє ефективно відбивати атаки спам-ботів на ваш сайт. Опція отримала назву SpamFireWall(SFW), вона блокує POST і GET-запити від найбільш активних спам-ботів і не дає їм завантажувати сервер.

Читати далі →

Невізуальні методи захисту сайту від спаму. Частина 3. Повтори

Продовження статті Невізуальні методи захисту сайту від спаму

Частина 3. Повтори підрядків
Як вже говорилося, невізуальні методи захисту сайту від спаму використовують аналіз тексту. Один з часто зустрічаються сигналів спаму — це наявність повторюваних рядків. Як завжди, наведені приклади взяті з реальних даних компанії CleanTalk.

Пошук таких повторів повинен бути мінімально ресурсномістким. Краще, якщо він буде викликатися після тестів з 1 і 2 частин статті, які відсіють явний спам і приведуть текст до вигляду, придатного для аналізу. Тут я наведу деяку статистику, а також приклад коду.

Читати далі →

Як підвищити впевненість в тому, що кнопка була натиснута живим користувачем на сайті і позбутися капчі?

Капча всім відома. Також всім відомо, що вона являє собою велику проблему і для програмістів і користувачів. Вона ні тим ні іншим не подобається! Її доводиться використовувати за необхідності!

У цій статті я хотів би спробувати дати аналіз проблеми і способів її рішення і привести приклад одного програміста методу, який я успішно використовую вже багато років у своїх проектах. Крім того, мені хотілося б зробити статтю цікавою для читання самого широкого кола фахівців.

Останній пропонований метод спірний, але судіть самі!

Читати далі →

Некапча Mail.Ru - капча, яка не показується

Привіт, Хабр! Сьогодні я хочу розповісти вам про наш відносно недавно створений сервіс капчі. Цей сервіс відрізняється від аналогічних тим, що нашу капчу ніколи найчастіше взагалі не потрібно розгадувати. Як відомо, капча негативно впливає на конверсію — не всі можуть швидко її розгадати, особливо якщо вона невиправдано складна, а частина користувачів йдуть з ресурсу. І я не знаю таких людей, які люблять ламати очі і отримують задоволення від процесу розгадування. Тому якщо позбавити користувача від необхідності вводити ще одне додаткове поле, то це зробить його трішечки лояльніше.


Навряд чи хтось зможе розгадати цю капчу :)

Якщо в двох словах, то Некапча — це сервіс інтелектуальної капчі, не вимагає від людини проходження перевірки. Природно, без додаткової інформації сервіс не може нічого сказати про користувача. Звідки ж її взяти? Справа в тому, що у Mail.Ru більше 100 млн користувачів, причому більша частина з них авторизована. А це означає, що із запитом на наші домени передаються сесійні куки, за яким ми визначаємо користувача, а потім дістаємо його профіль, статистику, спам-рейтинг і т. д. Вся ця інформація подається на вхід алгоритму-класифікатора, і на виході ми отримуємо припущення про те, ким є користувач — людиною або спам-ботом.

Читати далі →