Rallentare lo spam in D7 (I parte)

Pubblicato da Nicola Rainiero il 28-02-2013 (aggiornato il 28-03-2013)

Lo spam è un grave problema per i siti web 2.0, in particolar modo gli spambot sono dei programmi fastidiosi che invadono tutti i moduli web con un sacco di spazzatura pubblicitaria. Dopo vari tentativi, ho trovato un bel compromesso che mi aiuta a ridurre questo fenomeno e di conseguenza aumentare la larghezza di banda mensile fornita gratuitamente da altervista.org (10 GB/mese). Qui di seguito elenco i moduli per Drupal 7 che ho installato e alcune impostazioni. Al momento non ho completamente cancellato questi attacchi, ma sto studiando un nuovo approccio per bloccarli (in un prossimo articolo se sarò in grado di sistemare alcuni passaggi).

Nell'articolo Drupal Modules for Combatting Spam (Drupal 7), si può trovare una lista quasi completa dei moduli per combattere gli spambot.

Nel mio caso ho installato e abilitato questi:

In http://mio_sito/admin/config/people/captcha ho settato il default challenge type for CAPTCHAs come Image (from module image_captcha), perché è più efficace e ha piò opzioni. In http://mio_sito/admin/config/people/captcha/image_captcha ho messo code length 6, distortion level 5 – medium e noise level 3 – medium. Ho così ottenuto una immagine abbastanza difficile da essere bypassata dagli OCR e risolvibile facilmente dagli umani.

Tuttavia il CAPTCHA non ha risolto completamente il problema, così ho dovuto installare, registrare e attivare un altro tipo di metodo che rientra nella categoria dei Behavior-Based Methods. Ho provato per primo Bad Behavior ma non sono riuscito a farlo funzionare perché probabilmente non è compatibile con il mio database (sqlite). Poi http:BL che implementa l'omonimo filtro per bloccare il perfido traffico dello spam. Per usarlo mi sono dovuto munire di una chiave di accesso, collegandomi nella homepage del progetto, projecthoneypot.org.

Questo modulo ha ridotto di gran lunga gli spambot ma non del tutto. Ogni 4 visite, 3 sono bot (includendo quelli di google e altervista)! Ma ora quando guardo la pagina dei Top visitors qui http://mio_sito/admin/reports/visitors, è raro che debba bloccare qualche indirizzo IP, non però impossibile! Usando http:BL la mia larghezza di banda si è attestata al 15% (2 GB), prima poteva arrivare al 20-25%. Purtroppo però quando guardo la pagina Top visitors in the past 1 day mi trovo ancora questa rogna:

Top visitors in the past 1 day
Top visitors in the past 1 day

Basandomi su questi dati, posso concludere che la mia strategia ha in un modo o nell'altro rallentato lo spam (in genere solo un commento alla settimana riesce a superare i miei blocchi). Comunque sto cercando di creare un modulo custom per disabilitare i vari form per un determinato numero di minuti, dopo che uno specifico indirizzo IP ha tentato n-volte di inviarmi commenti o di accedere come utente fallendo i CAPTCHA. Non è facile ma ho trovato utili informazioni qui:

Se riuscirò a risolvere alcuni problemi e lavorerà bene, lo pubblicherò prossimamente.

27/03/2013: Al momento sto testando questa soluzione provvisoria che sembra essere molto promettente.




Potrebbero interessarti anche:

Nicola Rainiero

Ingegnere civile specializzato in geotecnica con l'ambizione di facilitare la propria attività lavorativa usando e creando software libero per un sapere condiviso e collettivo. Mi occupo anche di energie rinnovabili ed in particolare di geotermia a bassa entalpia. Sono da sempre appassionato di web design e modellazione 3D.

Commenti