A praga do Referrer Spam: uma solução temporária

Os marqueteiros virtuais canalhas estão atacando com força total nos últimos 2 meses. A praga atual é o referrer spam (combinado com comment spam em alguns casos) que aflige principalmente os administradores de sites pequenos que tem limitação mensal da quantidade de tráfego que podem usar.

Alguns sites, como o inteligente Charles? Que Charles?, estão paralisados por causa desses porcos. (Não deixe de ver o protesto do Charles que inclui uma explicação não técnica sobre a praga atual).

No final do ano passado, esses porcos consumiram toda a banda contratada do br101.org e ficamos off-line por 4 dias (não percebi pq fui para a praia, veja as fotos). Para vcs terem um idéia, esses marqueteiros desonestos no mês de janeiro, apesar de algumas medidas paliativas chegaram a representar 30% do tráfego deste site...

Fiquei tentando combater essa ralé do mundo virtual através do mod_rewrite do Apache, acrescentado o código abaixo no .htaccess como foi sugerido neste artigo do spywareinfo.com.

# Options +FollowSymlinks RewriteEngine On RewriteCond %{HTTP_REFERER} ^http://(www\.)?spammersite1.com.*$ [OR] RewriteCond %{HTTP_REFERER} ^http://(www\.)?spammersite2.com.*$ [NC,OR] RewriteCond %{HTTP_REFERER} ^http://(www\.)?spammersite3.com.*$ [NC,OR] RewriteCond %{HTTP_REFERER} ^http://(www\.)?spammersite4.com.*$ [NC,OR] RewriteCond %{HTTP_REFERER} ^http://(www\.)?spammersite5.com.*$ [NC,OR] RewriteCond %{HTTP_REFERER} ^http://(www\.)?spammersite6.com.*$ [NC,OR] RewriteCond %{HTTP_REFERER} ^http://(www\.)?spammersite7.com.*$ [NC] RewriteRule \.*$ http://www.some-other-website.com [R,L]

O problema dessa solução: é uma luta ingrata acrescentar todos os endereços usados pelos canalhas... e no fundo só dá para fechar a porta depois que os caras aparecem no log.

A melhor solução que achei foi neste artigo do yarinareth.net. Acrescentei o código abaixo e há dois dias não tenho o desprazer de ver endereços contendo poker, cialis, viagra e outros produtos comprados por noobs otários conectados à internet.

SetEnvIfNoCase Referer ".*(credit|canadianlabels|8gold|texas-hold|hold-em|holdem| fidelityfunding|condo|sportsparent|mortgage|spoodles|money| cash|hotel|houseofseven|stmaryonline|newtruths|popwow|oiline| flafeber|thatwhichis|tmsathai|pisoc|crepesuzette|mediavisor| commerce|easymoney|911|////.vi|gb////.com|4free|macsurfer| teen|pussy|discount|blogincome|lillystar|aizzo|webdevsquare| laser-eye|escal8|xopy|vixen1|linkerdome|youradulthosting| fick|inkjet-toner|fuck|ime.nu|perfume-cologne| italiancharmsbracelets|shoesdiscount|psnarones|hasfun|casino| gambling|poker|porn|sex|paris|gabriola|nude|xxx|hilton|pics| video|adminshop|devaddict|iaea|empathica|insuranceinfo|atelebanon| handy-sms|peng|just-deals|pisx|rimpim|didrex|reductil|party-poker| tramadol|soma|meridia|poker-hands|personal-loans|pay-day-loan|cialis| 888|carisoprodol|future-2000|ronnieazza).*" BadReferrer order deny,allow deny from env=BadReferrer

Atenção: Para funcionar, antes de vc colar o código acima no seu .htaccess vc precisa tirar os "enters" na lista de palavras. Todas precisam
ficar em uma linha só.

Tome cuidado com o .htaccess. Não deixe de fazer um backup do arquivo
antes, já que qq erro resulta em erro 500 e seu site fica fora do ar.

Esse método é um pouco mais fácil de administrar, pois bloqueia qualquer visitante suspeito que apresente algum dos termos listados no endereço. Acrescentei algumas palavras-chave ao código original e a lista deve crescer conforme novos prestadores de serviços desonestos forem criando novos endereços.

Não é perfeito, pois os marqueteiros podem começar a usar palavras menos supeitas para perpetuar as ações deles, mas por enquanto está funcionando.

Ainda bem q há gente do lado da civilização tentando encontrar uma solução mais legante e definitiva para a questão. Veja Proposal for a solution to referrer spam: Using MT-Blacklist and other blacklists to filter spamming URLs. No final do texto, há links para outras propostas e iniciativas.

Comente

Filtered HTML

  • Quebras de linhas e parágrafos são feitos automaticamente.
  • Tags HTML permitidas: <a> <b> <dd> <dl> <dt> <i> <li> <ol> <u> <ul> <br> <p>

Plain text

  • No HTML tags allowed.
  • Endereços de páginas de internet e emails viram links automaticamente.
  • Quebras de linhas e parágrafos são feitos automaticamente.

Atenção:

Não há censura de opinião nos comentários, mas o vc é o responsável pelo que escrever. Ou seja, aqui vale o Yoyow (You Own Your Own Words).

Lembre-se: Opinião é diferente de informação.

Informações sem fonte ou que não puderem ser checadas facilmente podem ser deletadas.

Serão apagadas sem dó mensagens publicitárias fora de contexto, spam usado para melhorar a posição de sites e outras iniciativas de marqueteiros pouco éticos.

Respeite as regras básicas Netiqueta.

Grosserias desacompanhadas de conteúdo, coisas off-topic e exagero nas gírias ou leet que dificultem o entendimento de não-iniciados tb não serão toleradas aqui.

Vou apagar sumariamente todos os comentários escritos inteiramente CAIXA ALTA, mensagens repetidas e textos que atrapalhem a diagramação do site.

Além de prejudicar, a leitura é falta de educação.

Não publique tb números de telefone, pois não tenho como checá-los. As mensagens com números de telefone serão apagadas inteiras.

Obviamente, qq conteúdo ilegal tb será deletado sem discussão.

Evite também mensagens do tipo "me too" (textos apenas concordando com o post anterior sem acrescentar algo à discussão).

Clique aqui para ver algumas dicas sobre como escrever um texto claro, objetivo e persuasivo.

Todas os comentários são considerados lançados sobre a licença da Creative Commons.

Se você não quer que seu texto esteja sob estes termos, então não os envie.



br101.org by br101.org is licensed under a Creative Commons Attribution-Share Alike 2.5 Brazil License.

Nenhum produto M$ foi usado na construção destas páginas.
Este site usa Drupal (Apache, PhP e MySql).

Se vc quiser tentar aprender a fazer um site igual a este usando softwares livres, vá até o weblivre.br101.org e leia:

Como fazer um website de verdade?