Desde hace un tiempo estoy viendo en el log de apache unas entradas que no entiendo. Son de este tipo:
XXX.XXX.XXX.XXX – – [13/Mar/2010:14:22:21 +0100] «GET /http://www.gothic-jewellery.co.uk/articles/http://www.gothic-jewellery.co.uk/fring-v3-voip-in-your-mobil/http://www.gothic-jewellery.co.uk/ HTTP/1.1» 302 511 «-» «-»
XXX.XXX.XXX.XXX – – [13/Mar/2010:14:49:56 +0100] «GET /thewill2diet.infoarticles/thewill2diet.infofring-v3-voip-in-your-mobil/thewill2diet.info HTTP/1.1» 302 511 «-» «-»
XXX.XXX.XXX.XXX – – [13/Mar/2010:15:31:26 +0100] «GET /ebookfile.infoarticles/ebookfile.infofring-v3-voip-in-your-mobil/ebookfile.info HTTP/1.1» 302 511 «-» «-»
XXX.XXX.XXX.XXX – – [13/Mar/2010:16:27:00 +0100] «GET /wrestlemania26.infoarticles/wrestlemania26.infofring-v3-voip-in-your-mobil/wrestlemania26.info HTTP/1.1» 302 511 «-» «-»
Si limpiamos la basura, queda algo como:
XXX.XXX.XXX.XXX – – [13/Mar/2010:14:22:21 +0100] «GET /articles/fring-v3-voip-in-your-mobil/ HTTP/1.1» 302 511 «-» «-»
XXX.XXX.XXX.XXX – – [13/Mar/2010:14:49:56 +0100] «GET /articles/fring-v3-voip-in-your-mobil/ HTTP/1.1» 302 511 «-» «-»
XXX.XXX.XXX.XXX – – [13/Mar/2010:15:31:26 +0100] «GET /articles/fring-v3-voip-in-your-mobil/ HTTP/1.1» 302 511 «-» «-»
XXX.XXX.XXX.XXX – – [13/Mar/2010:16:27:00 +0100] «GET /articles/fring-v3-voip-in-your-mobil/ HTTP/1.1» 302 511 «-» «-»
Que sí son entradas legítimas del blog.Me imagino que será una especie de spam. No dejan user-agent ni referer. Las ips están incluidas en algunas listas de spam pero no en todas. Y parece que es lo que hace Moreoverbot o Radia6 Crawler. No sé cuál es el efecto de recibir este tipo de peticiones y no sé que criterio usar en google para encontrar más información. Podría ir bloqueando en el firewall cada ip pero como no son muchas por el momento seguiré investigando.