[OT] Robots o proxies transparentes que se comen las adsl que publican web dinámicamente
Hola
Lo primero, disculpad el crossposting, pero creo que puede interesar a
mucha gente de estas listas que pueden tener webs publicadas desde sus
lineas ADSL.
Desde hace varias semanas, durante 3 o 4 dias seguidos cada semana, veo
que de alguna forma se llena TODA la salida a internet de mi adsl, la
salida, no la entrada, es decir, o tengo un huevo de visitas en las webs
o no me lo explico.
Y acabo de encontrar uno que quizá sea el problema de las narices:
- 80.38.111.186 (186.Red-80-38-111.pooles.rima-tde.net) se conecta a
diversos dominios que alojo (entre ellos guadawireless.net), por el
puerto 80 y navega por TODOS los enlaces de la web. TODOS, o sea,
quiere cachear TODO lo que tengo, porque me temo que ese es uno de los
proxy-cache transparentes, o bien es un robot que de alguna forma se
quiere bajar TODA la web.
- guadawireless.net es un postnuke con el módulo PostCalendar, donde se
pueden apuntar eventos en diferentes fechas.
- Si te pones a navegar a mano verás que existen TODAS las fechas
posibles, es decir, que con el enlace de siguiente en un mes, pasas al
siguiente, y al siguiente, y al siguiente... o sea, que los enlaces
son infinitos, ya que la página se genera dinámicamente.
- he visto el terrible log de apache del dominio guadawireless.net, y me
encuentro peticiones de esta dirección por un tubo, entre ellas:
80.38.111.186 - - [09/Mar/2003:02:31:26 +0100] "HEAD
/index.php?module=PostCalendar&func=view&viewtype=week&Date=12/03/1998
HTTP/1.1" 200 0
80.38.111.186 - - [09/Mar/2003:02:28:26 +0100] "GET
/index.php?module=PostCalendar&func=view&viewtype=day&Date=12/08/2008
HTTP/1.1" 200 28556
o sea, fechas de 1998 y del 2008, vaya, que está siguiendo TODOS los
enlaces hacia atrás y hacia delante de dicha página. ¿Se cansará algún
dia? ¿me comerá toda la adsl eternamente? ¿se verá la web si le corto
el acceso a esa ip y alguien trata de conectar desde internet y se ve
afectado por el proxy transparente?
Supongo que con el ROBOTS META TAG se podrá hacer algo, lo miraré
ahora, pero os aviso por si a alguno le ocurre algo parecido.
Saludos.
--
.
¿Estoy borracho? ¿Estoy cansado? ¿Estoy dormido?
NO, estoy contra la guerra.
.
********************
* *
* NO A LA GUERRA *
* *
********************
.
Andres Seco Hernandez - http://andressh.alamin.org
AndresSH@alamin.org - AndresSH@debian.org
GnuPG public information: pub 1024D/3A48C934
E61C 08A9 EBC8 12E4 F363 E359 EDAC BE0B 3A48 C934
--------------------------------------------------
Alamin GSM SMS Gateway - http://www.alamin.org
Debian GNU/Linux - http://www.debian.org
GNU/Linux de Guadalajara - http://gulalcarria.org
Objetivo Subjetivo - http://objetivo.alamin.org
http://guadawireless.net - http://www.redlibre.net
http://guadalajara-zone.com
--------------------------------------------------
Por favor, NO utilice formatos de archivo propietarios para el
intercambio de documentos, como DOC y XLS, sino HTML, RTF, TXT,
CSV o cualquier otro que no obligue a utilizar un programa de un
fabricante concreto para tratar la información contenida en él.
Reply to: