[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: evitar que google muestre archivos pdf del server



El Sun, 14 Jun 2015 03:22:35 -0500, kazabe escribió:

> Holas
> 
> En un servidor donde tenemos una pequeña (y vieja) intranet se publican
> a los usuarios algunos documentos de procedimientos internos y otras
> cosas.  Ultimamente hemos notado que google muestra en los resultados de
> busqueda algunos de esos documentos.  No es informacion altamente
> confidencial, pero tampoco es necesario que google la muestre en sus
> busquedas.

Si Google muestra ese contenido es que la intranet es accesible desde 
Internet ¿no? :-?

> Lo ideal seria proteger el acceso con una validacion previa de los
> usuarios, pero esto seria modificar el sitio como tal, lo cual realmente
> no vale la pena, ya que seguira publicado hasta que su reemplazo este
> listo (estan en ese desarrollo, pero no se especificamente cuando sera
> tal cosa).  Busco entonces establecer controles desde el mismo servidor
> web, o desde el firewall.
> 
> Investigando he encontrado que con un robot.txt puede definirse que
> deseo y que no deseo que sea indexado por google.  Tambien he modificado
> el mime en apache para que no permita la lectura en linea del archivo
> sino que obligue su descarga, para luego proceder a renombrar el
> directorio que contiene los documentos, para evitar el acceso a los
> mismos por medio del cache de google.

Recuerda que el archivo robots.txt no siempre lo siguen el resto de 
buscadores. Los buenos (Google, Yahoo!, Bing...) sí, pero los malosos 
hacen caso omiso.
 
> Lo anterior solo aplica para controles directos desde apache.  No se si
> podria implementar algo complementario en el firewall o si usando un
> proxy inverso puedo agregar algun control para esa situacion

Si los documentos que quieres bloquear los proporciona el servidor web, 
lo lógico es que sea éste quien los proteja o bloquee el acceso. Un 
firewall (IPS) es demasiado rebuscado para ese trabajo, creo yo...
 
> Pueden ustedes algunos otros metodos adicionales para evitar por medio
> del servidor que esos archivos puedan ser encontrados sin que se conozca
> explicitamente su ruta?

Una forma sencilla es a través del archivo ".htaccess", donde podrás 
configurar qué documentos quieres poner accesibles o no (p. ej., 
redireccionándolo a otro recurso).

Saludos,

-- 
Camaleón


Reply to: