2012-07-27

Google Hack: Reportes de Calamaris

Hoy me prepuse a instalar un analizador de log para mi servidor Proxy Caché, de esa forma es posible seguir los archivos logs de una manera más visibles con reportes más legibles y con algunos datos estadísticos importantes.

Entre la diversidad de posibilidades para analizar los log de Squid3 encontré uno llamado calamaris, muy simple, en modo consola y con la posibilidad de generar reportes en HTML para visualizarlos en un navegador.

Así que sin perder mucho tiempo y luego de leer sus configuraciones, directamente a Google y buscar “Calamaris Debian Insall” y un listado de how-to listo para recorrer. En lo particular siempre me gusta comenzar con la documentación oficial y luego conocer las experiencias de otros sysadmin al momento de instalarlo, es por ello que me paso un buen tiempo leyendo algunos blogs.

Me gustó mucho un sitio en donde era posible automatizar la generación de reportes de forma diaria, semanal y mensual desde el cron y comencé a leer un poco más.

Este how-to recomendaba almacenar estos archivos en un directorio /var/www muy conocido en apache2 y además separados por los directorios daily, weekly y monthly correspondientemente.

Fue justo en ese momento que me pregunté, existirá algún servidor que esté mostrando esta información en forma pública? Quizas era posible, recuerden que lo están almacenando en directorios web.

Ustedes que creen? Pues sí encontré algunos, sino este post no se llamaría "Google Hack: Reportes de Calamaris"

inurl:/calamaris/daily
inurl:/calamaris/weekly
inurl:/calamaris/mounthly

Evidentemente hay varios servidores con esta información pública que de alguna forma podemos sacar algunas conjeturas de los mismos.

  • Es posible determinar los sitios más visitados, que nunca falte en el listado facebook, google y twitter.
  • Podemos decir que el mismo servidor que hace de proxy también es servidor web ¿¿Por qué??
  • Podemos conocer las ip privadas y los segmentos de red de la institución, obviamente deducir que las ips que más consumen ancho de banda son las de los jefes y la secretaria.
No creen que es demasiada información la que se puede deducir de una herramienta tan noble?

Saludos!

Entradas populares