2002, el año del spam
Si algo ha caracterizado el correo electrónico a lo largo de este año ha sido la explosión masiva del spam, o correo indeseado que llega a nuestro e-buzón.
Spam, un auténtico problema de seguridad
Neal Stephenson, autor de Criptonomicn, indica en su pgina web que, al igual que Donald Knuth y Umberto Eco, se siente feliz en poder decir que no dispone de una direccin de correo electrnico. El resto de los mortales, aquellos que s deseamos utilizar el correo electrnico, nos vemos inundados a diario por ingentes cantidades de basura en forma de bytes.
Me imagino que para la mayora de los lectores no causar ninguna sorpresa destacar el enorme porcentaje que representa el spam, el correo basura, en sus buzones de correo.
Las estadsticas sobre el spam producen autnticos escalofros. En julio del presente ao, MessageLabs afirmaba que el 36 por ciento del correo electrnico en circulacin era correo basura. Por su parte, Jpiter Research, calcula que el nmero de mensajes de spam que se envan actualmente se sita en 140.000 millones. Lo ms preocupante es que, para el 2007, se prev alcanzar una cifra de 650.000 millones de mensajes de correo basura.
Con estas cifras, es evidente que encontramos una solucin que aleje el spam de nuestros buzones o correremos el riesgo de convertir el correo electrnico en algo totalmente inutilizable.
Detección del spam
Hasta la fecha, el spam ha sido bsicamente un incordio. Pero durante este ao 2002 hemos visto algunas muestras de cmo el correo basura tambin se puede convertir en un problema de seguridad. Como ya hemos relatado no son pocos los casos en que mensajes de spam donde se utilizan tcnicas de ingeniera social, han conseguido que los usuarios faciliten informacin sensible.
Pero hay ms. Existen mensajes de spam autnticamente diablicos, especialmente para los usuarios de Microsoft Outlook (no por el hecho de que tenga ms problemas que otros programas, sino por el hecho de ser el programa ms utilizado). Mensajes con pginas HTML y scripts capaces de bajarse cdigo y dejarlo en la mquina del usuario.
Todo esto convertir el spam, en los prximos meses, como el principal problema de seguridad en Internet. Los virus que circulan en la actualidad bsicamente slo tienen el efecto de bloquear los servidores de correo ante el gran volumen de mensajes infectados que son capaces de generar. El spam tiene este mismo efecto, slo que el volumen actual del correo basura es muy superior al de mensajes infectados por virus.
Existen diversos mtodos para la deteccin de mensajes con correo basura. El que ha demostrado un mayor porcentaje de acierto, generando un reducido (o incluso nulo) nmero de falsos positivos, son los filtros basadas en lgica bayesiana a partir del trabajo de Paul Graham.
La lgica bayesiana que se aplica consiste en determinar palabras que aparecen con frecuencia en los mensajes de spam y, a partir de las mismas, determinar por el contexto otros trminos que se incluyen habitualmente en el correo basura as como aquellos contextos que aparece en los mensajes legtimos. El anlisis se realiza ntegramente sobre el contenido del mensaje, dejando de banda el remitente o las mquinas por las que ha pasado.
El resultado, segn Paul Graham, es una deteccin del 99,5 por ciento de los mensajes de correo basura, con un porcentaje de falsos positivos prcticamente nulo.
Existen diversos programas que ya disponen de filtros de lgica bayesiana para la deteccin del correo basura. A nivel de servidor podemos indicar SpamProbe y Bogofilter; a nivel cliente de correo, la ltima versin de Mozilla (1.3). Es de esperar que en los prximos meses otros programas, incluyendo los sistemas antivirus actuales, vayan incorporando estas tcnicas para reducir el volumen de spam en circulacin.