Base de datos versus motores de búsqueda: un cuello de botella a la localidad espacial

En las últimas décadas las empresas se han centrado más en la generación y almacenamiento de la información que en explotar los datos existentes en la compañía.
Sin embargo, el crecimiento exponencial de los datos y la demanda cada vez mayor para acceder de forma eficiente a esta información contenida en los sistemas internos de la empresa, pone de manifesto la necesidad de contar con nuevas aplicaciones de búsquedas que permitan dar el salto, pasando de un sistema tradicional de información a una inteligencia de negocio que permite conectar todas las tecnologías existentes en una compañía.

Hasta ahora, la única solución propuesta por los proveedores de bases de datos para proporcionar un rendimiento aceptable para un gran volumen de información consiste en mejorar el rendimiento del hardware subyacente. En bases de datos de memoria, como Oracle o DB2 TimesTen SolidDB se requiere una gran cantidad de memoria física. Las aplicaciones en los Datawarehouse como TeraData o Netezza confían en coprocesadores de hardware especializados. Y, más recientemente, como algunos expertos señalan, hasta Oracle admite que la adquisición de Sun les permitirá construir “sistemas” de gran alcance mediante la combinación de hardware de gama alta de Sun con la plataforma de base de datos de Oracle.

En este contexto, creo que las aplicaciones basadas en la búsqueda (SBA), son una solución a este problema y, que podríamos llamar más “sostenible”. La clave para manejar eficientemente grandes cantidades de datos es asegurarse de que los datos de acceso tengan una fuerte “localidad espacial”. Es decir, el logro de localidad espacial significa que “si una localización de memoria es referenciada en un momento concreto, es probable que las localizaciones cercanas a ella sean también referenciadas pronto. Existe localidad espacial entre las posiciones de memoria que son referenciadas en momentos cercanos. En este caso es común estimar las posiciones cercanas para que estas tengan un acceso más rápido” (Def: wikipedia).

El principal problema de las bases de datos relacionales es que tienen una localidad espacial muy pobre, porque los objetos o la información que almacenan se distribuyen en un gran número de tablas diferentes. CRM de gama alta y soluciones de ERP suelen almacenar sus datos en no menos de las 65.000 tablas diferentes, cada tabla se almacena en una ubicación distinta en el disco. Imagínese cuántos lugares distintos del disco necesita el sistema para poder mostrar la información que un trabajador necesita, por ejemplo, sobre un cliente o un producto en la pantalla de un agente de centro de llamadas o para producir un informe de BI complejo.
Tener una pobre localidad espacial produce enormes necesidades en los accesos a la información almacenada en el disco, lo que se transforma en el principal cuello de botella para el funcionamiento de las bases de datos de hoy.

Page: 1 2

Firma invitada

Nombres destacados del sector TIC opinan sobre las principales tendencias de la industria.

Recent Posts

Las ofertas de trabajo que demandan habilidades en IA han crecido un 21 % anual desde 2019Las ofertas de trabajo que demandan habilidades en IA han crecido un 21 % anual desde 2019

Las ofertas de trabajo que demandan habilidades en IA han crecido un 21 % anual desde 2019

La falta de experiencia y de recursos internos obstaculiza el progreso de las empresas en…

5 horas ago
Dell Technologies apuesta por la IA y la ciberseguridad para liderar la transformación digital en IberiaDell Technologies apuesta por la IA y la ciberseguridad para liderar la transformación digital en Iberia

Dell Technologies apuesta por la IA y la ciberseguridad para liderar la transformación digital en Iberia

Isabel Reis, directora general de Dell Technologies en Iberia, destaca la apuesta de la compañía…

6 horas ago
Madrid se prepara para acoger la tercera edición de Metaworld CongressMadrid se prepara para acoger la tercera edición de Metaworld Congress

Madrid se prepara para acoger la tercera edición de Metaworld Congress

Como novedades, este congreso integra el evento tecnológico Open Expo Europe y celebrará la Virtual…

6 horas ago

El 68 % de los ciberataques comienza con un correo electrónico

Los PDF suponen más de una quinta parte de los archivos adjuntos maliciosos.

7 horas ago

Un 63 % de las empresas que sufren ataques no usa autenticación multifactor

En 2024 se multiplicó casi por tres el porcentaje de compañías atacadas que no habían…

8 horas ago

Los sistemas operativos lideran en exploits de vulnerabilidades

Las otras categorías de software más destacadas son los navegadores web y las aplicaciones de…

8 horas ago