Base de datos versus motores de búsqueda: un cuello de botella a la localidad espacial

En las últimas décadas las empresas se han centrado más en la generación y almacenamiento de la información que en explotar los datos existentes en la compañía.
Sin embargo, el crecimiento exponencial de los datos y la demanda cada vez mayor para acceder de forma eficiente a esta información contenida en los sistemas internos de la empresa, pone de manifesto la necesidad de contar con nuevas aplicaciones de búsquedas que permitan dar el salto, pasando de un sistema tradicional de información a una inteligencia de negocio que permite conectar todas las tecnologías existentes en una compañía.

Hasta ahora, la única solución propuesta por los proveedores de bases de datos para proporcionar un rendimiento aceptable para un gran volumen de información consiste en mejorar el rendimiento del hardware subyacente. En bases de datos de memoria, como Oracle o DB2 TimesTen SolidDB se requiere una gran cantidad de memoria física. Las aplicaciones en los Datawarehouse como TeraData o Netezza confían en coprocesadores de hardware especializados. Y, más recientemente, como algunos expertos señalan, hasta Oracle admite que la adquisición de Sun les permitirá construir “sistemas” de gran alcance mediante la combinación de hardware de gama alta de Sun con la plataforma de base de datos de Oracle.

En este contexto, creo que las aplicaciones basadas en la búsqueda (SBA), son una solución a este problema y, que podríamos llamar más “sostenible”. La clave para manejar eficientemente grandes cantidades de datos es asegurarse de que los datos de acceso tengan una fuerte “localidad espacial”. Es decir, el logro de localidad espacial significa que “si una localización de memoria es referenciada en un momento concreto, es probable que las localizaciones cercanas a ella sean también referenciadas pronto. Existe localidad espacial entre las posiciones de memoria que son referenciadas en momentos cercanos. En este caso es común estimar las posiciones cercanas para que estas tengan un acceso más rápido” (Def: wikipedia).

El principal problema de las bases de datos relacionales es que tienen una localidad espacial muy pobre, porque los objetos o la información que almacenan se distribuyen en un gran número de tablas diferentes. CRM de gama alta y soluciones de ERP suelen almacenar sus datos en no menos de las 65.000 tablas diferentes, cada tabla se almacena en una ubicación distinta en el disco. Imagínese cuántos lugares distintos del disco necesita el sistema para poder mostrar la información que un trabajador necesita, por ejemplo, sobre un cliente o un producto en la pantalla de un agente de centro de llamadas o para producir un informe de BI complejo.
Tener una pobre localidad espacial produce enormes necesidades en los accesos a la información almacenada en el disco, lo que se transforma en el principal cuello de botella para el funcionamiento de las bases de datos de hoy.

Page: 1 2

Firma invitada

Nombres destacados del sector TIC opinan sobre las principales tendencias de la industria.

Recent Posts

Recomendaciones de seguridad para mantener los almacenes libres de ciberdelincuencia

Sin las medidas de protección necesarias, un almacén puede convertirse en el eslabón más débil…

1 hora ago

La importancia de optimizar los pagos para generar más ingresos y reducir los costes

Adyen publica los resultados de su estudio "Estrategias para reducir el coste total de pagos",…

2 horas ago

Solamente 2 de cada 10 empresas reducen su huella medioambiental con tecnología

Del porcentaje global del 21 % se baja a un 18 % en el caso…

2 horas ago

Sophos: “El uso más frecuente de la IA en la ciberdelincuencia es para ‘turboalimentar’ sus estafas sociales”

Entrevistamos a John Shier, CTO Field de Sophos, que hace repaso de las principales amenazas…

2 horas ago

¿Cómo convertir a España en hub digital clave para Europa?

Desde fibratel comparten una serie de pautas para orientar la construcción de centros de datos…

3 horas ago

El paralelismo entre la inteligencia artificial y la química

Dell Technologies compara estos ámbitos y habla de "purificar la materia original", "combinar elementos", una…

3 horas ago