Bases de datos

Hace 35 años, sólo existían bases de datos en laboratórios de investigación especiales, donde los científicos computacionales buscaban modos de hacerlas eficientes y útiles. En la actualidad , las bases de datos son una parte muy difundida de la industria de la tecnología de la información (TI) y los negocios en general. El modelo de base de datos más frecuente es el relacional.

El reto más significativo al implementar una base de datos consiste en diseñar correctamente su estructura. Si no se comprende al detalle la base de datos que se prentende resolver, y no se conoce las mejores practicas para organizar los datos requeridos, la base de datos implementada se vuelve una pesada bestia que requiere atención constante.

Propiedades de una base de datos

Una base de datos es un conjunto de elementos de datos interrelacionados, administrados como unidad. Esta definición es deliberadamente amplia porque existe mucha variación entre los diferentes vendedores de software que ofrecen sistemas de bases de datos. Por ejemplo, Micrsoft Access pone toda la base de datos en un solo archivo, de modo que una base de datos de Access puede definirse como el archivo que contiene los elementos de datos. Oracle Corporation define su base de datos como un conjunto de archivos físicos administrados por una instancia de su producto de software de base de datos. Una instancia es una del software de base de datos que se ejecuta en la memoria. Microsoft SQL Server y Sybase Adaptive Server Enterprise (ASE) definen una base de datos como un conjunto de elementos de datos que tienen un propietario común, y varias bases de datos suelen ser administradas por una solo instancia de software. Todo esto puede ser muy confuso si trabaja con varios productos; por ejemplo, una base de datos que se apega a la definición de Microsfot SQL Server o Sybase ASE es exantamente lo que Oracle Corporation llama un esquema.

Un objeto de base de datos es una estructura de datos con nombre que se guarda en una base de datos. Los tipos específicos de objetos permitidos varían de un vendedor a otro, y de un modelo a otro.  El modelo de base de datos alude al modo en que una base de datos organiza su contenido para representar el munod real.

Un archivo es un conjunto de registros relacionados que un sistema operativo guarda como unidad. Debido a las definiciones desafortunadamente semejantes de archivos y bases de datos.

ALGUNAS PROPIEDADES DE LAS BASES DE DATOS

  • Control mediante un sistema de administración de base de datos (DBMS, DataBase Management System).
  • Abstracción de capas de datos.
  • Independencia física de los datos.
  • Independencia lógica de los datos.

El sistema de administración de bases de datos

DBMS es el software proporcionado por el vendedor de la base de datos. Productos de software como Microsoft Access, Oracle, Microsoft SQL Server, Sybase ASE, Ingres MySQL son DBMS.

El DBMS ofrece todos los servicios básicos requeridos para organizar y conservar una base de datos, entre ellos:

  • Mover los datos de archivos  de datos físicos, según se necesario.
  • Administrar la opción de que varios usuarios consulten datos de manera concurrente, e incluir medidas que eviten que las actualizaciones simultáneas tengan conflictos entre sí.
  • Controlar las transacciones para que los cambios en la base de datos de cada transacción sean una unidad de trabajo tipo todo o nada. En otras palabras, si la transacción tiene exito, todos los cambios se registran en la base de datos; si la transacción fracasa, ninguno de los cambios se registra.
  • Permitir un lenguaje de consulta, que es un sistema de comandos empleado por el usuario de la base de datos para recuperar sus datos.
  • Proporcionar medidas para respaldar la base de datos y recuperarla después de una falla.
  • Aportar mecanismos de seguridad para evitar la consulta y modificación no autorizada de los datos.

Capas de abstracción de los datos

Las bases de datos son únicas por su capacidad para presentar a varios usuarios vistas propias y diferentes de los datos , al tiempo que conservan una sola vez los datos relacionados. En conjunto se denominan vistas de usuarios. En este contexto, un usuario es cualquier persona o aplicación que se registra en la base de datos con el propósito de guardar datos, recuperarlos, o ambas opciones.  Una aplicación es un conjunto de programas de computación diseñado para resolver un problema de negocios específico, como un sistema de recepción de pedidos, uno de procesamiento de nóminas o uno contable.

Casi todos los DBMS modernos siguen estas arquitectura, integrada por tres capas primarias: física, lógica y externa.

Capas de abstracción de una base de datos

La capa física

La capa física incluye los archivos que contienen toda la información de la base de datos. Casi todos los DBMS modernos permiten que la información se guarde en varios archivos, que suelen distribuirse en varias unidades de disco físicas. Con esta distribución , las unidades de disco trabajan en paralelo para ampliar al máximo el desempeño. El usuario de una base de datos no necesita comprender cómo se guardan los datos dentro de los archivos ni cuales archivos contienen los elementos de datos que le interesan. En casi todas las organizaciones, un técnico conocido como administrador de base de datos (DBA, database administrator) maneja los detalles de instalación y configuración del software y los archivos de la base de datos que permiten presentarla a los usuarios. El DBMS funciona con el sistema operativo de la computadora para ilustrar los archivos de datos de manera automática, lo que incluye todas las operaciones de abrir, cerrar, leer y escribir archivos. No debe ser obligatorio que el usuario haga referencia a los archivos físicos de datos al utilizar la base de datos, lo que está en marcado contraste con las hojas de cálculo y los procesadores de texto, en que el usuario debe guardar conscientemente los documentos y elegir nombres de archivo y lugares de almacenamiento.  Muchos de los DBMS para computadoras personales son excepciones a este dogma, porque se requiere que el usuario localice y abra un archivo físico como parte del proceso de inicio de sesión en el DBMS. Por el contrario, con DBMS de nivel empresarial (como Oracle, Sybase ASE, Microsoft SQL Server, MySQL), los archivos físicos son administrados automáticamente y nunca es necesario que el usuario haga referencia a ellos al utilizar la base de datos.

La capa lógica

La capa lógica (o modelo lógico) está formada por las primeras dos capas de abstracción en la base de datos: la capa física tiene una existencia concreta en los archivos del sistema operativo, mientras que la capa lógica solo existe como estructuras abstractas de datos integradas en la capa física, según se requiera. El DBMS transforma los datos de los archivos en una estructura común. En ocasiones a esta capa se le denomina Esquema, término utilizado para el conjunto de todos los elementos de datos guardados en una base de datos específica o que pertenecen a un usuario en particular. Dependiendo del DBMS, esta capa contiene un conjunto de tablas bidimensionales, estructura jerárquica similar al organigrama de una compañía, o alguna otra estructura.

La capa externa

La capa externa (o modelo externo) es la segunda capa de abstracción de la base de datos. Esta capa está formada por las vistas de usuarios analizadas antes, a las que en conjunto se les denomina esquema secundario. En esta capa , los usuarios (los programas de aplicaciones y las personas) que la consultan se conectan y plantean consultas contra la base de datos. Lo ideal es que sólo el DBA administre las capas física y lógica. El DBMS controla la transformación de los elementos seleccionados de una o más estructuras de datos en la capa lógica para formar la vista de cada usuario. Las vistas de usuario de esta capa se pueden redefinir y almacenar en las bases de datos para reutilización, o pueden ser elementos temporales creados por el DBMS para contener los resultados de una solo consulta ad hoc, hasta que ya no sean necesarios para el usuario. Una consulta ad hoc no se prepara con anticipación y no es probable que se reutilice.

Independencia física de los datos

La capacidad para modificar la estructura de los archivos físicos de una base de datos sin afectar a los usuarios y los procesos existentes es la independencia física de los datos. La separación entre las capas física y lógica aporta la independencia de los datos en una DBMS. Es esencial que se comprenda que la independencia física de los datos no es una propiedad que ” se tiene o no se tiene” sino una en que un DBMS específico puede tener una independencia de datos mayor o menor que otra. La medida, también llamada grado de independencia física de datos, representa la cantidad de cambios que se pueden hacer al sistema de archivos sin afectar a la capa lógica. Antes de los sistemas que ofrecen independencia de los datos, hasta el cambio más insignificante en el modo en que se guardan los datos requería que el personal de programación hiciera cambios en todos los programas que utilizaran los datos, lo que era un proceso costoso y prolongado.

Todas las computadoras modernas tienen cierto grado de independencia física  de los datos. Por ejemplo, una hoja de cálculo en una computadora personal seguirá funcionando adecuadamente si se copia  de un disco duro a un disquete  o a una memoria USB portátil. El hecho de que el desempeño (la velocidad) de estos dispositivos varíe mucho no es lo esencial, sino el hecho de que los dispositivos tienen una construcción física completamente diferente y, no obstante, el sistema operativo de la computadora personal maneja automáticamente las diferencias y presenta los datos del archivo para la aplicación (es decir, el programa de la hoja de cálculo, como Microsoft Excel) y por lo tanto al usuario, exactamente de la misma manera. Sin embargo, en casi todos los sistemas personales, el usuario todavía debe recordar dónde colocó el archivo para poder localizarlo cuando lo necesite.

Los DBMS aumentaron en gran medida la independencia física de los datos ofrecida por las computadoras, porque permiten al usuario de la base de datos consultar objetos (por ejemplo, las tablas en una DBMS relacional) sin tener que hacer referencia a los archivos de datos físicos. El catálogo del DBMS guarda las definiciones de objetos y conserva un registro del lugar físico donde se guardan. Estos son algunos ejemplos de los cambios físicos que pueden hacerse de manera independiente de los datos:

  • Mover un archivo de base de datos de un dispositivo o de un directorio a otro.
  • Dividir o combinar archivos de una base de datos.
  • Cambiar el nombre de los archivos de una base de datos.
  • Mover un objeto de base de datos de un archivo a otro.
  • Agregar objetos o archivos de datos nuevos a la base de datos.

Observe que no se menciona la eliminación de cosas. Por lo tanto, debe ser obvio que eliminar un objeto de una base de datos provocará la falla de todo lo que utiliza ese objeto. Sin embargo, todo lo demás debe quedar intacto, excepto tal vez la disponibilidad; algunos DBMS requerirán que se desactive la base de datos o un servicio del DBMS mientras se hacen ciertos cambios en la capa física.

 

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *