Redes LAN

Prevención y Recuperación de Desastres
 

 
  ¡Prevención y recuperación por caídas del servicio!
 

 


  Capítulo VI: PREVENCION Y RECUPERACION DE DESASTRES

Contenido:
1. Introducción
2. Objetivos de la planeación de desastres
3. Aspectos de la planeación de desastres
4. ¿Qué es downtime?
5. ¿Cuánto y cuán a menudo es permisible estar caído?
6. ¿Qué es lo que se debe proteger?
7. ¿Cuánta protección se necesita?
8. Resumen
 

Introducción

La prevención y recuperación de desastres en las LAN no es solo desempeñar respaldos apropiados y recuperación de archivos del servidor de archivos en caso de averías en el (o los) disco(s).  Si bien es cierto que estas son cosas muy importantes, son solo parte de un cuadro y ayudan únicamente en tipos específicos de desastres potenciales.

     La prevención y recuperación de desastres en una LAN debe tratar con todas las contingencias.  Deben desarrollarse planes para evitar los desastres así como también recuperarse de los mismos (en caso de que ocurran).
 

Objetivos de la planeación de desastres

El objetivo primario de la prevención y recuperación de desastres en una LAN es permitir a las empresas u organizaciones a operar sin interrupción, o a reactivarlas después de un desastre en un tiempo prudencial.

     Para poder implementar un plan de desastres efectivo, se debe tener la cooperación y respaldo de toda la organización.  Sin el respaldo de la administración no se podrá ser capaz de cumplir con los objetivos propuestos.  También será necesario contar con el respaldo de todos los usuarios, ya que serán útiles para diseñar, probar e implementar los planes.   Para obtener dicha cooperación, se necesitara desarrollar la confidencialidad y veracidad de aquellas personas de quienes se requerirá ayuda.

     Obviamente, la planeación de desastres no solucionara todos los problemas de la organización. 
 

Aspectos de la planeación de desastres

Si se quiere que los planes sean efectivos, deben abordar tres aspectos importantes:
1. Mantener la disponibilidad del sistema (mantener la funcionalidad del sistema)
2. Mantener la integridad, disponibilidad y seguridad de los datos
3. Recuperarse de los desastres en un tiempo bastante corto

Mantener la disponibilidad del sistema
Mantener la disponibilidad del sistema primeramente requiere de una apropiada planeación, diseño e instalación de la LAN.  Un apropiado diseño e instalación física de la red, incluyendo cableado, hubs, servidores de archivos, bridges y routers, prevendrá muchos problemas o los hará mas fáciles de localizar y resolver cuando ocurran.

Mantener la integridad de los datos
Mantener la integridad de los datos, como mantener la disponibilidad del sistema, también requiere de una apropiada planeación, diseño e instalación de la LAN.  Sin integridad del sistema es imposible mantener la integridad de los datos.  Construir una estructura lógica efectiva con seguridad apropiada y  control de acceso es el primer paso hacia el mantenimiento de la integridad de los datos.  Seguridad no es solo prevenir accesos no autorizados sino que también es prevenir o limitar borrados de archivos accidentales y la incursión de virus.  Problemas eléctricos también pueden afectar la integridad de los datos.

Recuperarse de los desastres en un tiempo bastante corto
A pesar de todas las medidas que puedan tomarse para la prevención de desastres, estos pueden ocurrir, por lo que se debe estar preparados para recuperarse de los mismos lo mas rápidamente posible. Son esenciales efectivos sistemas de respaldo y procedimientos bien documentados.  Equipo xxxx, tal como hubs, patch cables, y tarjetas de red, un plan de mantenimiento y reparación y un equipo de soporte bien entrenado pueden jugar un papel muy importante en la recuperación.
 

¿Qué es Downtime?

Downtime significa muchas cosas para diferentes personas.  Para el administrador de la LAN, downtime a menudo significa la indisponibilidad de un servidor de archivos u otro componente mayor de la LAN.  Para un usuario, downtime puede significar la indisponibilidad de una aplicación especifica o periférico, o de su propia computadora.

     Para nuestros propósitos, utilizaremos la siguiente definición:
Downtime es la indisponibilidad de un sistema computacional o parte de un sistema computacional, incluyendo su software y periféricos, el cual resulta en una perdida de la productividad.
 

¿Cuánto y cuán a menudo es permisible estar caído?

Antes de todo, es necesario indicar que eliminar todo downtime es casi imposible.  Además, tratar de eliminar todo downtime puede ser extremadamente costoso.  En la mayoría de los casos, deben implementarse procedimientos y sistemas que garanticen que se mantendrá el downtime dentro de parámetros predefinidos.

     Deben establecerse parámetros para un máximo downtime y frecuencia mínima de downtime (Tabla 5.1).  Downtime permisible es la cantidad de downtime que se puede tener sin mayores efectos para la organización o incurrir en perdidas substanciales.
 
 

Componente
Donwtime Máximo
Frecuencia Máxima de Downtime
Servidor de Archivos
4 hrs.
Una vez por mes
Estación de Trabajo
24 hrs.
Dos veces por año
Enlace de Area Ancha 
24 hrs.
Una vez por mes

Tabla 5.1:  Ejemplo de downtime permisible.

     Para obtener parámetros realistas, será necesario conversar con los usuarios y administradores de departamentos así como también la administración superior.  Debe considerarse que así como se incremente la confianza en la LAN, el downtime máximo permisible será más corto.
 

¿Qué es lo que se debe proteger?

Los desastres pueden venir de muchas maneras, incluyendo:

  • Falla en el hardware y software, incluyendo ruptura de disco, problemas de cableado, y sistema operativo y problemas en las aplicaciones
  • Error humano, incluyendo el borrado accidental de archivos
  • Sabotaje, incluyendo virus y vandalismo
  • Desastres naturales, como incendios, inundaciones, terremotos o huracanes
  • Problemas relacionados con la energía
  • Contaminación ambiental

 
Desastre
Efectos
Prevención o Recuperación
Problemas de cableado Indisponibilidad del sistema, soluciones altamente costosas y dilatadas. Sistema de cableado estructurado, diseño apropiado, documentación, y herramientas de monitoreo y  diagnostico.
Falla en el disco del servidor Indisponibilidad del sistema, pérdida o corrupción de datos. Discos espejo o duplicados.
Falla en el servidor Indisponibilidad del sistema, perdida o corrupción de datos. Servidor espejo.
Borrado accidental de archivo Pérdida de datos. Sistema de respaldo de datos efectivo, utilitarios de recuperación de archivos.
Falta de energía Indisponibilidad del sistema, pérdida o corrupción de datos, daños en el hardware. UPS, generador de energía de respaldo.
Virus Indisponibilidad total o parcial del sistema, pérdida o corrupción de datos. Actualizar el software de verificación de virus, procedimientos adecuados de respaldo, educación de los usuarios.

Tabla 5.2: Posibles desastres y sus efectos.


¿Cuánta protección se necesita?

Con la protección de desastres, es tanto imposible o inefectivamente costoso protegerse de cada problema potencial.  Lo que debe hacerse es proveer una cantidad razonable de protección contra el downtime y la perdida de datos mientras se asegura que es posible la recuperación en un lapso de tiempo bastante corto cuando el desastre suceda. 

     Algo que es notorio, es que mientras mas cerca se quiera estar de la eliminación total del downtime, dos cosas se harán evidentes:  cada paso incremental será significativamente mas costoso que el anterior, y este proveerá una cantidad significativamente mas pequeña de protección.

     Como análisis final, no es posible prevenir completamente el downtime, solo es posible minimizarlo.  Por lo tanto, debe decidirse que pasos serán costo-efectivos para cada situación en particular.
 

Resumen

Downtime es un estado en el cual, debido a causas ajenas a la voluntad organizacional, un dispositivo de la red no trabaja en forma adecuada o simplemente no esta disponible, por lo que pueden utilizarse sus recursos de hardware ni de software.  Para poder realizar un plan efectivo debe conocerse cuanto tiempo y con que frecuencia nuestras organizaciones están dispuestas a sufrir una caída en su LAN, que es lo mas importante de proteger (aquellas partes mas sensibles para la organización) y cuanta protección es necesaria y cuanta protección podemos darle a nuestra LAN.  Lógicamente, para obtener un plan totalmente efectivo debemos contar con el apoyo tanto de los distintos niveles administrativos como de los usuarios finales.
 

Capítulo VRedes LANDatos Básicos

 

Ultima revisión: Martes, 26 de Noviembre de 2002 10:39:32 p.m.

1