TSM Documentation May 2013.docx

48
Departamento de Educación Truenorth Corporation Corporate Office Park Cortec Suite 702 Guaynabo, PR 00966 (787) 706-3033 Estrategia de Resguardo y Recuperación utilizando Tivoli Storage Manager DOCUMENTACIÓN DE TSM PARA EL ADMINISTRADOR DEL SERVIDOR

Transcript of TSM Documentation May 2013.docx

Page 1: TSM Documentation May 2013.docx

Departamento de Educación

Truenorth CorporationCorporate Office Park

Cortec Suite 702Guaynabo, PR 00966

(787) 706-3033

Estrategia de Resguardo y Recuperación utilizando

 Tivoli Storage Manager

DOCUMENTACIÓN DE TSM PARA EL ADMINISTRADOR

DEL SERVIDOR

Page 2: TSM Documentation May 2013.docx

Tabla de Contenido

ÍndiceResumen Ejecutivo

Objetivo

Limitaciones

Resguardo, Restauración y Recuperación de Data

¿Que es un Resguardo (Backup)?¿Qué es restauración de datos (Restore)?¿Qué es recuperación de Data (Data Recovery)?

Manejo de ResguardosInteracción con otros grupos

Rol y Responsabilidades dentro del Manejo de Resguardo

Plan de Resguardo del Departamento de Educación

Clasificación de la Data

Identificación de la Data

Identificación de Recursos

Equipos para Resguardos

Aplicaciones para Resguardos

Plan de Crecimiento

Método y Frecuencia de los resguardos

Itinerario (Schedule) de Resguardos sugeridos-26

Cuenta para resguardos

Almacenamiento de resguardos

Políticas de Resguardo

Manejo de los Cartuchos

Como registrar los cartuchos de los resguardo

Apéndice A

Apéndice B

Apéndice C

Apéndice D

04/17/2023 Page 2 of 33Documentación del SAN

Page 3: TSM Documentation May 2013.docx

Resumen Ejecutivo

Este documento define la estrategia de resguardo y recuperación de datos del Departamento de Educación del Estado Libre Asociado de Puerto Rico para aquellos servidores que comprende la plataforma de IBM y sistema operativos Windows 2000/2003/2008 utilizando la aplicación de Tivoli Storage Manager (TSM).  En el mismo se describen los objetivos, roles, políticas y procedimientos relacionados a las diversas alternativas de resguardo y recuperación de datos.   Se recomienda que el Departamento de Educacion (DE) continué con la implantación actual de resguardo con la plataforma de TSM para asegurar la completa protección de los datos de los sistemas de la institución. Este documento fue creado siguiendo las prácticas de esta misma institución y utilizando como referencia las experiencias y mejores prácticas de Consultores de IBM y Truenorth Corporation.

En este documento se trata el tema de resguardo y recuperación de data con la herramienta de TSM, sin embargo no es sustituto para un plan de manejo de Desastre Global para los sistemas del DE.  Este plan de resguardo no cubre “backup/restore” para las estaciones de trabajo de los usuarios y aquellos servidores que no son parte de la plataforma de “backup” de TSM.

ObjetivoA diario, en todos los centros de cómputos en el mundo se realiza una de las operaciones más importantes dentro del Sistema de Información de un negocio.  Tomando esa consideración en cuenta del personal de Departamento de Educación han determinado el desarrollar una estrategia de resguardo para el DE que esté a tono con las exigencias actuales y de crecimiento del Departamento.  Estos son los objetivos que debe cubrir esta estrategia.

Crear un documento donde se recopilen las políticas y procedimientos de resguardo, restauración y recuperación de datos de TSM. 

Este documento debe contener políticas y procedimientos a tono con el estado actual de infraestructura del Departamento de Educación (red, sistemas operativos, servidores, etc.).

El procedimiento de resguardo debe ser fácil de implementar y lo mas automático posible.

El mismo debe tomar en consideración los programas y equipos actuales del Departamento de Educación.

La estrategia esta limitada a la data del Departamento de Educación considerada como Data Corporativa que son resguardado con la herramienta TSM.  Este proyecto no considera políticas y procedimientos para resguardo, restauración y recuperación de data de los usuarios.

04/17/2023 Page 3 of 33Documentación del SAN

Page 4: TSM Documentation May 2013.docx

Limitaciones Actualmente no se tiene un lugar alterno equipado con lo necesario pero se esta

considerando varias opciones como alternativa en caso de un “Disaster Recovery”. Por ejemplo:

1- Equipar lugar alterno informática y que sea propiedad del DE.2- Contratar lugar alterno de informática con empresas establecido en ó fuera de Puerto

Rico.

Resguardo, Restauración y Recuperación de Data

¿Que es un Resguardo (Backup)?

Es un proceso en el que periódicamente se copia data/información de un medio (típicamente disco duro) a un segundo medio.  El motivo es poder recuperar la data dentro de un periodo definido.  

El segundo medio típicamente cartuchos de cintas magnéticas asignada a una librería de backup. Este documento cubre la parte de resguardo a data de servidores manejado por aplicación de TSM. 

Dependiendo de los requisitos de almacenamiento de información o data esta puede ser guardada por largos periodo de tiempo, en algunas ocasiones de por vida.  Este proceso se conoce como Archivo de Data (Data Achiving).   El proceso de almacenamiento de esta data es especial y el Administrador de Backup tiene que ser informado de la existencia o necesidad de resguardo y almacenaje de la misma para planes futuros de crecimiento especialmente si la data es almacenada fuera de la compañía.

¿Qué es restauración de datos (Restore)?

Es un proceso en el que ser restaura datos/información, uno o varios archivos a un segundo servidor.  La data es resguardada en el disco duro perteneciente a este segundo servidor.

¿Qué es recuperación de Data (Data Recovery)?

Es un proceso en el que se realiza una restauración completa de la data a su estado original antes del evento, a causa de un desastre que ocasiona perdida de data o corrupción de la misma.  Los desastres pueden ser causados por terremotos, huracanes, inundaciones, colapso de un servidor.  La oficina de OSIATD en conjunto con el administrador de resguardos pueden determinar cuando o no la interrupción de un servicio se considera o cualifica como un desastre. 

04/17/2023 Page 4 of 33Documentación del SAN

Page 5: TSM Documentation May 2013.docx

Manejo de ResguardosManejo de Resguardos es una pieza importante dentro de la Administración total de un sistema.   El manejo de resguardo se enfoca en los aspectos de operación y mantenimiento del Proceso del Manejo de Resguardos.  Este proceso define, monitorea y mantiene la data y los recursos necesarios para la operación en un ambiente de sistemas de información.

Definir la data a ser resguardada y los recursos necesarios para la operación envuelve las siguientes tareas:

Desarrollar un plan para clasificar, almacenar, restaurar y recuperar data. Desarrollar las políticas y procedimientos para almacenar, restaurar y recuperar data.

Monitorear la data y los recursos envuelven las siguientes tareas:

Crear los procedimientos para monitoreo de la data y los recursos (capacidad, disponibilidad y rendimiento)

Monitorear los recursos de almacenamiento de data para asegurar que los recursos están en buen estado y que son los apropiados según las necesidades del Departamento de Educación.

Determinar futuras necesidades basándose en tendencias actual.

Mantenimiento de la data y de los recursos envuelve las siguientes tareas:

Completar y someter formas de cambios para cualquier cambio que afecte el proceso del Manejo de Resguardo.

Mantener los recursos para garantizar la disponibilidad y rendimiento Asegurar que la data es almacenada siguiendo las políticas establecidas de seguridad

Interacción con otros grupos

El proceso de Manejo de Resguardo, al igual que otros, interactúa con otros procesos.  Es importante que el Administrador encargado de este proceso trabaje en equipo con los demás grupos (Administradores de sistema y Operadores) para mantener una armonía dentro de todo el sistema de información.  Rol y Responsabilidades dentro del Manejo de Resguardo

Manejo de Resguardo es una operación crítica que es ejecuta diariamente en todos los Centros de Cómputos. En esta sección describimos los roles que son recomendados para crear el grupo.  Algunos de estos roles representan las tareas diarias dentro del proceso mientras que otros son los roles que son necesarios en el proceso completo.  Dependiendo del tamaño de la organización un individuo puede realizar más de un rol. Sin embargo debe haber un solo responsable por todo

04/17/2023 Page 5 of 33Documentación del SAN

Page 6: TSM Documentation May 2013.docx

el proceso, de esta forma este individuo será legalmente responsable y tomara la iniciativa en resolver cualquier situación que se presentara.

Rol y Responsabilidades dentro del Manejo de ResguardoLa siguiente tabla describe los roles que son requeridos para ejecutar procesos diarios

Tabla 1. Roles relacionados al proceso de Manejo de Resguardos

Rol Responsabilidades

Administrador de Resguardo

El Administrador de Resguardo es el dueño del proceso completo con responsabilidad total del mismo.  El es responsable por el diseño y reestructuración del mismo, así como de las mejoras que afectan todo el proceso.  El Administrador de Resguardo es responsable por los otros roles que cubren todo el proceso individuos que los ejecutan.  Estas actividades pueden tomar de un 25% a un 75% de su tiempo.  La persona a cargo de este rol debe emplear la mayoría de este tiempo en planes para mejorar el proceso.El Administrador de Resguardo:Determina las estrategias de resguardo, restauración y recuperación data.Asegura que los procedimientos de resguardo, restauración y recuperación están siendo

cumplidos y que son adecuadosAsegura que la documentación sea debidamente completadaAsegura que el equipo de trabajo tiene el conocimiento y las herramientas adecuadas para

ejecutar su trabajoProcesa las peticiones de backup y restauraciónAsegura que los procedimientos de resguardo cumplen con las expectativas de negocio del

Departamento de EducaciónProvee y controla el uso limitado de los medios de resguardo (Cintas, cartuchos, etc.)Audita los resguardos para asegurar consistencia de la data lógica y física.Busca e carga la media para resguardo y restauración de data.Asegura la rápida instalación y remoción del media para resguardo y restauración de la dataProvee y controla el media para ambientes de pruebaProvee y controla el media en  ambientes de producciónMantiene inventario de los medios y notifica con suficiente anticipación la necesidad de nuevos

medios.Maneja el media siguiendo las recomendaciones del manufacturero

Operador del Centro de Computo

El operador del Centro de Computo mantiene las cintas de resguardo y:Asegura que el transporte del media fuera del Departamento de Educación sigua las políticas de

retención y rotación.Mantiene un expediente de los resguardos y cartucho de backup depositado fuera y recibido al

Departamento de Educación.

04/17/2023 Page 6 of 33Documentación del SAN

Page 7: TSM Documentation May 2013.docx

Plan de Resguardo del Departamento de EducaciónEn base a los roles descritos arriba el Departamento de Educación a determinado que:

Rafael Vázquez – Consultor de Truenorth Corporation

Gabriel Padilla – Consultor de Truenorth Corporation

Administradores de Resguardo - Realizaran las labores diarias de backup. Su rol principal es el mantener las operaciones de resguardo corriendo en todo momento.

Ramón Cruz realizara el siguiente rol:

Administrador segundario de backup. Su rol principal es mantener las operaciones en caso si el Administrador Principal no está disponible. El estará encargado de las operaciones del backup.

Operadores – Personal del Centro de Cómputos estarán a cargo del manejo de los cartucho que salgan y entran al DE.

Clasificación de la Data En esta sección documentamos las categorías que mejor se adaptan al Departamento de Educación.

Según las recomendaciones y mejores prácticas documentadas en “OSIATD” una de las alternativas de clasificación de data es utilizar categorías acorde al impacto que pueda tener la data para el Departamento de Educación.  Siguiendo esta recomendación creamos las siguientes categorías.

Tabla 2.  Categorías propuestas para clasificación de data.

Categoría Descripción

Data Confidencial Data critica para el Departamento de Educación cuyo contenido es confidencial.

Data Critica Data de gran impacto para el negocio cuya pérdida causaría perdidas, demandas y otros.  Podemos clasificar en este categoría nomina, contratos, etc.

Data Prioridad Alta Data que en menor grado, su perdida, afecta la operación de todo el Departamento de Educación.  Ejemplos de Data con prioridad alta son: Correo Electrónico a nivel de servidor, Data que impacte la operación de un Programa u oficina clave para el Departamento de Educación.  Ejemplos de esto son: Oficina del Secretario, División Legal, y otros.  Data que alteraría los compromisos y promesas del

04/17/2023 Page 7 of 33Documentación del SAN

Page 8: TSM Documentation May 2013.docx

DE.

Data Prioridad Media Data que es pertinente o afecta la operación de un Programa u oficina cuya perdida o no acceso a la data retrasaría los servicios provistos por la misma, pero no la operación total del Departamento de Educación.  Data que para ser recuperada será necesaria una inversión de tiempo y dinero de poco impacto.

Data Prioridad Baja Data de poco valor que en caso de pérdida no afectaría la operación del DEPR o afectaría la operación directa de 1 o pocos empleados.  En esta clasificación, para propósitos de este proyecto se encuentra la data de los usuarios normal.

Nota: Al crear un directorio para un usuario el administrador debe ser cauteloso al clasificar la data del mismo.  Dependiendo el nivel o autoridad del usuario este pudiese manejar data crítica que debe ser resguardada con mejor juicio.

Data No Resguardo Data sin ningún valor, que es guardada en un directorio para el acceso y conveniencia de todos.  Esta data puede ser localizada y restaurada nuevamente sin mayores consecuencias.  Ejemplo de esto son: Drives de periféricos, distribución de productos como, Microsoft Office, Windows 2000, Service Pack, etc.).

04/17/2023 Page 8 of 33Documentación del SAN

Page 9: TSM Documentation May 2013.docx

Identificación de la DataUtilizando la tabla anterior clasificamos la data de los servidores del Departamento de Educación que son manejados por la aplicación de TSM de la siguiente manera.

Tabla 3.  Data identificada y clasificada del Departamento de Educación.

Machine Name Severity

DE-AEA-DC Critico

DE-AEA-DC01 Critico

DE-AEA-SQL Moderado

DE-AEA-TEST Moderado

DE-AEA-TS01 Moderado

DE-AEA-TS02 Moderado

DE-AEA-TS03 Moderado

DE-AEA-TS04 Moderado

DE-AEA-TS05 Moderado

DE-AEA-TS06 Moderado

DE-AEA-TS07 Moderado

DE-AESAN-001 Moderado

DE-AESANV-001 Moderado

de-apl-001 Critico

de-apl-002 Critico

DE-BODW-CH2BL04 Critico

DE-BODW-CH2BL13 Critico

DE-BODW-CH2BL14 Critico

DE-BOSQL-CH2BL0 Critico

DE-CIF-001 Moderado

04/17/2023 Page 9 of 33Documentación del SAN

Page 10: TSM Documentation May 2013.docx

DE-CIFTEST-001 Moderado

DE-CRM-001 Moderado

DE-CTE-02 Moderado

DE-DC-002 Critico

DE-DC-003 Critico

DE-DC-004 Critico

DE-DC-Global Critico

DE-DIRECTOR-002 Moderado

DE-DW-001 Moderado

DE-DW-PRD-001 Critico

DE-DW-TST-001 Moderado

DE-EPAS-001 Moderado

DE-EPAS-002 Moderado

DE-EPAS-003 Moderado

DE-EPAS-004 Moderado

DE-EPAS-005 Moderado

DE-EPAS-006 Moderado

DE-EPAS-007 Moderado

DE-EPAS-008 Moderado

DE-EXCH-001 Critico

DE-EXCHCAS-002 Critico

DE-EXCHCAS-003 Critico

DE-EXCHMB-001 Critico

DE-EXCHMB-002 Critico

DE-EXCHMB-003 Critico

04/17/2023 Page 10 of 33Documentación del SAN

Page 11: TSM Documentation May 2013.docx

DE-EXUM-001 Critico

DE-FETMG1-001 Critico

DE-FETMG2-001 Critico

DE-FETMG3-001 Critico

DE-FETMG4-001 Critico

DE-FIM-001 Moderado

DE-FIM-SQL Moderado

DE-FP-001 Critico

DE-FP-002 Critico

DE-FRONTEND-001 Moderado

DE-FW-001 Critico

DE-FWEBSER-089 Moderado

DE-GTRS-001 Moderado

DE-GTRS-002 Moderado

DE-GTRS-003 Moderado

DE-GTRS-004 Moderado

DE-GTRS-005 Moderado

DE-GTRS-006 Moderado

DE-GTRS-007 Moderado

DE-GTRS-008 Moderado

DE-IDC-WEB Critico

DE-INSIGHT-001 Moderado

DE-ISA-001 Critico

DE-ISA-001B Critico

DE-ISA-005B Critico

04/17/2023 Page 11 of 33Documentación del SAN

Page 12: TSM Documentation May 2013.docx

DE-LYN-AV1 Moderado

DE-LYN-DI1 Moderado

DE-LYN-EDGE1 Moderado

DE-LYN-EE1 Moderado

DE-LYN-FE1 Moderado

DE-LYN-MA1 Moderado

DE-LYN-ME1 Moderado

de-mgmt-001 Moderado

DE-MICENTST-002 Moderado

DE-MICENWEB-001 Moderado

DE-MOODLE-001 Critico

DE-MOODLE-002 Critico

DE-MOSS-001 Critico

DE-MOSS-002 Critico

DE-MOSS-003 Critico

DE-MOSSFE-001 Moderado

DE-MOSSFE-002 Moderado

DE-MOSS-PRD-01 Critico

DE-MOSS-SEARCH Moderado

DE-MSFTRAP-003 Moderado

DE-OAF-CH2BL07 Critico

DE-OAF-CH2BL83 Critico

DE-OAF-PCE06 Critico

DE-OAF-PCE07 Critico

DE-OAF-PCE09 Critico

04/17/2023 Page 12 of 33Documentación del SAN

Page 13: TSM Documentation May 2013.docx

DE-OAF-SQL-005 Critico

DE-OCSMED-001 Critico

DE-OCSWA-001 Critico

DE-OCUPA-WEB-01 Critico

DE-OPS-001 Bajo

DE-PATCHMANAGER Bajo

DE-PROJECT-001 Bajo

DE-PS-001 Bajo

DE-RMS-001 Moderado

DE-ROC-TS Moderado

DE-RS-001 Moderado

DE-RSA-01 Moderado

DE-RSA-02 Moderado

DE-SCCM-001 Critico

DE-SCCM-002 Critico

DE-SCOM-001 Critico

DE-SCSQL-001 Critico

DE-SERVDESK Bajo

DE-SERVDREP Bajo

DE-SIFEC-002 Moderado

DE-SQL-001 (Cluster) Critico

DE-SMAX-001 Critico

DE-SMDB-001 (MCSM) Critico

DE-SMDWDB-001 Critico

DE-SMDWMS-001(- Critico

04/17/2023 Page 13 of 33Documentación del SAN

Page 14: TSM Documentation May 2013.docx

NEW)

DE-SMMS-001 (MCSM) Critico

DE-SQL-001A Critico

DE-SQL-001B Critico

DE-SQL-004-A Critico

DE-SQL-004-B Critico

DE-SQL-005 Critico

DE-SQL-006 Critico

DE-SQL-CEL Critico

DE-SQL-EE-001 Critico

DE-SQL-MOSS Critico

DE-SQL-TST-001 Bajo

DE-SRVLAB-001 Bajo

DE-SRVLAB-002 Bajo

DE-SRVLAB-003 Bajo

DE-SSAS-PRD-001 Critico

DE-SSIS-PRD-001 Critico

DE-SSRS-PRD-001 Critico

DE-STAFF-SQL-01 Critico

DE-SW-001 Bajo

DE-TAL-CH1BL01 Critico

DE-TAL-CH1BL02 Critico

DE-TAL-CH1BL03 Critico

DE-TAL-CH1BL04 Critico

DE-TAL-CH1BL05 Critico

DE-TAL-CH1BL06 Critico

04/17/2023 Page 14 of 33Documentación del SAN

Page 15: TSM Documentation May 2013.docx

DE-TAL-CH1BL07 Critico

DE-TAL-CH1BL08 Critico

DE-TAL-CH1BL09 Critico

DE-TAL-CH1BL10 Critico

DE-TAL-CH1BL11 Critico

DE-TAL-CH1BL12 Critico

DE-TAL-CH1BL13 Critico

DE-TAL-CH2BL01 Critico

DE-TAL-CH2BL02 Critico

DE-TALDH-001 Moderado

DE-TALSQL-001-A Critico

DE-TALSQL-001-B Critico

DE-TALSQL-TEST Bajo

DE-TEM-001 Bajo

de-test-web-01 Bajo

de-ts-001 Critico

DE-TS-002 Critico

DE-TS-003 Critico

de-ts-004 Critico

de-ts-006 Critico

DE-TS-010 Critico

DE-TSM-001 Critico

DE-TSM-001-A Bajo

DE-UPT-Content Moderado

DE-UPT-Contprod Critico

04/17/2023 Page 15 of 33Documentación del SAN

Page 16: TSM Documentation May 2013.docx

DE-UPT-Ora Moderado

DE-UPT-Oraprod Critico

DE-UPT-Process Moderado

DE-UPT-Procprod Critico

DE-UPT-WAS Moderado

DE-UPT-WASPROD Critico

DE-vCenter-001 Bajo

DE-WANMonitor-001 Critico

de-was-001.depr.net Critico

DE-WEB-001 Critico

DE-WEB-EE-001 Critico

DE-WEB-EE-002 Critico

DE-WEBSER-001 Critico

DE-WEBSER-002 Critico

DE-WEBSER-004 Critico

DE-WEBSER-005 Critico

DE-WEB-TST-001 Bajo

DE-WEB-TST-002 Bajo

DE-WMONITOR-004 Moderado

DE-WSUS-001 Critico

De.gobierno.pr-CENTOS Critico

FOREFRONT Moderado

IDC-SQL-002 Critico

Loaner-005 Critico

OAF-CH2BL07-DES Bajo

04/17/2023 Page 16 of 33Documentación del SAN

Page 17: TSM Documentation May 2013.docx

OAF-CH2BL07-NEW Critico

OAF-CORREO-AE Critico

OAF-CORREO-CE Critico

OAF-CORREO-DB Critico

OAF-CORREO-DES2 Bajo

OAF-CORREO-PE Critico

OAF-SQL-005-DES Bajo

OCUPASQL-TST-01 Bajo

OCUPAWEB-TST-01 Bajo

OCUPAWEB-TST-02 Bajo

Oracle-Test Bajo

OSO-NEGRO Critico

ROC-FileServer Critico

ROC-TS Critico

ROC-TS-WEB Critico

Temp-DW Bajo

TEST-APL-RST Bajo

TESTDGH Bajo

TEST-TS-02 Bajo

TEST-TS-RST Bajo

Test-TS-RST2 Bajo

TN-LOANER-002 Critico

TN-LOANER-003 Critico

TN-LOANER-004 Critico

TN-LOANER-DEV-0 Critico

04/17/2023 Page 17 of 33Documentación del SAN

Page 18: TSM Documentation May 2013.docx

TSMADMIN Bajo

TSM-PROXY-002 Bajo

UPT-APPLICATION-DES

Bajo

UPT-APPLICATION-DES

Bajo

UPT-CONTENT-DES Bajo

UPT-ORACLE-DES Bajo

UPT-PROCESS-DES Bajo

Identificación de Recursos

El Departamento de Educación tiene los siguientes equipos para resguardo.  Actualmente se esta evaluando por el personal de OSIATD la adquisición de equipo adicional con el propósito de mejorar la plataforma de resguardo de Tivoli Storage Manager. 

Equipos para Resguardos1. Un Servidor IBM @Server XSeries 360 M/T 8686-3RY.2. Librería IBM modelo TS3310 con 6 unidades de LTO tape drive.3. Librería IBM modelo TS3310 con 4 unidades de LTO tape drive.4. Librería IBM modelo TS3200 con 2 unidades de LTO tape drive.5. Cartuchos para resguardo Ultrium LTO3 (Generación 3) con capacidad 400/800GB cada una.

Aplicaciones para Resguardos1. Tivoli Storage Manager Server (TSM) version 6.3.0.02. Tivoli Storage Manager Windows Client3. Tivoli Storage Manager SQL Client4. Tivoli Storage Manager Exchange Client5. Tivoli Storage Manager LAN Free Client6. Aplicación Windows 20037. Aplicación Windows 2000 Server8. Aplicación Windows 2008

Plan de Crecimiento04/17/2023 Page 18 of 33Documentación del SAN

Page 19: TSM Documentation May 2013.docx

Otra pieza importante dentro del plan de resguardo es considerar futuros crecimientos en base a comportamientos observados, crecimiento de personal o servicios ofrecidos.  Es importante que el Administrador de Resguardo este al tanto de los servicios que OSIATD ofrecerá al Departamento de Educación, así como también las proyecciones de crecimiento de personal.  Debido a la constante evolución de los servicios recomendamos que el Administrador de Resguardo realice este ejercicio 2 veces por año.

El Departamento de Educación requiere que el resguardo (TSM) sea completado durante horas no laborables para no afectar las operaciones. 

Según lo confirmado por el personal del Centro de Cómputos hay espacio suficiente para los cartucho tanto fuera (International Safe Deposit) como en la bóveda del Departamento de Educación.

Método y Frecuencia de los resguardos

MétodoSegún lo acordado y en base a los equipos con los que el DE cuenta se hará un resguardo normal diario de la data. La misma tendrá una política de retención de 7 versiones. Solo el último backup de cada archivo estará como backup activo. Versiones inactivas tendrán un periodo de 30 días de retención. En el caso de los backup de las aplicaciones de SQL y Exchange las mismas tendrán una retención de 30 días. Se esta implementado para poder hacer backup mensual, el mensual se hará en los último día del mes. El cartucho de cada mensual se guardara en una bóveda externa durante un año o más depende de la versión que se aplicó.

FrecuenciaEl backup diario (Incremental) realiza resguardo de toda aquella data que ha cambiado desde el backup de la noche anterior. Sin embargo el backup diario de la base de datos de SQL y Exchange es un backup (Full) y online.

Eventualmente los backup mensuales se llevaran a cabo full y en forma offline.

Itinerario (Schedule) de Resguardos sugeridosLos resguardos serán creados automáticamente por el Administrador de Resguardo.  El Administrador/Operador tendrá que reemplazar los cartuchos, verificar que el trabajo fue completado y que el resguardo es confiable.  Tomando en consideración la data y equipos que el Departamento de Educación sugerimos que los resguardos automáticos se corran de la siguiente manera. 

En el DE se ejecutan varios itinerarios simultáneamente para llevar a cabo el proceso de backup.   En la siguiente tabla se muestran los itinerarios y las diferentes alternativas aplicadas a cada uno de los itinerarios.

Policy domain name Schedule name Associated nodes

DE-OAF-DOMAIN DAILY- ARIA DE-OAF-CH2BL07-NEW

04/17/2023 Page 19 of 33Documentación del SAN

Page 20: TSM Documentation May 2013.docx

INCREMENTAL-OAF-1 DE-OAF-CH2BL08 DE-OAF-PCE09 DE-OAF-SQL-005 LOANER-005 OSO-NEGRO TN-LOANER-002 TN-LOANER-003 TN-LOANER-004 UPT-APPLICATION-DES UPT-CONTENT-DES UPT-ORACLE-DES UPT-PROCESS-DES

EXCHANGE-DE-DOMAIN

DAILY-EXCHANGE-DE-1

DE-EXCHMB-001_EXC DE-EXCHMB-003_EXC

EXCHANGE-DE-DOMAIN

DAILY-EXCHANGE-DE-2

EXCHANGE-DE-DOMAIN

DAILY-EXCHANGE-DE-3

DE-EXCHMB-002_EXC

EXCHANGE-DE-DOMAIN

DAILY-INCREMENTAL-1

DE-EXCHMB-002 DE-EXCHMB-003

MONTHLY-DE-SQL MONTHLY-SQLDB-DE-4

DE-CIF-001_SQL_MTH DE-DIRECTOR-002_SQL_MTH DE-DW-PRD-001_SQL_MTH DE-DW-TST-001_SQL_MTH DE-SIFEC-002_SQL_MTH DE-SQL-005_SQL_MTH DE-SQL-EE-001_SQL_MTH IDC-SQL-002_SQL_MTH

MONTHLY_TAL_SQL TAL-MONTHLY DE-TALSQL-001_SQL_MONTH

ORA-DE-DOMAIN DAILY-DELORACLEDB-PCE

TN-LOANER-004-ORA

ORA-DE-DOMAIN DAILY-ORACLEDB-PCE

TN-LOANER-004-ORA

ORA-DE-DOMAIN DAILY-ORACLELOGS-1 TN-LOANER-004-ORA

ORA-DE-DOMAIN DAILY-ORACLELOGS-10

TN-LOANER-004-ORA

ORA-DE-DOMAIN DAILY-ORACLELOGS-11

TN-LOANER-004-ORA

ORA-DE-DOMAIN DAILY-ORACLELOGS-12

TN-LOANER-004-ORA

04/17/2023 Page 20 of 33Documentación del SAN

Page 21: TSM Documentation May 2013.docx

ORA-DE-DOMAIN DAILY-ORACLELOGS-13

TN-LOANER-004-ORA

ORA-DE-DOMAIN DAILY-ORACLELOGS-14

TN-LOANER-004-ORA

ORA-DE-DOMAIN DAILY-ORACLELOGS-15

TN-LOANER-004-ORA

ORA-DE-DOMAIN DAILY-ORACLELOGS-16

TN-LOANER-004-ORA

ORA-DE-DOMAIN DAILY-ORACLELOGS-2 TN-LOANER-004-ORA

ORA-DE-DOMAIN DAILY-ORACLELOGS-3 TN-LOANER-004-ORA

ORA-DE-DOMAIN DAILY-ORACLELOGS-4 TN-LOANER-004-ORA

ORA-DE-DOMAIN DAILY-ORACLELOGS-5 TN-LOANER-004-ORA

ORA-DE-DOMAIN DAILY-ORACLELOGS-6 TN-LOANER-004-ORA

ORA-DE-DOMAIN DAILY-ORACLELOGS-7 TN-LOANER-004-ORA

ORA-DE-DOMAIN DAILY-ORACLELOGS-8 TN-LOANER-004-ORA

ORA-DE-DOMAIN DAILY-ORACLELOGS-9 TN-LOANER-004-ORA

SQL-DE-DOMAIN DAILY-SQLDB-DE-1 DE-DW-001_SQL DE-SMDWDB-001_SQL DE-SQL-004 DE-STAFF-SQL-01_SQL

SQL-DE-DOMAIN DAILY-SQLDB-DE-2 DE-AEA-SQL_SQL DE-SCSQL-001_SQL DE-SMDB-001_SQL DE-SQL-001_SQL DE-SQL-006_SQL DE-SSRS-PRD-001_SQL

SQL-DE-DOMAIN DAILY-SQLDB-DE-3 DE-AESAN-001_SQL DE-MGMT-001_SQL DE-OAF-SQL-005_SQL DE-RS-001_SQL

DE-SQL-CEL-A_SQL DE-TFS-001_SQL DE-TFS-002_SQL DE-WAS-001_SQL

SQL-DE-DOMAIN DAILY-SQLDB-DE-4 DE-BOSQL-CH2BL03_SQL DE-CIF-001_SQL DE-DIRECTOR-002_SQL DE-DW-PRD-

04/17/2023 Page 21 of 33Documentación del SAN

Page 22: TSM Documentation May 2013.docx

001_SQL DE-DW-TST-001_SQL DE-SIFEC-002_SQL DE-SQL-005_SQL DE-SQL-EE-001_SQL

IDC-SQL-002_SQL

SQL-DE-DOMAIN DAILY-SQLLOGS-DE-1 DE-AEA-SQL_SQL DE-BOSQL-CH2BL03_SQL DE-DW-001_SQL DE-MGMT-001_SQL DE-SIFEC-002_SQL DE-SQL-004 DE-WAS-001_SQL

SQL-DE-DOMAIN DAILY-SQLLOGS-DE-2 DE-AEA-SQL_SQL DE-BOSQL-CH2BL03_SQL DE-DW-001_SQL DE-MGMT-001_SQL DE-SIFEC-002_SQL DE-SQL-004 DE-WAS-001_SQL

SQL-DE-DOMAIN DAILY-SQLLOGS-DE-3 DE-AEA-SQL_SQL DE-BOSQL-CH2BL03_SQL DE-DW-001_SQL DE-MGMT-001_SQL DE-SIFEC-002_SQL DE-SQL-004 DE-WAS-001_SQL

SQL-DE-DOMAIN DAILY-SQLLOGS-DE-4 DE-AEA-SQL_SQL DE-BOSQL-CH2BL03_SQL DE-DW-001_SQL DE-MGMT-001_SQL DE-SIFEC-002_SQL DE-SQL-004 DE-WAS-001_SQL

SQL-DE-DOMAIN DAILY-SQLLOGS-DE-5 DE-AEA-SQL_SQL DE-BOSQL-CH2BL03_SQL DE-DW-001_SQL DE-MGMT-001_SQL DE-SIFEC-002_SQL DE-SQL-004 DE-STAFF-SQL-01_SQL DE-WAS-001_SQL

SQL-DE-DOMAIN DAILY-SQLLOGS-DE-6

SQL-DE-DOMAIN DE-SQL-DIFF-001

SQL-DE-DOMAIN DIALY-SQLLOGS-DE-8 DE-STAFF-SQL-01_SQL

SQL-TAL-DOMAIN DAILY-SQLDB-TAL-1 DE-TAL-CH1BL13_SQL DE-TALSQL-001

04/17/2023 Page 22 of 33Documentación del SAN

Page 23: TSM Documentation May 2013.docx

SQL-TAL-DOMAIN DAILY-SQLLOGS-TAL-1

SQL-TAL-DOMAIN DAILY-SQLLOGS-TAL-10

SQL-TAL-DOMAIN DAILY-SQLLOGS-TAL-11

SQL-TAL-DOMAIN DAILY-SQLLOGS-TAL-12

SQL-TAL-DOMAIN DAILY-SQLLOGS-TAL-13

SQL-TAL-DOMAIN DAILY-SQLLOGS-TAL-14

SQL-TAL-DOMAIN DAILY-SQLLOGS-TAL-15

SQL-TAL-DOMAIN DAILY-SQLLOGS-TAL-16

SQL-TAL-DOMAIN DAILY-SQLLOGS-TAL-17

SQL-TAL-DOMAIN DAILY-SQLLOGS-TAL-18

SQL-TAL-DOMAIN DAILY-SQLLOGS-TAL-19

SQL-TAL-DOMAIN DAILY-SQLLOGS-TAL-2

SQL-TAL-DOMAIN DAILY-SQLLOGS-TAL-20

SQL-TAL-DOMAIN DAILY-SQLLOGS-TAL-3

SQL-TAL-DOMAIN DAILY-SQLLOGS-TAL-4

SQL-TAL-DOMAIN DAILY-SQLLOGS-TAL-5

04/17/2023 Page 23 of 33Documentación del SAN

Page 24: TSM Documentation May 2013.docx

SQL-TAL-DOMAIN DAILY-SQLLOGS-TAL-6

SQL-TAL-DOMAIN DAILY-SQLLOGS-TAL-7

SQL-TAL-DOMAIN DAILY-SQLLOGS-TAL-8

SQL-TAL-DOMAIN DAILY-SQLLOGS-TAL-9

SQL-TAL-DOMAIN TAL-SQL-DIFF-1 DE-TALSQL-001

STANDARD DAILY_INCR

STANDARD WEEKLY_INCR

WINDOWS-DE-DOMAIN

DAILY-CLUSTER-DE-1

WINDOWS-DE-DOMAIN

DAILY-FP-CLUSTER-DE-1

WINDOWS-DE-DOMAIN

DAILY-FP-CLUSTER-DE-2

WINDOWS-DE-DOMAIN

DAILY-INCREMENTAL-DE-1

DE-AEA-DC DE-AEA-DC01 DE-APL-002 DE-CIF-001 DE-DC-002 DE-DC-004 DE-FP-001 DE-ISA-001 DE-SIFEC-002 DE-TS-001 DE-TS-002 DE-TS-003 DE-TS-004 DE-TS-006

WINDOWS-DE-DOMAIN

DAILY-INCREMENTAL-DE-2

DE-AEA-SQL DE-APL-001 DE-BODW-CH2BL04 DE-MOODLE-001 DE-MOODLE-002 DE-MOSS-001 DE-OPS-001 DE-SQL-004-A DE-SQL-004-B DE-UPT-CONTENT DE-UPT-ORA DE-UPT-PROCESS DE-UPT-WAS

WINDOWS-DE-DOMAIN

DAILY-INCREMENTAL-DE-3

DE-AEA-TS01 DE-AEA-TS03 DE-BODW-CH2BL13 DE-EXCHMB-001 DE-MGMT-001 DE-MICENWEB-001 DE-SMDB-001 DE-SMDWDB-001 DE-TS-010 DE-WEBSER-005

04/17/2023 Page 24 of 33Documentación del SAN

Page 25: TSM Documentation May 2013.docx

IDC-SQL-002

WINDOWS-DE-DOMAIN

DAILY-INCREMENTAL-DE-4

DE-AEA-TS02 DE-BOSQL-CH2BL03 DE-DC-003 DE-DW-001 DE-LYN-DI1 DE-LYN-MA1 DE-SMDWMS-001 DE-SMMS-001 DE-WAS-001 ROC-TS ROC-TS-WEB

WINDOWS-DE-DOMAIN

DAILY-INCREMENTAL-DE-5

DE-DC-GLOBAL DE-EXCH-001 DE-FIM-001 DE-MOSS-PRD-01 DE-OCUPA-WEB-01 DE-SCOM-001 DE-SCSQL-001 DE-SQL-006 DE-TFS-002 DE-WEB-EE-002 DE-WEBSER-001 ROC-FILESERVER WANMONITOR-001

WINDOWS-DE-DOMAIN

DAILY-INCREMENTAL-DE-6

DE-AESAN-001 DE-AESANV-001 DE-CRM-001 DE-FWEBSER-089 DE-LYN-AV1 DE-MOSS-002 DE-RS-001 DE-SQL-EE-001 DE-SSAS-PRD-001 DE-SSIS-PRD-001 DE-SSRS-PRD-001 DE-SW-001 DE-UPT-CONTPROD DE-UPT-ORAPROD DE-UPT-PROCPROD DE-UPT-WASPROD DE-WEB-EE-001 DE-WEBSER-002 DE-WSUS-001

WINDOWS-DE-DOMAIN

DAILY-INCREMENTAL-DE-7

DE-AEA-TEST DE-AEA-TS04 DE-DW-TST-001 DE-MOSS-003 DE-OAF-CH2BL83 DE-OAF-PCE06 DE-OAF-PCE07 DE-PATCHMANAGER DE-SCCM-001 DE-SCCM-002 DE-SMAX-001 DE-SQL-005 DE-SQL-CEL DE-STAFF-SQL-01 DE-TFS-001

WINDOWS-DE-DOMAIN

DAILY-INCREMENTAL-DE-8

DE-EPAS-001 DE-EPAS-002 DE-EPAS-003 DE-EPAS-004 DE-EPAS-005 DE-EPAS-006 DE-EPAS-007 DE-EPAS-008 DE-GTRS-001 DE-GTRS-002 DE-GTRS-003 DE-GTRS-004

04/17/2023 Page 25 of 33Documentación del SAN

Page 26: TSM Documentation May 2013.docx

DE-GTRS-005 DE-GTRS-006 DE-GTRS-007 DE-GTRS-008 DE-INSIGHT-001 DE-WEBSER-004

WINDOWS-DE-DOMAIN

ISC-OFFLINE-FULL-BACKUP

WINDOWS-TAL-DOMAIN

DAILY-CLUSTER-TAL-1

DE-TALSQL-001-CL

WINDOWS-TAL-DOMAIN

DAILY-INCREMENTAL-TAL-1

DE-TAL-CH1BL01 DE-TAL-CH1BL02 DE-TAL-CH1BL03 DE-TAL-CH1BL04

WINDOWS-TAL-DOMAIN

DAILY-INCREMENTAL-TAL-2

DE-TAL-CH1BL05 DE-TAL-CH1BL06 DE-TAL-CH1BL07 DE-TAL-CH1BL08 DE-TAL-CH1BL09 DE-TAL-CH1BL10 DE-TAL-CH1BL12 DE-TAL-CH1BL13 DE-TALSQL-001-B

Nota: Inicialmente estos resguardos automatizados son controlado desde el servidor de TSM  y las librerías.

Cuenta para resguardosSiguiendo las recomendaciones y mejores prácticas descritas del Departamento de OSIATD sugerimos que los resguardos sean realizados utilizando la cuenta creada y asignada solo con este fin y con privilegios de “TSM Administrator”.  Debido al nivel de privilegios sugerimos que la contraseña (password) sea cambiado cada 90 días mínimo.  Este debe ser una tarea del Administrador de Resguardo.

Almacenamiento de resguardos

Almacenamiento LocalEl Departamento de Educación cuenta con una bóveda que cumple con los requisitos necesarios para el almacenamiento de los cartuchos. Por ejemplo los cartuchos de la base de datos de TSM solamente.  Actualmente hay espacio suficiente para guardar los cartuchos LTO. 

Almacenamiento fuera del Departamento de EducaciónSiguiendo las recomendaciones y mejores prácticas en OSIATD toda buena estrategia de resguardo debe contemplar el almacenar los cartuchos fuera de la institución.  Asegurando que en caso de desastre las operaciones puedan restaurarse en un lugar alterno y la data pueda ser recuperada.  El Administrador debe tener en mente el espacio de almacenamiento fuera del Departamento de Educación en sus proyecciones de crecimiento.

04/17/2023 Page 26 of 33Documentación del SAN

Page 27: TSM Documentation May 2013.docx

Políticas de Resguardo En esta sección describimos las políticas de resguardo del Departamento de Educación.

Los resguardos diarios y en forma incremental siempre se mantiene las últimas dos versiones de los archivos resguardados. Además un archivo o directorio que es borrado por el usuario el mismo es mantenido por TSM por un periodo de 60 días.  Sugerencia: Integrar en la forma de Cambio un cambo que advierta que el cambio puede afectar los servicios de resguardo. Limitar los privilegios o cantidad de personas que pueden crear directorios de los roots de los servidores por ejemplo los “Terminal Servers”. 

Los resguardos diarios relacionado a la base de datos de SQL y Exchange se mantiene una cantidad de 7 versiones de resguardo.

Los resguardos semanales y/o mensuales se considera una política de retención desde un mes hasta 5 años. El Administrador de TSM  utilizara una hoja para llevar o mantener registro de los resguardos realizados (ver apéndice A).

Manejo de los CartuchosEl manejo de los cartuchos se divide en dos reglones. Primer renglón cartuchos que se encuentra dentro de las librerías. El segundo renglón aquello cartuchos que son transportado a la bóveda externa (Internacional Safe Deposit).

Cartuchos de la librerías – Se saca los cartuchos diario que son LTO-Copypool y los cartucho de la base de datos (Snapshot y DBBackup) y se replaza con los cartucho que son scratch.

Luego que ya haya sacado los cartuchos de las librerías el Administrador llena el formulario (Apéndice A) y se lo entrega al personal del Centro de Computo para así llevarlo a la bóveda externa (Internacional Safe Deposit)

Como registrar los cartuchos de los resguardo Los operadores del centro de cómputos utiliza la hoja de manejo de cartuchos LTO de sistemas abierto y verifica que los cartuchos que el Administrador llena y verifica si la  hoja esta correcto y la firma y le envía una copia al Administrador del backup y así se archiva para futura referencia.

1. EL Administrador anota fecha, número del cartucho y firma la hoja. Hoja de Manejo de Cartuchos LTO de sistemas abierto (ver Apéndice A).

2. El operador del Centro de Computo verifica físicamente que lo que esta anota que este correcto y firma la hoja y se le entrega una copia al Administrador de resguardo Hoja de Manejo de Cartuchos LTO de sistemas abierto (ver Apéndice A).

Hojas diarias

1. TSM Operations Daily Checklist - y se le envía una copia al Supervisor y algunos Administradores con el fin de verificar la consistencia del proceso diario y el estatus del sistema (ver Apéndice B) donde se anotan 13 pasos de los eventos ocurridos durante el  proceso diario.

04/17/2023 Page 27 of 33Documentación del SAN

Page 28: TSM Documentation May 2013.docx

2. Client Backup Results TSM 16 hour Report for DE-TSM-001-A – Esta hoja es para verificar que todos los servidores halla completado o fallado el backup. La aplicación de TSM envía esta hoja a través del email a algunos de los Administradores (ver Apéndice C).

3. TSM Operations-Troubleshooting Log – Esta hoja se usa para el o los servidores que haya fallado anotar la causa porque el backup fallo y la resolución que se tomo para corregir el problema (ver Apéndice E).

Apéndice A

04/17/2023 Page 28 of 33Documentación del SAN

Page 29: TSM Documentation May 2013.docx

Apéndice B

04/17/2023 Page 29 of 33Documentación del SAN

Page 30: TSM Documentation May 2013.docx

TSM Operations - Daily Checklist

Date: _____________

                                                                                                       Time: _____________

    Backup Administrator:      

Task Complete?

1. Display all active processes. Manually submit any missed jobs. Command “Q PR”.

2. Display all active sessions (backups/restores) currently running. Check for long running jobs and Investigate cause. Command “Q SE”.

3. Check to see if all client schedules executed on time. Investigate any missed or failed schedules. Run Command “Q EV * * BEGIND=TODAY-1 BEGINT=18:00 ENDD=TODAY ENDT=09:00”.

4. Check the status of the automated library. Check for a sufficient supply of scratch tapes. Run Command: select volume_name from libvolumes where status='Scratch'.

5. Check the status of your tape drives. All drives should show online. Command “Q DRIVE”.

6. Check the status of your tape paths. All tape paths should show online. Command “Q PATH”.

7. Check the status of the TSM database. Insure that the percent utilized does not exceed 90%. Add more disk when needed. Check the Cache wait percent. Any value other than 00 should be investigated. Command “Q DB F=D”

04/17/2023 Page 30 of 33Documentación del SAN

Page 31: TSM Documentation May 2013.docx

8. Display the recovery log statistics. If the percent utilized is over 75 perform a tsm database backup. Command “Q LOG F=D”.

9. Display the overall status of the TSM server. Insure that the central scheduler is active, registration is closed, and availability is enabled. Command “Q ST”.

10. Check the status of the Storage Volumes. Make sure all volumes has status = “On-line”. Command “Q VOL”.

11. Reboot Server as needed.

12. Remove cartridges from drive manually and reset all drives.

13. Clean all drives.

Apéndice C

04/17/2023 Page 31 of 33Documentación del SAN

Page 32: TSM Documentation May 2013.docx

04/17/2023 Page 32 of 33Documentación del SAN

Page 33: TSM Documentation May 2013.docx

Apéndice D

Version 6.3.0.0

TSM Operations – Troubleshooting LogCLIENT NODE NAME

BACKUP RESULT

CAUSESOLUTION

DE-SQL-001

FAILED

ANS1026E (RC136) The session is rejected: There was a communications protocol error. ACO5436E A failure occurred on stripe number (0), rc = 418

Verify the server and a full backup was performed to compensate.

04/17/2023 Page 33 of 33Documentación del SAN