TSM Documentation May 2013.docx
Transcript of TSM Documentation May 2013.docx
Departamento de Educación
Truenorth CorporationCorporate Office Park
Cortec Suite 702Guaynabo, PR 00966
(787) 706-3033
Estrategia de Resguardo y Recuperación utilizando
Tivoli Storage Manager
DOCUMENTACIÓN DE TSM PARA EL ADMINISTRADOR
DEL SERVIDOR
Tabla de Contenido
ÍndiceResumen Ejecutivo
Objetivo
Limitaciones
Resguardo, Restauración y Recuperación de Data
¿Que es un Resguardo (Backup)?¿Qué es restauración de datos (Restore)?¿Qué es recuperación de Data (Data Recovery)?
Manejo de ResguardosInteracción con otros grupos
Rol y Responsabilidades dentro del Manejo de Resguardo
Plan de Resguardo del Departamento de Educación
Clasificación de la Data
Identificación de la Data
Identificación de Recursos
Equipos para Resguardos
Aplicaciones para Resguardos
Plan de Crecimiento
Método y Frecuencia de los resguardos
Itinerario (Schedule) de Resguardos sugeridos-26
Cuenta para resguardos
Almacenamiento de resguardos
Políticas de Resguardo
Manejo de los Cartuchos
Como registrar los cartuchos de los resguardo
Apéndice A
Apéndice B
Apéndice C
Apéndice D
04/17/2023 Page 2 of 33Documentación del SAN
Resumen Ejecutivo
Este documento define la estrategia de resguardo y recuperación de datos del Departamento de Educación del Estado Libre Asociado de Puerto Rico para aquellos servidores que comprende la plataforma de IBM y sistema operativos Windows 2000/2003/2008 utilizando la aplicación de Tivoli Storage Manager (TSM). En el mismo se describen los objetivos, roles, políticas y procedimientos relacionados a las diversas alternativas de resguardo y recuperación de datos. Se recomienda que el Departamento de Educacion (DE) continué con la implantación actual de resguardo con la plataforma de TSM para asegurar la completa protección de los datos de los sistemas de la institución. Este documento fue creado siguiendo las prácticas de esta misma institución y utilizando como referencia las experiencias y mejores prácticas de Consultores de IBM y Truenorth Corporation.
En este documento se trata el tema de resguardo y recuperación de data con la herramienta de TSM, sin embargo no es sustituto para un plan de manejo de Desastre Global para los sistemas del DE. Este plan de resguardo no cubre “backup/restore” para las estaciones de trabajo de los usuarios y aquellos servidores que no son parte de la plataforma de “backup” de TSM.
ObjetivoA diario, en todos los centros de cómputos en el mundo se realiza una de las operaciones más importantes dentro del Sistema de Información de un negocio. Tomando esa consideración en cuenta del personal de Departamento de Educación han determinado el desarrollar una estrategia de resguardo para el DE que esté a tono con las exigencias actuales y de crecimiento del Departamento. Estos son los objetivos que debe cubrir esta estrategia.
Crear un documento donde se recopilen las políticas y procedimientos de resguardo, restauración y recuperación de datos de TSM.
Este documento debe contener políticas y procedimientos a tono con el estado actual de infraestructura del Departamento de Educación (red, sistemas operativos, servidores, etc.).
El procedimiento de resguardo debe ser fácil de implementar y lo mas automático posible.
El mismo debe tomar en consideración los programas y equipos actuales del Departamento de Educación.
La estrategia esta limitada a la data del Departamento de Educación considerada como Data Corporativa que son resguardado con la herramienta TSM. Este proyecto no considera políticas y procedimientos para resguardo, restauración y recuperación de data de los usuarios.
04/17/2023 Page 3 of 33Documentación del SAN
Limitaciones Actualmente no se tiene un lugar alterno equipado con lo necesario pero se esta
considerando varias opciones como alternativa en caso de un “Disaster Recovery”. Por ejemplo:
1- Equipar lugar alterno informática y que sea propiedad del DE.2- Contratar lugar alterno de informática con empresas establecido en ó fuera de Puerto
Rico.
Resguardo, Restauración y Recuperación de Data
¿Que es un Resguardo (Backup)?
Es un proceso en el que periódicamente se copia data/información de un medio (típicamente disco duro) a un segundo medio. El motivo es poder recuperar la data dentro de un periodo definido.
El segundo medio típicamente cartuchos de cintas magnéticas asignada a una librería de backup. Este documento cubre la parte de resguardo a data de servidores manejado por aplicación de TSM.
Dependiendo de los requisitos de almacenamiento de información o data esta puede ser guardada por largos periodo de tiempo, en algunas ocasiones de por vida. Este proceso se conoce como Archivo de Data (Data Achiving). El proceso de almacenamiento de esta data es especial y el Administrador de Backup tiene que ser informado de la existencia o necesidad de resguardo y almacenaje de la misma para planes futuros de crecimiento especialmente si la data es almacenada fuera de la compañía.
¿Qué es restauración de datos (Restore)?
Es un proceso en el que ser restaura datos/información, uno o varios archivos a un segundo servidor. La data es resguardada en el disco duro perteneciente a este segundo servidor.
¿Qué es recuperación de Data (Data Recovery)?
Es un proceso en el que se realiza una restauración completa de la data a su estado original antes del evento, a causa de un desastre que ocasiona perdida de data o corrupción de la misma. Los desastres pueden ser causados por terremotos, huracanes, inundaciones, colapso de un servidor. La oficina de OSIATD en conjunto con el administrador de resguardos pueden determinar cuando o no la interrupción de un servicio se considera o cualifica como un desastre.
04/17/2023 Page 4 of 33Documentación del SAN
Manejo de ResguardosManejo de Resguardos es una pieza importante dentro de la Administración total de un sistema. El manejo de resguardo se enfoca en los aspectos de operación y mantenimiento del Proceso del Manejo de Resguardos. Este proceso define, monitorea y mantiene la data y los recursos necesarios para la operación en un ambiente de sistemas de información.
Definir la data a ser resguardada y los recursos necesarios para la operación envuelve las siguientes tareas:
Desarrollar un plan para clasificar, almacenar, restaurar y recuperar data. Desarrollar las políticas y procedimientos para almacenar, restaurar y recuperar data.
Monitorear la data y los recursos envuelven las siguientes tareas:
Crear los procedimientos para monitoreo de la data y los recursos (capacidad, disponibilidad y rendimiento)
Monitorear los recursos de almacenamiento de data para asegurar que los recursos están en buen estado y que son los apropiados según las necesidades del Departamento de Educación.
Determinar futuras necesidades basándose en tendencias actual.
Mantenimiento de la data y de los recursos envuelve las siguientes tareas:
Completar y someter formas de cambios para cualquier cambio que afecte el proceso del Manejo de Resguardo.
Mantener los recursos para garantizar la disponibilidad y rendimiento Asegurar que la data es almacenada siguiendo las políticas establecidas de seguridad
Interacción con otros grupos
El proceso de Manejo de Resguardo, al igual que otros, interactúa con otros procesos. Es importante que el Administrador encargado de este proceso trabaje en equipo con los demás grupos (Administradores de sistema y Operadores) para mantener una armonía dentro de todo el sistema de información. Rol y Responsabilidades dentro del Manejo de Resguardo
Manejo de Resguardo es una operación crítica que es ejecuta diariamente en todos los Centros de Cómputos. En esta sección describimos los roles que son recomendados para crear el grupo. Algunos de estos roles representan las tareas diarias dentro del proceso mientras que otros son los roles que son necesarios en el proceso completo. Dependiendo del tamaño de la organización un individuo puede realizar más de un rol. Sin embargo debe haber un solo responsable por todo
04/17/2023 Page 5 of 33Documentación del SAN
el proceso, de esta forma este individuo será legalmente responsable y tomara la iniciativa en resolver cualquier situación que se presentara.
Rol y Responsabilidades dentro del Manejo de ResguardoLa siguiente tabla describe los roles que son requeridos para ejecutar procesos diarios
Tabla 1. Roles relacionados al proceso de Manejo de Resguardos
Rol Responsabilidades
Administrador de Resguardo
El Administrador de Resguardo es el dueño del proceso completo con responsabilidad total del mismo. El es responsable por el diseño y reestructuración del mismo, así como de las mejoras que afectan todo el proceso. El Administrador de Resguardo es responsable por los otros roles que cubren todo el proceso individuos que los ejecutan. Estas actividades pueden tomar de un 25% a un 75% de su tiempo. La persona a cargo de este rol debe emplear la mayoría de este tiempo en planes para mejorar el proceso.El Administrador de Resguardo:Determina las estrategias de resguardo, restauración y recuperación data.Asegura que los procedimientos de resguardo, restauración y recuperación están siendo
cumplidos y que son adecuadosAsegura que la documentación sea debidamente completadaAsegura que el equipo de trabajo tiene el conocimiento y las herramientas adecuadas para
ejecutar su trabajoProcesa las peticiones de backup y restauraciónAsegura que los procedimientos de resguardo cumplen con las expectativas de negocio del
Departamento de EducaciónProvee y controla el uso limitado de los medios de resguardo (Cintas, cartuchos, etc.)Audita los resguardos para asegurar consistencia de la data lógica y física.Busca e carga la media para resguardo y restauración de data.Asegura la rápida instalación y remoción del media para resguardo y restauración de la dataProvee y controla el media para ambientes de pruebaProvee y controla el media en ambientes de producciónMantiene inventario de los medios y notifica con suficiente anticipación la necesidad de nuevos
medios.Maneja el media siguiendo las recomendaciones del manufacturero
Operador del Centro de Computo
El operador del Centro de Computo mantiene las cintas de resguardo y:Asegura que el transporte del media fuera del Departamento de Educación sigua las políticas de
retención y rotación.Mantiene un expediente de los resguardos y cartucho de backup depositado fuera y recibido al
Departamento de Educación.
04/17/2023 Page 6 of 33Documentación del SAN
Plan de Resguardo del Departamento de EducaciónEn base a los roles descritos arriba el Departamento de Educación a determinado que:
Rafael Vázquez – Consultor de Truenorth Corporation
Gabriel Padilla – Consultor de Truenorth Corporation
Administradores de Resguardo - Realizaran las labores diarias de backup. Su rol principal es el mantener las operaciones de resguardo corriendo en todo momento.
Ramón Cruz realizara el siguiente rol:
Administrador segundario de backup. Su rol principal es mantener las operaciones en caso si el Administrador Principal no está disponible. El estará encargado de las operaciones del backup.
Operadores – Personal del Centro de Cómputos estarán a cargo del manejo de los cartucho que salgan y entran al DE.
Clasificación de la Data En esta sección documentamos las categorías que mejor se adaptan al Departamento de Educación.
Según las recomendaciones y mejores prácticas documentadas en “OSIATD” una de las alternativas de clasificación de data es utilizar categorías acorde al impacto que pueda tener la data para el Departamento de Educación. Siguiendo esta recomendación creamos las siguientes categorías.
Tabla 2. Categorías propuestas para clasificación de data.
Categoría Descripción
Data Confidencial Data critica para el Departamento de Educación cuyo contenido es confidencial.
Data Critica Data de gran impacto para el negocio cuya pérdida causaría perdidas, demandas y otros. Podemos clasificar en este categoría nomina, contratos, etc.
Data Prioridad Alta Data que en menor grado, su perdida, afecta la operación de todo el Departamento de Educación. Ejemplos de Data con prioridad alta son: Correo Electrónico a nivel de servidor, Data que impacte la operación de un Programa u oficina clave para el Departamento de Educación. Ejemplos de esto son: Oficina del Secretario, División Legal, y otros. Data que alteraría los compromisos y promesas del
04/17/2023 Page 7 of 33Documentación del SAN
DE.
Data Prioridad Media Data que es pertinente o afecta la operación de un Programa u oficina cuya perdida o no acceso a la data retrasaría los servicios provistos por la misma, pero no la operación total del Departamento de Educación. Data que para ser recuperada será necesaria una inversión de tiempo y dinero de poco impacto.
Data Prioridad Baja Data de poco valor que en caso de pérdida no afectaría la operación del DEPR o afectaría la operación directa de 1 o pocos empleados. En esta clasificación, para propósitos de este proyecto se encuentra la data de los usuarios normal.
Nota: Al crear un directorio para un usuario el administrador debe ser cauteloso al clasificar la data del mismo. Dependiendo el nivel o autoridad del usuario este pudiese manejar data crítica que debe ser resguardada con mejor juicio.
Data No Resguardo Data sin ningún valor, que es guardada en un directorio para el acceso y conveniencia de todos. Esta data puede ser localizada y restaurada nuevamente sin mayores consecuencias. Ejemplo de esto son: Drives de periféricos, distribución de productos como, Microsoft Office, Windows 2000, Service Pack, etc.).
04/17/2023 Page 8 of 33Documentación del SAN
Identificación de la DataUtilizando la tabla anterior clasificamos la data de los servidores del Departamento de Educación que son manejados por la aplicación de TSM de la siguiente manera.
Tabla 3. Data identificada y clasificada del Departamento de Educación.
Machine Name Severity
DE-AEA-DC Critico
DE-AEA-DC01 Critico
DE-AEA-SQL Moderado
DE-AEA-TEST Moderado
DE-AEA-TS01 Moderado
DE-AEA-TS02 Moderado
DE-AEA-TS03 Moderado
DE-AEA-TS04 Moderado
DE-AEA-TS05 Moderado
DE-AEA-TS06 Moderado
DE-AEA-TS07 Moderado
DE-AESAN-001 Moderado
DE-AESANV-001 Moderado
de-apl-001 Critico
de-apl-002 Critico
DE-BODW-CH2BL04 Critico
DE-BODW-CH2BL13 Critico
DE-BODW-CH2BL14 Critico
DE-BOSQL-CH2BL0 Critico
DE-CIF-001 Moderado
04/17/2023 Page 9 of 33Documentación del SAN
DE-CIFTEST-001 Moderado
DE-CRM-001 Moderado
DE-CTE-02 Moderado
DE-DC-002 Critico
DE-DC-003 Critico
DE-DC-004 Critico
DE-DC-Global Critico
DE-DIRECTOR-002 Moderado
DE-DW-001 Moderado
DE-DW-PRD-001 Critico
DE-DW-TST-001 Moderado
DE-EPAS-001 Moderado
DE-EPAS-002 Moderado
DE-EPAS-003 Moderado
DE-EPAS-004 Moderado
DE-EPAS-005 Moderado
DE-EPAS-006 Moderado
DE-EPAS-007 Moderado
DE-EPAS-008 Moderado
DE-EXCH-001 Critico
DE-EXCHCAS-002 Critico
DE-EXCHCAS-003 Critico
DE-EXCHMB-001 Critico
DE-EXCHMB-002 Critico
DE-EXCHMB-003 Critico
04/17/2023 Page 10 of 33Documentación del SAN
DE-EXUM-001 Critico
DE-FETMG1-001 Critico
DE-FETMG2-001 Critico
DE-FETMG3-001 Critico
DE-FETMG4-001 Critico
DE-FIM-001 Moderado
DE-FIM-SQL Moderado
DE-FP-001 Critico
DE-FP-002 Critico
DE-FRONTEND-001 Moderado
DE-FW-001 Critico
DE-FWEBSER-089 Moderado
DE-GTRS-001 Moderado
DE-GTRS-002 Moderado
DE-GTRS-003 Moderado
DE-GTRS-004 Moderado
DE-GTRS-005 Moderado
DE-GTRS-006 Moderado
DE-GTRS-007 Moderado
DE-GTRS-008 Moderado
DE-IDC-WEB Critico
DE-INSIGHT-001 Moderado
DE-ISA-001 Critico
DE-ISA-001B Critico
DE-ISA-005B Critico
04/17/2023 Page 11 of 33Documentación del SAN
DE-LYN-AV1 Moderado
DE-LYN-DI1 Moderado
DE-LYN-EDGE1 Moderado
DE-LYN-EE1 Moderado
DE-LYN-FE1 Moderado
DE-LYN-MA1 Moderado
DE-LYN-ME1 Moderado
de-mgmt-001 Moderado
DE-MICENTST-002 Moderado
DE-MICENWEB-001 Moderado
DE-MOODLE-001 Critico
DE-MOODLE-002 Critico
DE-MOSS-001 Critico
DE-MOSS-002 Critico
DE-MOSS-003 Critico
DE-MOSSFE-001 Moderado
DE-MOSSFE-002 Moderado
DE-MOSS-PRD-01 Critico
DE-MOSS-SEARCH Moderado
DE-MSFTRAP-003 Moderado
DE-OAF-CH2BL07 Critico
DE-OAF-CH2BL83 Critico
DE-OAF-PCE06 Critico
DE-OAF-PCE07 Critico
DE-OAF-PCE09 Critico
04/17/2023 Page 12 of 33Documentación del SAN
DE-OAF-SQL-005 Critico
DE-OCSMED-001 Critico
DE-OCSWA-001 Critico
DE-OCUPA-WEB-01 Critico
DE-OPS-001 Bajo
DE-PATCHMANAGER Bajo
DE-PROJECT-001 Bajo
DE-PS-001 Bajo
DE-RMS-001 Moderado
DE-ROC-TS Moderado
DE-RS-001 Moderado
DE-RSA-01 Moderado
DE-RSA-02 Moderado
DE-SCCM-001 Critico
DE-SCCM-002 Critico
DE-SCOM-001 Critico
DE-SCSQL-001 Critico
DE-SERVDESK Bajo
DE-SERVDREP Bajo
DE-SIFEC-002 Moderado
DE-SQL-001 (Cluster) Critico
DE-SMAX-001 Critico
DE-SMDB-001 (MCSM) Critico
DE-SMDWDB-001 Critico
DE-SMDWMS-001(- Critico
04/17/2023 Page 13 of 33Documentación del SAN
NEW)
DE-SMMS-001 (MCSM) Critico
DE-SQL-001A Critico
DE-SQL-001B Critico
DE-SQL-004-A Critico
DE-SQL-004-B Critico
DE-SQL-005 Critico
DE-SQL-006 Critico
DE-SQL-CEL Critico
DE-SQL-EE-001 Critico
DE-SQL-MOSS Critico
DE-SQL-TST-001 Bajo
DE-SRVLAB-001 Bajo
DE-SRVLAB-002 Bajo
DE-SRVLAB-003 Bajo
DE-SSAS-PRD-001 Critico
DE-SSIS-PRD-001 Critico
DE-SSRS-PRD-001 Critico
DE-STAFF-SQL-01 Critico
DE-SW-001 Bajo
DE-TAL-CH1BL01 Critico
DE-TAL-CH1BL02 Critico
DE-TAL-CH1BL03 Critico
DE-TAL-CH1BL04 Critico
DE-TAL-CH1BL05 Critico
DE-TAL-CH1BL06 Critico
04/17/2023 Page 14 of 33Documentación del SAN
DE-TAL-CH1BL07 Critico
DE-TAL-CH1BL08 Critico
DE-TAL-CH1BL09 Critico
DE-TAL-CH1BL10 Critico
DE-TAL-CH1BL11 Critico
DE-TAL-CH1BL12 Critico
DE-TAL-CH1BL13 Critico
DE-TAL-CH2BL01 Critico
DE-TAL-CH2BL02 Critico
DE-TALDH-001 Moderado
DE-TALSQL-001-A Critico
DE-TALSQL-001-B Critico
DE-TALSQL-TEST Bajo
DE-TEM-001 Bajo
de-test-web-01 Bajo
de-ts-001 Critico
DE-TS-002 Critico
DE-TS-003 Critico
de-ts-004 Critico
de-ts-006 Critico
DE-TS-010 Critico
DE-TSM-001 Critico
DE-TSM-001-A Bajo
DE-UPT-Content Moderado
DE-UPT-Contprod Critico
04/17/2023 Page 15 of 33Documentación del SAN
DE-UPT-Ora Moderado
DE-UPT-Oraprod Critico
DE-UPT-Process Moderado
DE-UPT-Procprod Critico
DE-UPT-WAS Moderado
DE-UPT-WASPROD Critico
DE-vCenter-001 Bajo
DE-WANMonitor-001 Critico
de-was-001.depr.net Critico
DE-WEB-001 Critico
DE-WEB-EE-001 Critico
DE-WEB-EE-002 Critico
DE-WEBSER-001 Critico
DE-WEBSER-002 Critico
DE-WEBSER-004 Critico
DE-WEBSER-005 Critico
DE-WEB-TST-001 Bajo
DE-WEB-TST-002 Bajo
DE-WMONITOR-004 Moderado
DE-WSUS-001 Critico
De.gobierno.pr-CENTOS Critico
FOREFRONT Moderado
IDC-SQL-002 Critico
Loaner-005 Critico
OAF-CH2BL07-DES Bajo
04/17/2023 Page 16 of 33Documentación del SAN
OAF-CH2BL07-NEW Critico
OAF-CORREO-AE Critico
OAF-CORREO-CE Critico
OAF-CORREO-DB Critico
OAF-CORREO-DES2 Bajo
OAF-CORREO-PE Critico
OAF-SQL-005-DES Bajo
OCUPASQL-TST-01 Bajo
OCUPAWEB-TST-01 Bajo
OCUPAWEB-TST-02 Bajo
Oracle-Test Bajo
OSO-NEGRO Critico
ROC-FileServer Critico
ROC-TS Critico
ROC-TS-WEB Critico
Temp-DW Bajo
TEST-APL-RST Bajo
TESTDGH Bajo
TEST-TS-02 Bajo
TEST-TS-RST Bajo
Test-TS-RST2 Bajo
TN-LOANER-002 Critico
TN-LOANER-003 Critico
TN-LOANER-004 Critico
TN-LOANER-DEV-0 Critico
04/17/2023 Page 17 of 33Documentación del SAN
TSMADMIN Bajo
TSM-PROXY-002 Bajo
UPT-APPLICATION-DES
Bajo
UPT-APPLICATION-DES
Bajo
UPT-CONTENT-DES Bajo
UPT-ORACLE-DES Bajo
UPT-PROCESS-DES Bajo
Identificación de Recursos
El Departamento de Educación tiene los siguientes equipos para resguardo. Actualmente se esta evaluando por el personal de OSIATD la adquisición de equipo adicional con el propósito de mejorar la plataforma de resguardo de Tivoli Storage Manager.
Equipos para Resguardos1. Un Servidor IBM @Server XSeries 360 M/T 8686-3RY.2. Librería IBM modelo TS3310 con 6 unidades de LTO tape drive.3. Librería IBM modelo TS3310 con 4 unidades de LTO tape drive.4. Librería IBM modelo TS3200 con 2 unidades de LTO tape drive.5. Cartuchos para resguardo Ultrium LTO3 (Generación 3) con capacidad 400/800GB cada una.
Aplicaciones para Resguardos1. Tivoli Storage Manager Server (TSM) version 6.3.0.02. Tivoli Storage Manager Windows Client3. Tivoli Storage Manager SQL Client4. Tivoli Storage Manager Exchange Client5. Tivoli Storage Manager LAN Free Client6. Aplicación Windows 20037. Aplicación Windows 2000 Server8. Aplicación Windows 2008
Plan de Crecimiento04/17/2023 Page 18 of 33Documentación del SAN
Otra pieza importante dentro del plan de resguardo es considerar futuros crecimientos en base a comportamientos observados, crecimiento de personal o servicios ofrecidos. Es importante que el Administrador de Resguardo este al tanto de los servicios que OSIATD ofrecerá al Departamento de Educación, así como también las proyecciones de crecimiento de personal. Debido a la constante evolución de los servicios recomendamos que el Administrador de Resguardo realice este ejercicio 2 veces por año.
El Departamento de Educación requiere que el resguardo (TSM) sea completado durante horas no laborables para no afectar las operaciones.
Según lo confirmado por el personal del Centro de Cómputos hay espacio suficiente para los cartucho tanto fuera (International Safe Deposit) como en la bóveda del Departamento de Educación.
Método y Frecuencia de los resguardos
MétodoSegún lo acordado y en base a los equipos con los que el DE cuenta se hará un resguardo normal diario de la data. La misma tendrá una política de retención de 7 versiones. Solo el último backup de cada archivo estará como backup activo. Versiones inactivas tendrán un periodo de 30 días de retención. En el caso de los backup de las aplicaciones de SQL y Exchange las mismas tendrán una retención de 30 días. Se esta implementado para poder hacer backup mensual, el mensual se hará en los último día del mes. El cartucho de cada mensual se guardara en una bóveda externa durante un año o más depende de la versión que se aplicó.
FrecuenciaEl backup diario (Incremental) realiza resguardo de toda aquella data que ha cambiado desde el backup de la noche anterior. Sin embargo el backup diario de la base de datos de SQL y Exchange es un backup (Full) y online.
Eventualmente los backup mensuales se llevaran a cabo full y en forma offline.
Itinerario (Schedule) de Resguardos sugeridosLos resguardos serán creados automáticamente por el Administrador de Resguardo. El Administrador/Operador tendrá que reemplazar los cartuchos, verificar que el trabajo fue completado y que el resguardo es confiable. Tomando en consideración la data y equipos que el Departamento de Educación sugerimos que los resguardos automáticos se corran de la siguiente manera.
En el DE se ejecutan varios itinerarios simultáneamente para llevar a cabo el proceso de backup. En la siguiente tabla se muestran los itinerarios y las diferentes alternativas aplicadas a cada uno de los itinerarios.
Policy domain name Schedule name Associated nodes
DE-OAF-DOMAIN DAILY- ARIA DE-OAF-CH2BL07-NEW
04/17/2023 Page 19 of 33Documentación del SAN
INCREMENTAL-OAF-1 DE-OAF-CH2BL08 DE-OAF-PCE09 DE-OAF-SQL-005 LOANER-005 OSO-NEGRO TN-LOANER-002 TN-LOANER-003 TN-LOANER-004 UPT-APPLICATION-DES UPT-CONTENT-DES UPT-ORACLE-DES UPT-PROCESS-DES
EXCHANGE-DE-DOMAIN
DAILY-EXCHANGE-DE-1
DE-EXCHMB-001_EXC DE-EXCHMB-003_EXC
EXCHANGE-DE-DOMAIN
DAILY-EXCHANGE-DE-2
EXCHANGE-DE-DOMAIN
DAILY-EXCHANGE-DE-3
DE-EXCHMB-002_EXC
EXCHANGE-DE-DOMAIN
DAILY-INCREMENTAL-1
DE-EXCHMB-002 DE-EXCHMB-003
MONTHLY-DE-SQL MONTHLY-SQLDB-DE-4
DE-CIF-001_SQL_MTH DE-DIRECTOR-002_SQL_MTH DE-DW-PRD-001_SQL_MTH DE-DW-TST-001_SQL_MTH DE-SIFEC-002_SQL_MTH DE-SQL-005_SQL_MTH DE-SQL-EE-001_SQL_MTH IDC-SQL-002_SQL_MTH
MONTHLY_TAL_SQL TAL-MONTHLY DE-TALSQL-001_SQL_MONTH
ORA-DE-DOMAIN DAILY-DELORACLEDB-PCE
TN-LOANER-004-ORA
ORA-DE-DOMAIN DAILY-ORACLEDB-PCE
TN-LOANER-004-ORA
ORA-DE-DOMAIN DAILY-ORACLELOGS-1 TN-LOANER-004-ORA
ORA-DE-DOMAIN DAILY-ORACLELOGS-10
TN-LOANER-004-ORA
ORA-DE-DOMAIN DAILY-ORACLELOGS-11
TN-LOANER-004-ORA
ORA-DE-DOMAIN DAILY-ORACLELOGS-12
TN-LOANER-004-ORA
04/17/2023 Page 20 of 33Documentación del SAN
ORA-DE-DOMAIN DAILY-ORACLELOGS-13
TN-LOANER-004-ORA
ORA-DE-DOMAIN DAILY-ORACLELOGS-14
TN-LOANER-004-ORA
ORA-DE-DOMAIN DAILY-ORACLELOGS-15
TN-LOANER-004-ORA
ORA-DE-DOMAIN DAILY-ORACLELOGS-16
TN-LOANER-004-ORA
ORA-DE-DOMAIN DAILY-ORACLELOGS-2 TN-LOANER-004-ORA
ORA-DE-DOMAIN DAILY-ORACLELOGS-3 TN-LOANER-004-ORA
ORA-DE-DOMAIN DAILY-ORACLELOGS-4 TN-LOANER-004-ORA
ORA-DE-DOMAIN DAILY-ORACLELOGS-5 TN-LOANER-004-ORA
ORA-DE-DOMAIN DAILY-ORACLELOGS-6 TN-LOANER-004-ORA
ORA-DE-DOMAIN DAILY-ORACLELOGS-7 TN-LOANER-004-ORA
ORA-DE-DOMAIN DAILY-ORACLELOGS-8 TN-LOANER-004-ORA
ORA-DE-DOMAIN DAILY-ORACLELOGS-9 TN-LOANER-004-ORA
SQL-DE-DOMAIN DAILY-SQLDB-DE-1 DE-DW-001_SQL DE-SMDWDB-001_SQL DE-SQL-004 DE-STAFF-SQL-01_SQL
SQL-DE-DOMAIN DAILY-SQLDB-DE-2 DE-AEA-SQL_SQL DE-SCSQL-001_SQL DE-SMDB-001_SQL DE-SQL-001_SQL DE-SQL-006_SQL DE-SSRS-PRD-001_SQL
SQL-DE-DOMAIN DAILY-SQLDB-DE-3 DE-AESAN-001_SQL DE-MGMT-001_SQL DE-OAF-SQL-005_SQL DE-RS-001_SQL
DE-SQL-CEL-A_SQL DE-TFS-001_SQL DE-TFS-002_SQL DE-WAS-001_SQL
SQL-DE-DOMAIN DAILY-SQLDB-DE-4 DE-BOSQL-CH2BL03_SQL DE-CIF-001_SQL DE-DIRECTOR-002_SQL DE-DW-PRD-
04/17/2023 Page 21 of 33Documentación del SAN
001_SQL DE-DW-TST-001_SQL DE-SIFEC-002_SQL DE-SQL-005_SQL DE-SQL-EE-001_SQL
IDC-SQL-002_SQL
SQL-DE-DOMAIN DAILY-SQLLOGS-DE-1 DE-AEA-SQL_SQL DE-BOSQL-CH2BL03_SQL DE-DW-001_SQL DE-MGMT-001_SQL DE-SIFEC-002_SQL DE-SQL-004 DE-WAS-001_SQL
SQL-DE-DOMAIN DAILY-SQLLOGS-DE-2 DE-AEA-SQL_SQL DE-BOSQL-CH2BL03_SQL DE-DW-001_SQL DE-MGMT-001_SQL DE-SIFEC-002_SQL DE-SQL-004 DE-WAS-001_SQL
SQL-DE-DOMAIN DAILY-SQLLOGS-DE-3 DE-AEA-SQL_SQL DE-BOSQL-CH2BL03_SQL DE-DW-001_SQL DE-MGMT-001_SQL DE-SIFEC-002_SQL DE-SQL-004 DE-WAS-001_SQL
SQL-DE-DOMAIN DAILY-SQLLOGS-DE-4 DE-AEA-SQL_SQL DE-BOSQL-CH2BL03_SQL DE-DW-001_SQL DE-MGMT-001_SQL DE-SIFEC-002_SQL DE-SQL-004 DE-WAS-001_SQL
SQL-DE-DOMAIN DAILY-SQLLOGS-DE-5 DE-AEA-SQL_SQL DE-BOSQL-CH2BL03_SQL DE-DW-001_SQL DE-MGMT-001_SQL DE-SIFEC-002_SQL DE-SQL-004 DE-STAFF-SQL-01_SQL DE-WAS-001_SQL
SQL-DE-DOMAIN DAILY-SQLLOGS-DE-6
SQL-DE-DOMAIN DE-SQL-DIFF-001
SQL-DE-DOMAIN DIALY-SQLLOGS-DE-8 DE-STAFF-SQL-01_SQL
SQL-TAL-DOMAIN DAILY-SQLDB-TAL-1 DE-TAL-CH1BL13_SQL DE-TALSQL-001
04/17/2023 Page 22 of 33Documentación del SAN
SQL-TAL-DOMAIN DAILY-SQLLOGS-TAL-1
SQL-TAL-DOMAIN DAILY-SQLLOGS-TAL-10
SQL-TAL-DOMAIN DAILY-SQLLOGS-TAL-11
SQL-TAL-DOMAIN DAILY-SQLLOGS-TAL-12
SQL-TAL-DOMAIN DAILY-SQLLOGS-TAL-13
SQL-TAL-DOMAIN DAILY-SQLLOGS-TAL-14
SQL-TAL-DOMAIN DAILY-SQLLOGS-TAL-15
SQL-TAL-DOMAIN DAILY-SQLLOGS-TAL-16
SQL-TAL-DOMAIN DAILY-SQLLOGS-TAL-17
SQL-TAL-DOMAIN DAILY-SQLLOGS-TAL-18
SQL-TAL-DOMAIN DAILY-SQLLOGS-TAL-19
SQL-TAL-DOMAIN DAILY-SQLLOGS-TAL-2
SQL-TAL-DOMAIN DAILY-SQLLOGS-TAL-20
SQL-TAL-DOMAIN DAILY-SQLLOGS-TAL-3
SQL-TAL-DOMAIN DAILY-SQLLOGS-TAL-4
SQL-TAL-DOMAIN DAILY-SQLLOGS-TAL-5
04/17/2023 Page 23 of 33Documentación del SAN
SQL-TAL-DOMAIN DAILY-SQLLOGS-TAL-6
SQL-TAL-DOMAIN DAILY-SQLLOGS-TAL-7
SQL-TAL-DOMAIN DAILY-SQLLOGS-TAL-8
SQL-TAL-DOMAIN DAILY-SQLLOGS-TAL-9
SQL-TAL-DOMAIN TAL-SQL-DIFF-1 DE-TALSQL-001
STANDARD DAILY_INCR
STANDARD WEEKLY_INCR
WINDOWS-DE-DOMAIN
DAILY-CLUSTER-DE-1
WINDOWS-DE-DOMAIN
DAILY-FP-CLUSTER-DE-1
WINDOWS-DE-DOMAIN
DAILY-FP-CLUSTER-DE-2
WINDOWS-DE-DOMAIN
DAILY-INCREMENTAL-DE-1
DE-AEA-DC DE-AEA-DC01 DE-APL-002 DE-CIF-001 DE-DC-002 DE-DC-004 DE-FP-001 DE-ISA-001 DE-SIFEC-002 DE-TS-001 DE-TS-002 DE-TS-003 DE-TS-004 DE-TS-006
WINDOWS-DE-DOMAIN
DAILY-INCREMENTAL-DE-2
DE-AEA-SQL DE-APL-001 DE-BODW-CH2BL04 DE-MOODLE-001 DE-MOODLE-002 DE-MOSS-001 DE-OPS-001 DE-SQL-004-A DE-SQL-004-B DE-UPT-CONTENT DE-UPT-ORA DE-UPT-PROCESS DE-UPT-WAS
WINDOWS-DE-DOMAIN
DAILY-INCREMENTAL-DE-3
DE-AEA-TS01 DE-AEA-TS03 DE-BODW-CH2BL13 DE-EXCHMB-001 DE-MGMT-001 DE-MICENWEB-001 DE-SMDB-001 DE-SMDWDB-001 DE-TS-010 DE-WEBSER-005
04/17/2023 Page 24 of 33Documentación del SAN
IDC-SQL-002
WINDOWS-DE-DOMAIN
DAILY-INCREMENTAL-DE-4
DE-AEA-TS02 DE-BOSQL-CH2BL03 DE-DC-003 DE-DW-001 DE-LYN-DI1 DE-LYN-MA1 DE-SMDWMS-001 DE-SMMS-001 DE-WAS-001 ROC-TS ROC-TS-WEB
WINDOWS-DE-DOMAIN
DAILY-INCREMENTAL-DE-5
DE-DC-GLOBAL DE-EXCH-001 DE-FIM-001 DE-MOSS-PRD-01 DE-OCUPA-WEB-01 DE-SCOM-001 DE-SCSQL-001 DE-SQL-006 DE-TFS-002 DE-WEB-EE-002 DE-WEBSER-001 ROC-FILESERVER WANMONITOR-001
WINDOWS-DE-DOMAIN
DAILY-INCREMENTAL-DE-6
DE-AESAN-001 DE-AESANV-001 DE-CRM-001 DE-FWEBSER-089 DE-LYN-AV1 DE-MOSS-002 DE-RS-001 DE-SQL-EE-001 DE-SSAS-PRD-001 DE-SSIS-PRD-001 DE-SSRS-PRD-001 DE-SW-001 DE-UPT-CONTPROD DE-UPT-ORAPROD DE-UPT-PROCPROD DE-UPT-WASPROD DE-WEB-EE-001 DE-WEBSER-002 DE-WSUS-001
WINDOWS-DE-DOMAIN
DAILY-INCREMENTAL-DE-7
DE-AEA-TEST DE-AEA-TS04 DE-DW-TST-001 DE-MOSS-003 DE-OAF-CH2BL83 DE-OAF-PCE06 DE-OAF-PCE07 DE-PATCHMANAGER DE-SCCM-001 DE-SCCM-002 DE-SMAX-001 DE-SQL-005 DE-SQL-CEL DE-STAFF-SQL-01 DE-TFS-001
WINDOWS-DE-DOMAIN
DAILY-INCREMENTAL-DE-8
DE-EPAS-001 DE-EPAS-002 DE-EPAS-003 DE-EPAS-004 DE-EPAS-005 DE-EPAS-006 DE-EPAS-007 DE-EPAS-008 DE-GTRS-001 DE-GTRS-002 DE-GTRS-003 DE-GTRS-004
04/17/2023 Page 25 of 33Documentación del SAN
DE-GTRS-005 DE-GTRS-006 DE-GTRS-007 DE-GTRS-008 DE-INSIGHT-001 DE-WEBSER-004
WINDOWS-DE-DOMAIN
ISC-OFFLINE-FULL-BACKUP
WINDOWS-TAL-DOMAIN
DAILY-CLUSTER-TAL-1
DE-TALSQL-001-CL
WINDOWS-TAL-DOMAIN
DAILY-INCREMENTAL-TAL-1
DE-TAL-CH1BL01 DE-TAL-CH1BL02 DE-TAL-CH1BL03 DE-TAL-CH1BL04
WINDOWS-TAL-DOMAIN
DAILY-INCREMENTAL-TAL-2
DE-TAL-CH1BL05 DE-TAL-CH1BL06 DE-TAL-CH1BL07 DE-TAL-CH1BL08 DE-TAL-CH1BL09 DE-TAL-CH1BL10 DE-TAL-CH1BL12 DE-TAL-CH1BL13 DE-TALSQL-001-B
Nota: Inicialmente estos resguardos automatizados son controlado desde el servidor de TSM y las librerías.
Cuenta para resguardosSiguiendo las recomendaciones y mejores prácticas descritas del Departamento de OSIATD sugerimos que los resguardos sean realizados utilizando la cuenta creada y asignada solo con este fin y con privilegios de “TSM Administrator”. Debido al nivel de privilegios sugerimos que la contraseña (password) sea cambiado cada 90 días mínimo. Este debe ser una tarea del Administrador de Resguardo.
Almacenamiento de resguardos
Almacenamiento LocalEl Departamento de Educación cuenta con una bóveda que cumple con los requisitos necesarios para el almacenamiento de los cartuchos. Por ejemplo los cartuchos de la base de datos de TSM solamente. Actualmente hay espacio suficiente para guardar los cartuchos LTO.
Almacenamiento fuera del Departamento de EducaciónSiguiendo las recomendaciones y mejores prácticas en OSIATD toda buena estrategia de resguardo debe contemplar el almacenar los cartuchos fuera de la institución. Asegurando que en caso de desastre las operaciones puedan restaurarse en un lugar alterno y la data pueda ser recuperada. El Administrador debe tener en mente el espacio de almacenamiento fuera del Departamento de Educación en sus proyecciones de crecimiento.
04/17/2023 Page 26 of 33Documentación del SAN
Políticas de Resguardo En esta sección describimos las políticas de resguardo del Departamento de Educación.
Los resguardos diarios y en forma incremental siempre se mantiene las últimas dos versiones de los archivos resguardados. Además un archivo o directorio que es borrado por el usuario el mismo es mantenido por TSM por un periodo de 60 días. Sugerencia: Integrar en la forma de Cambio un cambo que advierta que el cambio puede afectar los servicios de resguardo. Limitar los privilegios o cantidad de personas que pueden crear directorios de los roots de los servidores por ejemplo los “Terminal Servers”.
Los resguardos diarios relacionado a la base de datos de SQL y Exchange se mantiene una cantidad de 7 versiones de resguardo.
Los resguardos semanales y/o mensuales se considera una política de retención desde un mes hasta 5 años. El Administrador de TSM utilizara una hoja para llevar o mantener registro de los resguardos realizados (ver apéndice A).
Manejo de los CartuchosEl manejo de los cartuchos se divide en dos reglones. Primer renglón cartuchos que se encuentra dentro de las librerías. El segundo renglón aquello cartuchos que son transportado a la bóveda externa (Internacional Safe Deposit).
Cartuchos de la librerías – Se saca los cartuchos diario que son LTO-Copypool y los cartucho de la base de datos (Snapshot y DBBackup) y se replaza con los cartucho que son scratch.
Luego que ya haya sacado los cartuchos de las librerías el Administrador llena el formulario (Apéndice A) y se lo entrega al personal del Centro de Computo para así llevarlo a la bóveda externa (Internacional Safe Deposit)
Como registrar los cartuchos de los resguardo Los operadores del centro de cómputos utiliza la hoja de manejo de cartuchos LTO de sistemas abierto y verifica que los cartuchos que el Administrador llena y verifica si la hoja esta correcto y la firma y le envía una copia al Administrador del backup y así se archiva para futura referencia.
1. EL Administrador anota fecha, número del cartucho y firma la hoja. Hoja de Manejo de Cartuchos LTO de sistemas abierto (ver Apéndice A).
2. El operador del Centro de Computo verifica físicamente que lo que esta anota que este correcto y firma la hoja y se le entrega una copia al Administrador de resguardo Hoja de Manejo de Cartuchos LTO de sistemas abierto (ver Apéndice A).
Hojas diarias
1. TSM Operations Daily Checklist - y se le envía una copia al Supervisor y algunos Administradores con el fin de verificar la consistencia del proceso diario y el estatus del sistema (ver Apéndice B) donde se anotan 13 pasos de los eventos ocurridos durante el proceso diario.
04/17/2023 Page 27 of 33Documentación del SAN
2. Client Backup Results TSM 16 hour Report for DE-TSM-001-A – Esta hoja es para verificar que todos los servidores halla completado o fallado el backup. La aplicación de TSM envía esta hoja a través del email a algunos de los Administradores (ver Apéndice C).
3. TSM Operations-Troubleshooting Log – Esta hoja se usa para el o los servidores que haya fallado anotar la causa porque el backup fallo y la resolución que se tomo para corregir el problema (ver Apéndice E).
Apéndice A
04/17/2023 Page 28 of 33Documentación del SAN
Apéndice B
04/17/2023 Page 29 of 33Documentación del SAN
TSM Operations - Daily Checklist
Date: _____________
Time: _____________
Backup Administrator:
Task Complete?
1. Display all active processes. Manually submit any missed jobs. Command “Q PR”.
2. Display all active sessions (backups/restores) currently running. Check for long running jobs and Investigate cause. Command “Q SE”.
3. Check to see if all client schedules executed on time. Investigate any missed or failed schedules. Run Command “Q EV * * BEGIND=TODAY-1 BEGINT=18:00 ENDD=TODAY ENDT=09:00”.
4. Check the status of the automated library. Check for a sufficient supply of scratch tapes. Run Command: select volume_name from libvolumes where status='Scratch'.
5. Check the status of your tape drives. All drives should show online. Command “Q DRIVE”.
6. Check the status of your tape paths. All tape paths should show online. Command “Q PATH”.
7. Check the status of the TSM database. Insure that the percent utilized does not exceed 90%. Add more disk when needed. Check the Cache wait percent. Any value other than 00 should be investigated. Command “Q DB F=D”
04/17/2023 Page 30 of 33Documentación del SAN
8. Display the recovery log statistics. If the percent utilized is over 75 perform a tsm database backup. Command “Q LOG F=D”.
9. Display the overall status of the TSM server. Insure that the central scheduler is active, registration is closed, and availability is enabled. Command “Q ST”.
10. Check the status of the Storage Volumes. Make sure all volumes has status = “On-line”. Command “Q VOL”.
11. Reboot Server as needed.
12. Remove cartridges from drive manually and reset all drives.
13. Clean all drives.
Apéndice C
04/17/2023 Page 31 of 33Documentación del SAN
04/17/2023 Page 32 of 33Documentación del SAN
Apéndice D
Version 6.3.0.0
TSM Operations – Troubleshooting LogCLIENT NODE NAME
BACKUP RESULT
CAUSESOLUTION
DE-SQL-001
FAILED
ANS1026E (RC136) The session is rejected: There was a communications protocol error. ACO5436E A failure occurred on stripe number (0), rc = 418
Verify the server and a full backup was performed to compensate.
04/17/2023 Page 33 of 33Documentación del SAN