Post on 05-Mar-2018
-----------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------
--------------------------------
Module 13: Monitoring Windows Server 2012
-----------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------
--------------------------------
Monitorizacion de windows server 2012 R2
Cuando vamos a monitorizar W2K12 R2 tenemos varias herramientas que vienen con el sistema operativo y
herramientas de microsoft o de terceros adicionales que podemos usar.
Aquí solo veremos las que vienen con el sistema operativo. Otras como System center, son recomendadas cuando
tenemos que monitorizar mas de 100 servidores.
De estas herramientas, distinguimos 2 grupos:
- Herramientas de monitorizacion en tiempo real: Nos permiten diagnosticar fallos puntuales y cuellos de
botella.
- Herramientas de monitoriazcion en diferido: Recopilan informacion de rendimiento y la almacenan para
analizarla despues. Nos permiten obtener lineas de base (Baseline) para luego analizar tendencias. Este
analisis de tendencias es fundamental para un mantenimiento proactivo
Herramientas de motirorizacion:
Integradas con el sistema operativo tenemos las sisguientes herramientas de monitorizacion:
- Administrador de tareas
- Monitor de rendimiento (Performace monitor)
- Monitor de recursos (Resource monitor)
- Monitor de fiabilidad
- Visor de eventos
- Server manager
4 subsistemas basicos:
- CPU
- Memoria
- Disco (en la pestaña performance Resource monitor)
- Red
Administrador de tareas:
No permite guardar informacion para un analisis posterior. Se usa para diagnostico de fallos puntuales: el equipo va
muy lento, el disco duro no deja trabajar, la red esta saturada….
Nos permite ver los procesos que estan en ejecucion, la cantidad de CPU que utilizan en un instante determinado y
la cantidad de RAM que usan. Podemos agrupar estos procesos por usuarios. Tambien podemos finalizar un proceso.
Nos da detalles de los procesos.
En cuanto a servicios, podemos ver los que estan en ejecucion, pararlos y reiniciarlos.
Podemos cambiar prioridad de los procesos
Con la afinidad le indicamos al proceso que procesador va a utilizar siempre que se ejecute
Monitor de Recursos (Resource Monitor) :
Es otra herramienta que incluye el sistema operativo
Es una herramienta para analisis y diagnostico de fallos en tiempo real, no es valida para analizar tendencias porque
nos permite recopilar datos de los subsistemas.
Incluye mas detalles que el task manager y tambien nos da informacion sobre el subsistema de discos.
Marcando un proceso nos muestra la lectura y escritura uso de la red y de memoria
Desde la pestaña CPU podemos ver las librerias asociadas y los manejadores (Handles)
Se pueden finalizar tareas y tareas en arbol
Monitor de rendimiento (Performance Monitor):
Perfmon.msc
Tambien viene incluido en el sistema operativo y nos permite monitorizar en 2 modalizades:
- Tiempo real
- Diferido
Incluye cientos de contadores que podemos usar para analizar cualquier aspecto del sistema
Hay cientos de contadores para todo
Los mas importantes:
Procesador:
- % Procesor time: Porcentaje de uso del procesador en general por todos los procesos. No deberia
superar el 85%
- Interrupts/sec: Nos indica el numero de interrupciones hardware por segundo que llegan al procesador.
- Processor Queue Length: Indica el numero de procesos que estan a la espera de ser atendidos. Si el
numero de procesos en cola es mas del doble de procesos durante un tiempo largo, deberiamos ampliar
con mas capacidad de proceso. Esta en el submenu System
Memoria:
- Pages/sec: Un valor muy elevado indica paginacion excesiva y es necesario ampliar el equipo con mas
memoria. No deberia superar el valor 1000. Por encima de ese valor empiezan a prodicirse memory
leaks (fallos).
Disco:
- Physical disk > % Disk Time: Cuanto mas cerca esté este valor de 100, mas se vera afectado el sistema.
- Avg. Disk Queue Length: Se considera un valor elevado cuando es mas del doble de los spindles (disco
fisico) que tiene el sistema.
Red:
- Current bandwidth: Nos indica el archo de banda real de la tarjeta de red. Esta en Network interface.
- Bytes total/sec: bytes total enviados/recibidos
- Output queue length: cola de procesos esperando a ser enviados
Contadores basicos
contadores.htm
Monitor de fiabilidad (Reliability Monitor):
Nos da un marcador “estabilidad” del sistema que va de 1 a 10. El 1 es el menos estable y 10 es un sistema
completamente estable.
Analiza los errores que se producen, servicios que se paran, reinicios no planificados…
Nos da opciones como:
- Historico de estabilidad
- Posibles soluciones a los problemas detectados
Visor de eventos:
Es una forma de analizar en detalle los errores que se producen en un sistema o en un servicio es el log de eventos.
Por defecto, los eventos que aparecen en los logs son los de la maquina local.
Si queremos recopilar eventos de otras maquinas, podemos utilizar los event Subcriptions. Al definir las
suscripciones, tendremos una maquina que es el colector, que recoge la informacion de los suscriptores.
En el colector es imprescindible habilitar el servicio de colector de eventos. La primera vez que pulsas en
subcriptions te pide activar el servicio pero se puede activar desde la consola de servicios o por comandos.
En los suscriptores necesitamos tener habilitada la gestion remota y que el equipo colector este en el grupo de
administradores locales del suscriptor
Configuracion en el equipo externo para reenviar los eventos
Activamos la gestion remota
winrm qc
y añadimos al grupo de administradores al recolector
Con esto ya estaria
Para filtar mejor creariamos una vista personalizada
Lineas de base y alertas de monitorizacion:
El objetivo principal de la monitorizacion es detectar posibles problemas en los sistemas antes de que afecten a los
usuarios.
Si afecta un problema a un usuario, debemos tener en cuanta los SLA (Service Leven Agreement).
Con una monitorizacion proactiva podemos saber si se esta degradando un sistema y podria provocar incidentes en
el futuro.
Para esto necesitamos:
- La linea de base: Metricas de los contadores (CPU, RAM, Disco, Red) Cuando esta funcionando en
condiciones optimas. Se usa para comparar con las mismas metricas tomadas en otros instantes
temporales y poder analizar tendencias (Trend Analysis).
- Alertas: Establecemos umbrales para los contadores mas importantes, de forma que cuando se superen,
se genere una alerta mediante un evento en el log, un mensaje de red o la ejecucion de un script
Hay multitud de sistemas de monitorizacion:
- System Center
- Nagios
- Pandora FMS
Pero windows server 2012 R2 incluye un sistema de monitorizacion basico: Performance Monitor con DCS (Data
Collector Set).
Vamos a crear un DCS
Testlimit –d –c cantidad de memoria en Mb que queremos ocupar
Ahora vamos a crear un DCS con alerta
Para cambiar la accion de la alerta hay que ir las propiedades de la alerta
Aquí vemos el aviso que ha dejado en el visor de eventos
Para que realice alguna accion hay que configurar una tarea en el programador de tareas