Problema: servidor amanece colgado

Gente:

Ya van un par de días que aparentemente el servidor se “cuelga” en algún momento de la noche o madrugada.

Tengo una tarea programada que hace el export a las 3 de la mañana, y previo al export baja el motor y lo vuelve a subir y hasta ahí todo bien. Pero a las 9 de la mañana cuando la encargada de monitorerarlo lo ve, está colgado.

El log no dice nada, solo registra el rebooteo. Pego los registros más abajo. Los logical logs no están llenos, tengo una tarea programada que hace el ontape para backupearlos 1 vez por día y con eso alcanza.

Estamos en epoca de inscripciones a cursada, no sé si tendrá que ver.

Se les ocurre que puede estar pasando??

Saludos

Gustavo

El log:
03:05:01 Shutdown Mode
03:05:02 Quiescent Mode
03:05:03 On-Line Mode
03:05:49 Fuzzy Checkpoint Completed: duration was 0 seconds, 16 buffers not flushed.
03:05:49 Checkpoint loguniq 2549, logpos 0x481fc

09:05:13 Informix Dynamic Server 2000 Started.

Fri Mar 15 09:05:13 2013

09:05:13 Booting Language from module <>
09:05:13 Loading Module
09:05:13 Booting Language from module <>
09:05:13 Loading Module
09:05:18 Informix Dynamic Server 2000 Version 9.21.TC4 Software Serial Number AAD#J113368
09:05:18 Informix Dynamic Server 2000 Initialized – Shared Memory Initialized.

09:05:18 Physical Recovery Started at Page(3:51361).
09:05:44 Physical Recovery Complete: 0 Pages Examined 0 Pages Restored.

09:05:45 Logical Recovery Started.
09:05:45 10 recovery worker threads will be started.
09:05:45 Fast Recovery Switching to Log 2549
09:05:47 Logical Recovery Complete.
754 Committed, 0 Rolled Back, 0 Open, 0 Bad Locks

09:05:48 Dataskip is now OFF for all dbspaces
09:05:48 Init operation complete - Mode Online
09:05:48 On-Line Mode
09:05:49 Checkpoint Completed: duration was 0 seconds.
09:05:49 Checkpoint loguniq 2549, logpos 0x49018

09:05:54 Booting Language from module <>
09:05:54 Loading Module
09:11:17 Fuzzy Checkpoint Completed: duration was 0 seconds, 5 buffers not flushed.
09:11:17 Checkpoint loguniq 2549, logpos 0x5a0ec

09:16:18 Fuzzy Checkpoint Completed: duration was 0 seconds, 10 buffers not flushed.
09:16:18 Checkpoint loguniq 2549, logpos 0xa010c

09:17:05 Logical Log 2515 - Backup Started
09:17:06 Logical Log 2515 - Backup Completed
09:17:06 Logical Log 2516 - Backup Started
09:17:06 Logical Log 2516 - Backup Completed
09:17:06 Logical Log 2517 - Backup Started
09:17:07 Logical Log 2517 - Backup Completed
09:17:07 Logical Log 2518 - Backup Started
09:17:08 Logical Log 2518 - Backup Completed
09:17:08 Logical Log 2519 - Backup Started
09:17:08 Logical Log 2519 - Backup Completed
09:17:08 Logical Log 2520 - Backup Started
09:17:09 Logical Log 2520 - Backup Completed
09:17:09 Logical Log 2521 - Backup Started
09:17:10 Logical Log 2521 - Backup Completed
09:17:10 Logical Log 2522 - Backup Started
09:17:10 Logical Log 2522 - Backup Completed
09:17:10 Logical Log 2523 - Backup Started
09:17:10 Logical Log 2523 - Backup Completed
09:17:10 Logical Log 2524 - Backup Started
09:17:11 Logical Log 2524 - Backup Completed
09:17:11 Logical Log 2525 - Backup Started
09:17:12 Logical Log 2525 - Backup Completed
09:17:12 Logical Log 2526 - Backup Started
09:17:12 Logical Log 2526 - Backup Completed
09:17:12 Logical Log 2527 - Backup Started
09:17:12 Logical Log 2527 - Backup Completed
09:17:12 Logical Log 2528 - Backup Started
09:17:13 Logical Log 2528 - Backup Completed
09:17:13 Logical Log 2529 - Backup Started
09:17:15 Logical Log 2529 - Backup Completed
09:17:15 Logical Log 2530 - Backup Started
09:17:15 Logical Log 2530 - Backup Completed
09:17:15 Logical Log 2531 - Backup Started
09:17:15 Logical Log 2531 - Backup Completed
09:17:15 Logical Log 2532 - Backup Started
09:17:16 Logical Log 2532 - Backup Completed
09:17:16 Logical Log 2533 - Backup Started
09:17:17 Logical Log 2533 - Backup Completed
09:17:17 Logical Log 2534 - Backup Started
09:17:17 Logical Log 2534 - Backup Completed
09:17:17 Logical Log 2535 - Backup Started
09:17:18 Logical Log 2535 - Backup Completed
09:17:18 Logical Log 2536 - Backup Started
09:17:18 Logical Log 2536 - Backup Completed
09:17:18 Logical Log 2537 - Backup Started
09:17:19 Logical Log 2537 - Backup Completed
09:17:19 Logical Log 2538 - Backup Started
09:17:20 Logical Log 2538 - Backup Completed
09:17:20 Logical Log 2539 - Backup Started
09:17:21 Logical Log 2539 - Backup Completed
09:17:21 Logical Log 2540 - Backup Started
09:17:21 Logical Log 2540 - Backup Completed
09:17:21 Logical Log 2541 - Backup Started
09:17:22 Logical Log 2541 - Backup Completed
09:17:22 Logical Log 2542 - Backup Started
09:17:22 Logical Log 2542 - Backup Completed
09:17:22 Logical Log 2543 - Backup Started
09:17:23 Logical Log 2543 - Backup Completed
09:17:23 Logical Log 2544 - Backup Started
09:17:23 Logical Log 2544 - Backup Completed
09:17:23 Logical Log 2545 - Backup Started
09:17:24 Logical Log 2545 - Backup Completed
09:17:24 Logical Log 2546 - Backup Started
09:17:24 Logical Log 2546 - Backup Completed
09:17:24 Logical Log 2547 - Backup Started
09:17:25 Logical Log 2547 - Backup Completed
09:17:25 Logical Log 2548 - Backup Started
09:17:26 Logical Log 2548 - Backup Completed
09:17:30 Logical Log 2549 - Backup Started
09:17:30 Logical Log 2549 - Backup Completed
09:17:30 Logical Log 2549 Complete.
09:21:17 Fuzzy Checkpoint Completed: duration was 0 seconds, 13 buffers not flushed.
09:21:18 Checkpoint loguniq 2550, logpos 0x4b154

09:26:17 Fuzzy Checkpoint Completed: duration was 0 seconds, 14 buffers not flushed.
09:26:17 Checkpoint loguniq 2550, logpos 0x5a164

Hola Gustavo

Cuantos logical logs tenés?
Se cuelga solo el informix?

Emilio

Emilio:

Gracias por contestar. Tengo 40 logical logs de 5 MB. Es algo raro: hay momentos que se cuelga el servidor y el Informix sigue respondiendo, otros que se cuelga el Informix pero el servidor funciona y en otros se cuelga todo. Se reinicia y todo funciona nornalmente. El viernes por la tarde se colgó cuando disparé varios procesos con el Winrar para comprimir carpetas de exports.

El viernes limpié un montón de cosas de los archivos del disco, desfragmenté las 2 particiones del disco (estaban muy fragmentadas), y estuve usando un montón el servidor. Como hasta la 1:00 de la mañana. A las 3:00 el motor se bajó y levantó, hizo el export y en algún momento del día sábado se colgó. Hoy lo encontraron colgado. Recomendé que pararan el servidor y lo revisaran.

Lo limpiaron todo, parece que tenía mucha mugre. Pero todo funcionaba aparentemente en forma normal. Ahora está funcionando desde las 16, creo que no se colgó. Se me hace que es un problema de hardware o de Windows, no del motor.

Veremos como va.

Saludos

Gustavo

Hola Gustavo

Preguntaba porque el backup se hizo a las 9:17 y no a las 3 de la mañana.
Eso mas apuntaba a un sistema operativo colgado que a un informix colgado.

Y una buena limpieza no le viene mal. Dejar lo estrictamente necesario. El resto fuera.
Por ahi un disco lleno en donde está el directorio temporario del sistema operativo.

Emilio

Emilio:

Le hicieron una limpieza de mugre. La limpieza del disco la hice yo, aunque no era para nada necesaria. Tenía más del 80% libre en cada partición.

Revisaron todo el hard: mother, memoria, etc.

Lo unico que detectaron es algún problema que acusó con el Raid en el momento de encender.

ES una maquina comprada en el 2010 que costó muchísimo instalarle el Windows 2003, ya que todos los drivers para ese SOse ve que tenían problema con el hard.

En primera instancia se le había instalado Windows 2008 pero no pudimos instalar el Informix 9.21 en el 2008. En realidad se instalaba pero después había problemas con la consola del Informix. Por eso se decidió instalar el 2003.

Veremos como funciona estos días y te cuento.

Saludos

Gustavo