Problema con Apache en Guarani3W version 262

Hola a todos.
Les escribo por un problema que se nos presenta en las inscripciones a exámenes por 3W, versión 262.
Tanto ayer como anteayer, en un momento determinado se colgó el apache.

Los usuarios no son más de 80 en simultáneo ya que todavía estamos haciendo las inscripciones por Intranet.

El apache y 3W está en un windows 2003, donde también hay un sistema de encuestas sobre las comisiones.
Informix está en otro servidor, también con 2003. La conexión la hacemos con ODBC.

Les paso los datos de logs, para ver si nos pueden ayudar.
Saludos,
Sebastián

[Tue Jul 05 18:20:06 2011] [error] [client 172.16.1.221] PHP Warning: session_destroy() [function.session-destroy]: Session object destruction failed in G:\\Apache2.2\\htdocs\\Guarani3W_262\\PHP\\www\\a_general\\finalizarSesion.php on line 9, referer: http://alumnos.unla.edu.ar/Guarani3W_262/includes/barra.inc.php

[Tue Jul 05 18:20:58 2011] [error] [client 172.16.1.100] PHP Warning: session_destroy() [function.session-destroy]: Session object destruction failed in G:\Apache2.2\htdocs\Guarani3W_262\PHP\www\a_general\finalizarSesion.php on line 9, referer: http://alumnos.unla.edu.ar/Guarani3W_262/includes/barra.inc.php

[Tue Jul 05 18:35:45 2011] [error] [client 172.16.1.100] PHP Warning: session_destroy() [function.session-destroy]: Session object destruction failed in G:\Apache2.2\htdocs\Guarani3W_262\PHP\www\a_general\finalizarSesion.php on line 9, referer: http://alumnos.unla.edu.ar/Guarani3W_262/includes/barra.inc.php

[Tue Jul 05 18:44:57 2011] [error] [client 172.16.1.152] PHP Notice: La sentencia SQL: EXECUTE PROCEDURE fecha_actual() provoc\xf3 error nro: -1 [ERROR: syntax error at or near “fecha_actual”\nLINE 1: EXECUTE PROCEDURE fecha_actual()\n ^] in G:\Apache2.2\htdocs\Guarani3W_262\PHP\www\library\std_functions.lib.php on line 49, referer: http://alumnos.unla.edu.ar/Guarani3W_262/inicial.php?auth=1

[Tue Jul 05 18:44:57 2011] [error] [client 172.16.1.152] PHP Warning: session_destroy() [function.session-destroy]: Session object destruction failed in G:\Apache2.2\htdocs\Guarani3W_262\PHP\www\a_general\finalizarSesion.php on line 9, referer: http://alumnos.unla.edu.ar/Guarani3W_262/includes/barra.inc.php

[Tue Jul 05 18:44:57 2011] [error] [client 172.16.1.152] PHP Notice: La sentencia SQL: execute procedure sp_operaciones_net(‘’,‘’,3) provoc\xf3 error nro: -1 [ERROR: syntax error at or near “sp_operaciones_net”\nLINE 1: execute procedure sp_operaciones_net(‘’,‘’,3)\n ^] in G:\Apache2.2\htdocs\Guarani3W_262\PHP\www\library\std_functions.lib.php on line 49, referer: http://alumnos.unla.edu.ar/Guarani3W_262/inicial.php?auth=1

[Tue Jul 05 18:50:37 2011] [error] [client 172.16.1.199] PHP Warning: odbc_connect() [function.odbc-connect]: SQL error: [Informix][Informix ODBC Driver]Invalid argument value., SQL state S1009 in SQLConnect in G:\Apache2.2\htdocs\Guarani3W_262\PHP\adodb\drivers\adodb-odbc.inc.php on line 60, referer: http://alumnos.unla.edu.ar/Guarani3W_262/inicial.php?auth=1

---- ACA LO REINICIAMOS PORQUE DEJO DE RESPONDER ---------------------------------------
[Tue Jul 05 18:57:24 2011] [notice] Parent: Received shutdown signal – Shutting down the server.
[Tue Jul 05 18:57:24 2011] [notice] Child 220: Exit event signaled. Child process is ending.
[Tue Jul 05 18:57:25 2011] [notice] Child 220: Released the start mutex
[Tue Jul 05 18:57:54 2011] [notice] Parent: Forcing termination of child process 432
[Tue Jul 05 18:58:01 2011] [notice] Apache/2.2.9 (Win32) PHP/5.2.5 configured – resuming normal operations
[Tue Jul 05 18:58:01 2011] [notice] Server built: Jun 13 2008 04:04:59
[Tue Jul 05 18:58:01 2011] [notice] Parent: Created child process 2212
[Tue Jul 05 18:58:01 2011] [notice] Child 2212: Child process is running
[Tue Jul 05 18:58:01 2011] [notice] Child 2212: Acquired the start mutex.
[Tue Jul 05 18:58:01 2011] [notice] Child 2212: Starting 150 worker threads.
[Tue Jul 05 18:58:01 2011] [notice] Child 2212: Starting thread to listen on port 80.

Hola Sebastian

Como están manejando las sesiones del php?
en un directorio temporal o en uno definido?
se borran las sesiones desde fuera del php?

Emilio

Hola Emilio, gracias por responder.
Las sesiones se almacenan en un directorio definido.
A que te referís con lo de borrar las sesiones desde fuera?

a borrarlas con alguna tarea programada/cron. que te borre el archivo de la sesion
si las borras antes que caduquen puede originarte problemas.

Emilio

Hola Emilio,
las sesiones no se borran por afuera.
No se hicieron modificaciones de ningún tipo en el manejo de sesiones.

Saludos
Laura

Hola a todos,
revivo este post, porque estamos teniendo problemas con el Guarani3W 262. Al momento de crear el post teníamos el Guarani3W instalado sobre un windows server 2003, en cambio ahora lo tenemos sobre un Debian Lenny 5.

En determinado momento, sin importar la cantidad de gente que esté utilizando el sistema, el apache se cuelga matando al servidor, y no nos deja otra opción que reiniciarlo (o esperar demasiado tiempo a que el propio servidor mate los procesos).
El Guarani3W lo tenemos instalado en un servidor Debian Lenny 5, y es accedido únicamente desde adentro de la universidad. Tiene instalado el PHP 5.2.6, el apache 2.2.9 y el Pdo_Informix 1.2.6.
El servidor de Informix esta instalado en un Windows Server 2003.

Cuando empieza con el cuelgue muestra lineas como estas por pantalla, varias seguidas, dejando muerto al servidor.

Nov 17 15:38:40 SVR-W3W kernel: [208376.784729] INFO: task apache2:8621 blocked for more than 120 seconds.
Nov 17 15:38:40 SVR-W3W kernel: [208376.784767] “echo 0 > /proc/sys/kernel/hung_task_timeout_secs” disables this message.
Nov 17 15:38:40 SVR-W3W kernel: [208376.784814] apache2 D ffff8101183c8da8 0 8621 3350
Nov 17 15:38:40 SVR-W3W kernel: [208376.784818] ffff8100c68adc50 0000000000000082 ffffffff802125e7 00015e89367623f2
Nov 17 15:38:40 SVR-W3W kernel: [208376.784823] ffff810111ce63c0 ffff81011d9d8440 ffff810111ce6648 000000030f194c64
Nov 17 15:38:40 SVR-W3W kernel: [208376.784826] ffffffff80248d4a 0000000000000086 0000000000000202 0000000000000202
Nov 17 15:38:40 SVR-W3W kernel: [208376.784829] Call Trace:
Nov 17 15:38:40 SVR-W3W kernel: [208376.784848] [] read_tsc+0x9/0x20
Nov 17 15:38:40 SVR-W3W kernel: [208376.784853] [] ktime_get_ts+0x22/0x4b
Nov 17 15:38:40 SVR-W3W kernel: [208376.784858] [] delayacct_end+0x7d/0x88
Nov 17 15:38:40 SVR-W3W kernel: [208376.784864] [] __mutex_lock_slowpath+0x64/0x9b
Nov 17 15:38:40 SVR-W3W kernel: [208376.784868] [] mutex_lock+0xa/0xb
Nov 17 15:38:40 SVR-W3W kernel: [208376.784872] [] do_lookup+0x82/0x1c1
Nov 17 15:38:40 SVR-W3W kernel: [208376.784878] [] __link_path_walk+0x87a/0xd05
Nov 17 15:38:40 SVR-W3W kernel: [208376.784882] [] find_lock_page+0x1f/0x8a
Nov 17 15:38:40 SVR-W3W kernel: [208376.784885] [] filemap_fault+0x1c2/0x33d
Nov 17 15:38:40 SVR-W3W kernel: [208376.784891] [] path_walk+0x46/0x8b
Nov 17 15:38:40 SVR-W3W kernel: [208376.784896] [] do_path_lookup+0x158/0x1cf
Nov 17 15:38:40 SVR-W3W kernel: [208376.784899] [] getname+0x140/0x1a7
Nov 17 15:38:40 SVR-W3W kernel: [208376.784903] [] __user_walk_fd+0x37/0x4c
Nov 17 15:38:40 SVR-W3W kernel: [208376.784908] [] vfs_lstat_fd+0x18/0x47
Nov 17 15:38:40 SVR-W3W kernel: [208376.784916] [] sys_newlstat+0x19/0x31
Nov 17 15:38:40 SVR-W3W kernel: [208376.784923] [] system_call_after_swapgs+0x8a/0x8f

No tengo idea a que se debe, ya que muchas veces llega a tener 50 personas conectadas y no tiene problemas, y a veces con 10 personas o menos se cuelga de esta manera.
Cualquier archivo de log o de configuración que pueda ayudar a entender por donde viene el problema, me avisan y lo subo.

Desde ya muchas gracias

El servidor de informix da algun aviso en el log (\informix\nombre_instancia.log ) ?
Podes enviar las lineas de los ultimos dias de ese archivo?

Hola Alejandro, gracias por responder.
No creo que haya algún tipo de aviso del Informix en el archivo de log de la instancia. Estas líneas son las que se grabaron en el momento de uno de los cortes (el corte fue aproximadamente a las 11:25/11:30, hasta las 11:57).

11:10:32 Logical Log 215 Complete.
11:10:35 Logical Log 215 - Backup Started
11:10:36 Logical Log 215 - Backup Completed
11:12:05 Logical Log 216 Complete.
11:12:05 Logical Log 216 - Backup Started
11:12:06 Logical Log 216 - Backup Completed
11:12:14 Fuzzy Checkpoint Completed: duration was 0 seconds, 39 buffers not flushed.
11:12:14 Checkpoint loguniq 217, logpos 0x17c28c

11:17:14 Fuzzy Checkpoint Completed: duration was 0 seconds, 40 buffers not flushed.
11:17:14 Checkpoint loguniq 217, logpos 0x2bb214

11:22:14 Fuzzy Checkpoint Completed: duration was 0 seconds, 42 buffers not flushed.
11:22:14 Checkpoint loguniq 217, logpos 0x3f728c

11:25:32 listener-thread: err = -951: oserr = 0: errstr = pcasadei: Incorrect password or user pcasadei is not known on the database server.

11:26:01 listener-thread: err = -951: oserr = 0: errstr = pcasadei: Incorrect password or user pcasadei is not known on the database server.

11:26:23 listener-thread: err = -951: oserr = 0: errstr = pcasadei: Incorrect password or user pcasadei is not known on the database server.

11:27:14 Fuzzy Checkpoint Completed: duration was 0 seconds, 10 buffers not flushed.
11:27:14 Checkpoint loguniq 217, logpos 0x5e11e4

11:29:15 listener-thread: err = -951: oserr = 0: errstr = rmaldo: Incorrect password or user rmaldo is not known on the database server.

11:29:32 listener-thread: err = -951: oserr = 0: errstr = rmaldo: Incorrect password or user rmaldo is not known on the database server.

11:32:14 Fuzzy Checkpoint Completed: duration was 0 seconds, 24 buffers not flushed.
11:32:14 Checkpoint loguniq 217, logpos 0x7c825c

11:37:14 Fuzzy Checkpoint Completed: duration was 0 seconds, 44 buffers not flushed.
11:37:14 Checkpoint loguniq 217, logpos 0x91431c

11:40:33 Logical Log 217 Complete.
11:40:35 Logical Log 217 - Backup Started
11:40:36 Logical Log 217 - Backup Completed
11:42:14 Fuzzy Checkpoint Completed: duration was 0 seconds, 56 buffers not flushed.
11:42:14 Checkpoint loguniq 218, logpos 0x722ec

11:44:52 listener-thread: err = -951: oserr = 0: errstr = lguida: Incorrect password or user lguida is not known on the database server.

11:47:14 Fuzzy Checkpoint Completed: duration was 0 seconds, 82 buffers not flushed.
11:47:14 Checkpoint loguniq 218, logpos 0x29840c

11:52:14 Fuzzy Checkpoint Completed: duration was 0 seconds, 84 buffers not flushed.
11:52:14 Checkpoint loguniq 218, logpos 0x46341c

11:57:14 Fuzzy Checkpoint Completed: duration was 0 seconds, 36 buffers not flushed.
11:57:14 Checkpoint loguniq 218, logpos 0x689244

12:01:09 Logical Log 218 Complete.
12:01:10 Logical Log 218 - Backup Started
12:01:11 Logical Log 218 - Backup Completed
12:02:14 Fuzzy Checkpoint Completed: duration was 0 seconds, 55 buffers not flushed.
12:02:14 Checkpoint loguniq 219, logpos 0x1053ac

Hola, te fijaste en el log del apache? los log del sistema operativo??

cuando se cuelga, queda sin funcionar el apache? o el sistema en general(SO) ?

si es el apache, probaste haciendo la conexión vía ODBC? de todas formas sería raro que sea el PDO (cosa que no creo) ya que hay instituciones acá que están funcionando con PDO y no tienen ese problema.

Marcelo

Hola Marcelo,
se cuelga el SO tratando de matar procesos (creemos). Una sola vez, despues de un rato se liberó y salió andando. Pero las dos últimas veces lo tuvimos que reiniciar a la fuerza.

Si, estuvimos viendo los logs, y aún seguimos con eso. Lo único que nos llamó la atención fue que en el archivo access.log, al momento del cuelgue, las horas de registración dejan de seguir un orden y se encuentran alternadas.
Te paso lo que te digo para que veas (el error es mas o menos 11:25 y se acomoda 11:58):

172.16.1.221 - - [08/Feb/2012:11:25:45 -0300] "GET /Guarani3W/inicial.php HTTP/1.1" 200 558 "http://alumnos.unla.edu.ar/Guarani3W/a_general/finalizarSesion.php?qs=AGpVIlIxBS0LZlcyBzgDPQVpDDwLb1FiBnBWbgdhAGdVYFZiBCRTZ1s4Vj1XY1R3BGNUBlo%2FVXMCZQAjUzBSZgBsVT1SOgViC0FXOAc%2FAzMFawxoC3tRZgZ2" "Mozilla/5.0 (Windows NT 5.1; rv:8.0.1) Gecko/20100101 Firefox/8.0.1"
172.16.1.221 - - [08/Feb/2012:11:25:45 -0300] "GET /Guarani3W/includes/encabezado.inc.php HTTP/1.1" 200 419 "http://alumnos.unla.edu.ar/Guarani3W/inicial.php" "Mozilla/5.0 (Windows NT 5.1; rv:8.0.1) Gecko/20100101 Firefox/8.0.1"
172.16.1.221 - - [08/Feb/2012:11:25:45 -0300] "GET /Guarani3W/folder.php HTTP/1.1" 200 866 "http://alumnos.unla.edu.ar/Guarani3W/inicial.php" "Mozilla/5.0 (Windows NT 5.1; rv:8.0.1) Gecko/20100101 Firefox/8.0.1"
172.16.1.221 - - [08/Feb/2012:11:25:45 -0300] "GET /Guarani3W/includes/barra.inc.php HTTP/1.1" 200 998 "http://alumnos.unla.edu.ar/Guarani3W/inicial.php" "Mozilla/5.0 (Windows NT 5.1; rv:8.0.1) Gecko/20100101 Firefox/8.0.1"
172.16.1.221 - - [08/Feb/2012:11:25:45 -0300] "GET /Guarani3W/a_general/operaciones.php HTTP/1.1" 200 949 "http://alumnos.unla.edu.ar/Guarani3W/inicial.php" "Mozilla/5.0 (Windows NT 5.1; rv:8.0.1) Gecko/20100101 Firefox/8.0.1"
172.16.2.2 - - [08/Feb/2012:11:25:53 -0300] "GET /Guarani3W/a_general/identificarse.php?qs=VjxWIQtoVHwKZ1I3X2BQblA8ATEAZFtoVyFQaAZgUDdWYwA2BSUHMw5tC2AANAckBGNQAgFkW30KbVd0UTJVYVY6Vj4LY1QzCk9SOl9gUGJQOwFtAHhbJlcmUGQGd1BuVnYAQQUwBzM%3D HTTP/1.1" 200 1402 "http://alumnos.unla.edu.ar/Guarani3W/a_general/operaciones.php" "Mozilla/5.0 (Windows NT 5.1; rv:8.0.1) Gecko/20100101 Firefox/8.0.1"
172.16.1.5 - - [08/Feb/2012:11:25:58 -0300] "POST /Guarani3W/a_alumnos/inscribirseExamen.php HTTP/1.1" 302 20 "http://alumnos.unla.edu.ar/Guarani3W/a_alumnos/elegirMesaInscExamen.php?qs=BG5UIwFiBi4NYAFkAj1RbwdrDT1YN1Z4A2ABYAc1UDcANVBhASFUbQ9iA3cCJlZiViYDbw06UjZWYAdwUjwDMQRmVDIBbQYzDTwBUgIaUUwHRA0tWGBWNwMxAWQHPFAhAGhQNgFzVGsPcQNsAjVWOlZiAz4NN1I1VnIHMVI1AzoEZFQhAW4GPw1gAToCclFmB2ANY1g6VmEDPAFgBz1QKgA1UGUBKlQ8DzMDNAJm" "Mozilla/5.0 (Windows NT 6.1) AppleWebKit/535.7 (KHTML, like Gecko) Chrome/16.0.912.77 Safari/535.7"
172.16.1.5 - - [08/Feb/2012:11:26:00 -0300] "GET /Guarani3W/notificarse.php?qs=UzBUAAV3W2ALcwNwBCFZNVNgASpaNlNIUCFRZ1NsVzhRZAcwCzlVPwE9V3RQNAUXBzACPFxiUzEGNANrByBcOVMVVGMFO1skCzUDQwRiWTpTdAE%2BWhZTN1BiUTFTY1crUWUHMQsoVTwBTFdjUD8FcQc2Ak5cZ1M9BiIDPQd1XG5TJFQyBWBbaAtoA2sEb1ltUykBbVpgUzVQYlEwU2dXJlEgB2kLblVkAWhXJVA7BSAHYAJiXCZTaQZlAyYHYFwmUz9UPQVwW2ILKgNgBCpZaVM8AWlaPlMrUCJRaFMhVyZRBAdhC39VbgFgVxhQawUkB3cCZlw7U2AGOQMxB2RceVMkVDYFcVtgCyIDNgQWWTpTZQEpWhFTRlA%2BUWVTNldhUT4HbwsoVTwBSVcEUEgFGAdEAiJcZFMyBjQDZgc8XC5TF1QQBW5bYAtzA2AEIFlhUzABKVpjU0FQZFEwU2FXMVFxB0ELTlVuAWNXOFBpBQsHZAJsXDdTYQZhAz8HbFxoUzlUdgUwW0ULNQM1BGNZOlN0AU1aE1NxUCdRclM%2FV29RCwdlC3VVbgFgVzRQaAVxBzYCS1wQU0AGRgMAB0BcWVMZVH4FTltAC1UDXwQdWS1TYwFOWmJTNVBjUTJTdFdBURcHbQtoVXwBbFcOUGMFLAdkAmJcM1NrBiEDYQdBXD1TZlRjBTJbLAsxAzcEYFktUxABT1o8U2lQM1FtUzBXZFE7ByULPlVLAT9XdFBHBRcHcQJmXCZTagZbAzsHa1x4UzVUIQVqW3ELZANsBD1ZZlN0AT9aFFNJ HTTP/1.1" 200 1078 "http://alumnos.unla.edu.ar/Guarani3W/a_alumnos/elegirMesaInscExamen.php?qs=BG5UIwFiBi4NYAFkAj1RbwdrDT1YN1Z4A2ABYAc1UDcANVBhASFUbQ9iA3cCJlZiViYDbw06UjZWYAdwUjwDMQRmVDIBbQYzDTwBUgIaUUwHRA0tWGBWNwMxAWQHPFAhAGhQNgFzVGsPcQNsAjVWOlZiAz4NN1I1VnIHMVI1AzoEZFQhAW4GPw1gAToCclFmB2ANY1g6VmEDPAFgBz1QKgA1UGUBKlQ8DzMDNAJm" "Mozilla/5.0 (Windows NT 6.1) AppleWebKit/535.7 (KHTML, like Gecko) Chrome/16.0.912.77 Safari/535.7"
172.16.1.5 - - [08/Feb/2012:11:26:04 -0300] "GET /Guarani3W/a_alumnos/elegirCarrera.php?qs=UTtRJlIxU3tdMFI3X2BXaVA8ATFaNVN9BGdXNgMxUjUANVNiAyNSZghrB2wFMQQnVzBRAwFkUXcEY1p5UzBcaFE9UTlSOlM0XRhSOl96V2VQIAFlWiBTZgRvVyMDR1I2AGtTfwNkUiMIYQd5BTIEOFcwUTI%3D HTTP/1.1" 302 20 "http://alumnos.unla.edu.ar/Guarani3W/a_general/operaciones.php" "Mozilla/5.0 (Windows NT 6.1) AppleWebKit/535.7 (KHTML, like Gecko) Chrome/16.0.912.77 Safari/535.7"
172.16.1.221 - - [08/Feb/2012:11:26:24 -0300] "GET /Guarani3W/ HTTP/1.1" 200 558 "-" "Mozilla/5.0 (Windows NT 5.1; rv:8.0.1) Gecko/20100101 Firefox/8.0.1"
172.16.1.221 - - [08/Feb/2012:11:27:06 -0300] "GET /Guarani3W/includes/barra.inc.php HTTP/1.1" 200 995 "http://alumnos.unla.edu.ar/Guarani3W/" "Mozilla/5.0 (Windows NT 5.1; rv:8.0.1) Gecko/20100101 Firefox/8.0.1"
10.6.0.139 - - [08/Feb/2012:11:32:20 -0300] "POST /Guarani3W/a_general/autentificarse.php?qs=B21XIFAzVn5YNVA1U2xQbgRoUWFYPFFiUyVbYwRiUjUEMVNl HTTP/1.1" 302 20 "http://alumnos.unla.edu.ar/Guarani3W/a_general/identificarse.php?qs=UzkCdQJhUXlaNwZjAD9WaFc7VGRfOwAzBXMHPwdhXToEMVVjCytRZVw%2FUTpeagQnAWYFVw5rBiAGYQMgVTZVYVM%2FAmoCalE2Wh8GbgA%2FVmRXPFQ4XycAfQV0BzMHdl1jBCRVFAs%2BUWU%3D" "Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 5.1)"
10.6.0.139 - - [08/Feb/2012:11:33:24 -0300] "GET /Guarani3W/notificarse.php?fStatus=-8261 HTTP/1.1" 200 329 "http://alumnos.unla.edu.ar/Guarani3W/a_general/identificarse.php?qs=UzkCdQJhUXlaNwZjAD9WaFc7VGRfOwAzBXMHPwdhXToEMVVjCytRZVw%2FUTpeagQnAWYFVw5rBiAGYQMgVTZVYVM%2FAmoCalE2Wh8GbgA%2FVmRXPFQ4XycAfQV0BzMHdl1jBCRVFAs%2BUWU%3D" "Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 5.1)"
172.16.2.2 - - [08/Feb/2012:11:26:09 -0300] "POST /Guarani3W/a_general/autentificarse.php?qs=A2kAd1c0UnpbNgFkBTpQblc7AzMNaQY1A3UAOAZgAGcEMQcx HTTP/1.1" 500 20 "http://alumnos.unla.edu.ar/Guarani3W/a_general/identificarse.php?qs=VjxWIQtoVHwKZ1I3X2BQblA8ATEAZFtoVyFQaAZgUDdWYwA2BSUHMw5tC2AANAckBGNQAgFkW30KbVd0UTJVYVY6Vj4LY1QzCk9SOl9gUGJQOwFtAHhbJlcmUGQGd1BuVnYAQQUwBzM%3D" "Mozilla/5.0 (Windows NT 5.1; rv:8.0.1) Gecko/20100101 Firefox/8.0.1"
172.16.2.71 - - [08/Feb/2012:11:31:48 -0300] "GET / HTTP/1.1" 302 - "-" "check_http/v1991 (nagios-plugins 1.4.12)"
172.16.2.71 - - [08/Feb/2012:11:32:36 -0300] "GET / HTTP/1.1" 302 - "-" "check_http/v1991 (nagios-plugins 1.4.12)"
172.16.2.71 - - [08/Feb/2012:11:30:36 -0300] "GET / HTTP/1.1" 302 - "-" "check_http/v1991 (nagios-plugins 1.4.12)"
172.16.1.116 - - [08/Feb/2012:11:58:02 -0300] "GET /Guarani3W/a_general/identificarse.php?qs=CGJUIwtoWnIBbAtuX2BTbQRoBjZdOQAzBnADOwRiVTIEMVBmACAGMgppVT5VYVR3Cm1XBVs%2BVXNRNlV2UTJUYAhkVDwLY1o9AUQLY19gU2EEbwZqXSUAfQZ3AzcEdVVrBCRQEQA1BjI%3D HTTP/1.1" 200 1405 "http://alumnos.unla.edu.ar/Guarani3W/a_general/operaciones.php" "Mozilla/5.0 (Windows NT 5.1; rv:8.0.1) Gecko/20100101 Firefox/8.0.1"
172.16.1.116 - - [08/Feb/2012:11:58:02 -0300] "GET /Guarani3W/a_general/identificarse.php?qs=CGJUIwtoWnIBbAtuX2BTbQRoBjZdOQAzBnADOwRiVTIEMVBmACAGMgppVT5VYVR3Cm1XBVs%2BVXNRNlV2UTJUYAhkVDwLY1o9AUQLY19gU2EEbwZqXSUAfQZ3AzcEdVVrBCRQEQA1BjI%3D HTTP/1.1" 200 1408 "http://alumnos.unla.edu.ar/Guarani3W/a_general/operaciones.php" "Mozilla/5.0 (Windows NT 5.1; rv:8.0.1) Gecko/20100101 Firefox/8.0.1"
172.16.2.12 - - [08/Feb/2012:11:58:16 -0300] "GET /Guarani3W/a_general/identificarse.php?qs=VD4Ad1Y1W3NdMFUwXmEHOVE9DDwOalNgAHYEPABmXToCN1NlVnZVYVo5CmFSZlh7BmECUAlsV3EEY1V2UjFSZlQ4AGhWPls8XRhVPV5hBzVROgxgDnZTLgBxBDAAcV1jAiJTElZjVWE%3D HTTP/1.1" 200 1407 "http://alumnos.unla.edu.ar/Guarani3W/a_general/operaciones.php" "Mozilla/5.0 (Windows NT 5.1; rv:8.0.1) Gecko/20100101 Firefox/8.0.1"

Hola, pareceria que es un error de kernel, que salta con el apache, tambien podria ser algún error de hard, te consulto, es el mismo server que tiraba cuando estaba funcionando con win y tambien se colgaba?

que dice el dmesg y el ken.log?

Marcelo

Hola Marcelo, gracias por responder.
Contestando a tu pregunta, si, es el mismo server donde estaba instalado el windows server 2003. La diferencia es que en el windows se colgaba únicamente el apache, se lo reiniciaba y andaba todo bien.

Adjunto los archivos dmesg y kern.log del momento del cuelgue.

Saludos


logs.rar (23.4 KB)

Hola, viendo el log del kernel veo lo siguiente:

Feb 10 11:51:40 SVR-W3W kernel: [182043.955634] Swap cache: add 1473700, delete 1473700, find 401580/402731 Feb 10 11:51:40 SVR-W3W kernel: [182043.955636] Free swap = 0kB Feb 10 11:51:40 SVR-W3W kernel: [182043.955637] Total swap = 5855652kB Feb 10 11:51:40 SVR-W3W kernel: [182043.982570] 1048575 pages of RAM Feb 10 11:51:40 SVR-W3W kernel: [182043.982570] 32679 reserved pages Feb 10 11:51:40 SVR-W3W kernel: [182043.982570] 28851 pages shared Feb 10 11:51:40 SVR-W3W kernel: [182043.982570] 0 pages swap cached Feb 10 11:51:40 SVR-W3W kernel: [182043.982570] Out of memory: kill process 3383 (apache2) score 78415 or a child Feb 10 11:51:40 SVR-W3W kernel: [182043.982570] Killed process 3419 (apache2)

se queda sin memoria en el swap y luego mata al proceso del apache, como andas de memoria? como esta configurado las particiones en linux, tamaños, etc?

otra cosa, podria ser que haya algún ataque por denegación de servicios(aunque dijiste que es una intranet, pero miralo por las dudas), fijate en auth.log, si hay algo raro…
tambien con el comando top de linux, fijate como se comporta el apache con la memoria y procesador en cuanto a consumo…

Otra cosa que me llama la atención es que en el log anterior la caida es el 8 de febrero y en el kern.log sucede el 10 de febrero…
y en el 1er log, sucedió en noviembre del año pasado…

Marcelo

Perdón Marcelo, el primer log que puse es de un cuelgue viejo, similar a lo que ocurrió el 8 de febrero. Y el tema con el 10 de febrero es que también se colgó en esa fecha. Los cuelgues en esa semana de inscripció fueron el 8 y el 10 de febrero.
Ahora voy a mirar lo que me dijiste

El único sistema que estaba corriendo en el servidor durante la última inscripción era el Guarani3W. El servidor tiene 4Gb de Ram, y el swap mas de 5. No debería quedarse sin memoria, ya que una de las veces que se colgó había poca gente inscribiendose. Pareciera como que no se terminan de liberar las conexiones…
Ahora la función top no muestra resultados relevantes, porque no es época de inscripciones y el apache casi que no consume memoria.
Las particiones son las siguientes:

[tr][td]Disposit[/td][td]Inicio[/td][td]Comienzo[/td][td]Fin[/td][td]Bloques[/td][td]Id[/td][td]Sistema[/td][/tr]
[tr][td]/dev/cciss/c0d0p1[/td][td]*[/td][td]1[/td][td]17111[/td][td]137444076[/td][td]83[/td][td]Linux[/td][/tr]
[tr][td]/dev/cciss/c0d0p2[/td][td][/td][td]17112[/td][td]17840[/td][td]5855692+[/td][td]5[/td][td]Extendida[/td][/tr]
[tr][td]/dev/cciss/c0d0p5[/td][td][/td][td]17112[/td][td]17840[/td][td]5855661[/td][td]82[/td][td]Linux swap / Solaris[/td][/tr]

En auth.log no hay nada raro, asi que no debería ser por un ataque por denegación de servicios

Hola, Si habría que ver por qué se llena el swap y luego mata al apache, que lo está causando, hacer un análisis bien exhausto cuando estén en inscripciones, siguiendo con el comando top los procesos en sus consumos de memoria y cpu, no solo el apache, podría ser otro proceso que llena el área de intercambio y la memoria y por supuesto viendo los logs.

Marcelo

Hola,
les escribo porque empezamos con las inscripciones a comisiones y está muy lento.
Les adjunto sentencias ejecutadas en Infromix, porque a mí me cuesta conectarme desde el sql editor.

Otra consulta, dependiendo de la memoria que tengo, como calculo la cantidad de hilos que puedo llegar a tener en 3W?

Gracias
Laura


datos informix 20120319.txt (17.4 KB)

Laura, las sesiones estan bien, fijate que todas tienen el flag Y, es decir que estan esperando por una proxima consulta…
El problema de lentitud se da solo cuando se establece la conexión a la base, asi que el problema esta alli entre el servidor web y el servidor de informix.

ok, dónde es que me dijiste que m efije en debian?
en windows está el servidor de 3W en el host

Fijate en el directorio /opt/informix , archivo sqlhosts

Debería tener la conexion como la siguiente:
nombre_instancia_ifx protocolo_conexion numero_ip_servidor puerto

Ejemplo:
ol_guarani olsoctcp 192.170.220.1 1526