generación de archivos tmpshmem

Despues de un momento de panico, levanto Ciencias
o sea, vamos a monitorear como funciona con esta nueva definicion de tamaño de estas variables
Nos queda por resolver porque se llenan los chunk y como salir del modo quiesent

la felicidad duro poco
a las 17:55 se rompio literalmente el servidor de Ciencias, al que le habiamos modificado los parametros

resultado de onstat - d
dba@serverciencias:~$ onstat -d

Informix Dynamic Server 2000 Version 9.21.UC4 – On-Line – Up 02:28:44 – 1277412 Kbytes

Dbspaces
address number flags fchunk nchunks flags owner name
1ad5d7d0 1 0x1 1 1 N informix rootdbs
1ad9ce28 2 0x5 6 2 ND informix dbspacecseduca
1ad5da88 3 0x2001 3 2 N T informix dbspacetemporal
1ad5dbd0 4 0x1 4 2 N informix dbs_phy
1ad5dd18 5 0x1 5 2 N informix dbspacelogs
5 active, 2047 maximum

Chunks
address chk/dbs offset size free bpages flags pathname
1ad5d918 1 1 0 400000 397724 PO- /usr/data/chunk_siu
1ad9c2a8 2 4 0 1024288 1024285 PO- /usr/data/chunk_phy2
1ad9c418 3 3 0 262144 262091 PO- /usr/data/chunk_temp
1ad9c588 4 4 0 51200 0 PO- /usr/data/chunk_phy
1ad9c6f8 5 5 0 204800 27 PO- /usr/data/chunk_logs
1ad9c868 6 2 0 1024288 0 PD- /usr/data/chunk_ciencias
1ad9c9d8 7 3 0 1024288 1024285 PO- /usr/data/chunk_temp2
1ad9cb48 8 5 0 1024288 1024285 PO- /usr/data/chunk_logs2
1ad9ccb8 9 2 0 1024288 0 PD- /usr/data/chunk_ciencias2
9 active, 2047 maximum

literalmente se queda sin espacio en los dbspace.

Sandra, para entender un poco la situacion en la que estan:
¿Que procesos se estan corriendo?
¿Estan en períodos de inscripción a cursadas?
¿Estan los alumnos respondiendo encuestas?
¿Estan corriendo procesos masivos? (detección de posibles egresados, Araucano, procesamiento de inscripciones pendientes, etc…)

¿Cuanto espacio libre tenian esos chunks?
Supongo que en la columna free esos dos chunks muestra 0 porque el dbspaces no esta activo, no se si realmente estan vacios esos chunks.

¿Podes enviar el log que genera informix para ver si podemos encontrar porque el dbspace se cae?
INFORMIXDIR/tmp/online.log

¿Lograron ver que tablas son las que estan creciendo en volumen?

Si ejecutas el onstat -a y lo envias a un archivo, podes adjuntarlo a este mensaje?

Hola, me sumo tarde pero tiro algunas ideas que por ahi aportan

Para los chunks que se llenan, sugieron correr el reporte oncheck -pe, que genera un reporte larguisimo con todas las tablas que hay grabadas en los chunks. busquen en ese reporte, los chunks que estan llenos, y traten de identificar que tablas se crearon, o que tablas aparecen con mayor frecuencia. Una tabla puede aparecer varias veces en este reporte, ya que las tablas se van creando por partes a medida que van creciendo (esas partes se llaman extents) y este reporte justamente muestra todos los extents.

Hagan backup de todo lo que puedan, he visto en varios de los mensajes que algunos chunks aparecen con la letra “D” . esa D significa que informix, por algun motivo marco el chunk como “Down” y no lo va a usar mas. No hay forma de pasar un chunk Down a Online, solo restaurando un backup o llamando al soporte de Informix (que no todos lo tienen vigente)

Coincido con Ale, hay que mirar el online.log, o la carpeta /tmp si hay algun archivo “assert failed” para determinar la causa del problema. A veces un simple problema de permisos, hace que Informix marque el chunk como Down.

Por otro lado tratar de identificar cual es la razon o la tabla que llena el CHUNK

saludos
Ignacio

Buenos dias,
respondo lo consulado
¿Que procesos se estan corriendo?
RTA= ninguno en particular

¿Estan en períodos de inscripción a cursadas?
RTA= si, ademas en periodos de examenes y con presincricpciones. La peor epoca.

¿Estan los alumnos respondiendo encuestas?
RTA= no las encuestas se vencieron el 1 de junio.

¿Estan corriendo procesos masivos? (detección de posibles egresados, Araucano, procesamiento de inscripciones pendientes, etc…)
RTA= los docentes estan cargando notas de cursados y de examenes. Eso antes no lo hacian.

¿Cuanto espacio libre tenian esos chunks?
Supongo que en la columna free esos dos chunks muestra 0 porque el dbspaces no esta activo, no se si realmente estan vacios esos chunks.
RTA= mi interpretacion era que se quedaba sin espacio porque lo veia en cero. Entonces mi solucion era agregar otro chunk, Veo que nunca fue una solucion y por eso en vez de solucionar el problema lo unico que haciamos era postergarlo. De ahi que levantemos las bases con backups y se nos caigan a los dos dias.
Envio los datos solicitados.

¿Podes enviar el log que genera informix para ver si podemos encontrar porque el dbspace se cae?
INFORMIXDIR/tmp/online.log

¿Lograron ver que tablas son las que estan creciendo en volumen?

Si ejecutas el onstat -a y lo envias a un archivo, podes adjuntarlo a este mensaje?


datos_ciencias.zip (866 KB)

10:52:03 Informix Dynamic Server 2000 Version 9.21.UC4
10:52:03 Who: Session(7, root@siuconversion, 0, 450389800)
Thread(29, fast_rec, 1ad577d8, 3)
File: rspartn.c Line: 5233

10:52:03 Results: Cannot Open DBspace 2.
10:52:03 Action: Restore chunk from archive.
10:52:03 stack trace for pid 2081 written to /tmp/af.405a683
10:52:03 See Also: /tmp/af.405a683, shmem.405a683.0
10:52:04 Assert Failed: Chunk 2 is being taken OFFLINE.
10:52:04 Informix Dynamic Server 2000 Version 9.21.UC4
10:52:04 Who: Session(7, root@siuconversion, 0, 450389800)
Thread(29, fast_rec, 1ad577d8, 3)
File: rsmirror.c Line: 1824
10:52:04 Results: Dynamic Server 2000 will block at next checkpoint
10:52:04 Action: Shutdown (onmode -k) or override (onmode -O)
10:52:04 stack trace for pid 2081 written to /tmp/af.405a683
10:52:04 See Also: /tmp/af.405a683
10:52:04 Assert Failed: pthdrpage:ptalloc:bad bfget
10:52:04 Informix Dynamic Server 2000 Version 9.21.UC4
10:52:04 Who: Session(7, root@siuconversion, 0, 450389800)
Thread(29, fast_rec, 1ad577d8, 3)
File: rspartn.c Line: 5267
10:52:04 Results: Cannot use TBLSpace page for TBLSpace 2097153
10:52:04 Action: Run ‘oncheck -pt 2097153’
10:52:04 stack trace for pid 2081 written to /tmp/af.405a683
10:52:04 See Also: /tmp/af.405a683
10:52:04 Cannot Open DBspace 2.
10:52:04 Physical Recovery Complete: 0 Pages Examined 0 Pages Restored.

10:52:04 Logical Recovery Started.
10:52:04 10 recovery worker threads will be started.
10:52:07 Logical Recovery Complete.
0 Committed, 0 Rolled Back, 0 Open, 0 Bad Locks

10:52:08 Dataskip is now OFF for all dbspaces
10:52:08 On-Line Mode
10:52:08 Checkpoint blocked by down space, waiting for override or shutdown
11:11:34 Informix Dynamic Server 2000 Stopped.

Fijate de correr ese oncheck que menciona en el log.
Verificaste si hay sectores del disco que correspondan a esos dos chunks del dbspace que esta DOWN -