inscripciones ( problemas ) soy todo oidos!!.

que tal gente? no se que estoy haciendo mal!!! pense que iba a funcionar pero no!! ( necesito consejos )
les comento mi escenario!! tenemos casi un total 100 mil inscripciones!! ( version v265 )

hardware y configuracion.
4 servidores power edge r410 virtualizados con vmware esxi (procesador Intel(R) Xeon(R) CPU E5620 @ 2.40GHz )
base de datos : motor informix 9.21 con 8 cpu 8 gigas de ram raid 10.
webservers : arme hasta 5 maquinas virtuales ( cada uno con 4 procesadores 4 gb ram raid 10 )
2 balanceo de carga (proxy reverso) con balanceo de dns round robin a los dicho servers: use primero squid despues pase a haproxy ( pensando que era el problema )

paso configuracion de motor de informix

8 cpu 8 gigas de ram

ROOTSIZE 2000000
PHYSFILE 819000
NETTYPE soctcp,7,1500,CPU
NETTYPE ipcshm,7,1500,NET
VPCLASS cpu,num=7,noage ( supuestamente es lo mismo que poner NUMCPUVPS , si estoy equivocado corrijanme )
LOCKS 50000
BUFFERS 524288
NUMAIOVPS 2
PHYSBUFF 512
LOGBUFF 64
LOGSMAX 50
CLEANERS 16
SHMVIRTSIZE 524288
SHMADD 32768
SHMTOTAL 0
CKPTINTVL 600
LRUS 32
LRU_MAX_DIRTY 70
LRU_MIN_DIRTY 50
LTXHWM 50
LTXEHWM 60
TXTIMEOUT 0x12c
STACKSIZE 32
MAX_PDQPRIORITY 100
DS_MAX_QUERIES 32
DS_TOTAL_MEMORY
DS_MAX_SCANS 1048576

en cada maquina agregue en /etc/hosts para que no tenga problemas con los dns

configuracion apache
KeepAlive on

StartServers 8
MinSpareServers 16
MaxSpareServers 30
ServerLimit 512
MaxClients 512
MaxRequestsPerChild 4000


StartServers 16
MaxClients 0
MinSpareThreads 25
MaxSpareThreads 75
ThreadsPerChild 25
MaxRequestsPerChild 0

cada servidor de balance tuve un pico maximo de 2000 conexiones concurretes.

maquina base de datos ( top )

top - 15:30:04 up 6 days, 1:16, 1 user, load average: 2.38, 2.34, 2.08
Tasks: 112 total, 3 running, 109 sleeping, 0 stopped, 0 zombie
Cpu(s): 29.5% us, 1.2% sy, 0.0% ni, 69.0% id, 0.0% wa, 0.3% hi, 0.0% si
Mem: 8308652k total, 6000704k used, 2307948k free, 30632k buffers
Swap: 5144568k total, 0k used, 5144568k free, 5838348k cached

PID USER PR NI VIRT RES SHR S %CPU %MEM TIME+ COMMAND
4594 informix -23 0 1730m 1.2g 1.2g R 68.4 15.0 344:32.99 oninit
4590 informix -23 0 1730m 1.2g 1.2g S 53.1 14.6 531:59.16 oninit
4587 informix -23 0 1730m 1.2g 1.2g S 39.2 15.4 534:24.72 oninit
4591 informix -23 0 1730m 1.1g 1.1g S 33.9 13.8 325:22.68 oninit
4592 informix -23 0 1730m 1.2g 1.2g R 21.9 15.0 252:10.85 oninit
4593 informix -23 0 1730m 1.2g 1.2g S 16.6 15.0 403:28.60 oninit
4589 informix -23 0 1730m 1.2g 1.2g S 13.6 15.0 400:42.03 oninit
4598 root 15 0 1731m 9188 8432 S 1.3 0.1 29:16.18 oninit

lo unico que veo que no esta usando toda la memoria !!

disco ( iostat )
cpu-med: %user %nice %sys %iowait %idle
33,08 0,00 2,37 0,12 64,42

Device: rrqm/s wrqm/s r/s w/s rsec/s wsec/s rkB/s wkB/s avgrq-sz avgqu-sz await svctm %util
sda 0,00 26,73 0,00 10,89 0,00 300,99 0,00 150,50 27,64 0,00 0,36 0,36 0,40
sda1 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00
sda2 0,00 26,73 0,00 10,89 0,00 300,99 0,00 150,50 27,64 0,00 0,36 0,36 0,40
dm-0 0,00 0,00 0,00 37,62 0,00 300,99 0,00 150,50 8,00 0,03 0,84 0,13 0,50
dm-1 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00

maquina apache ( top ) ahora corriendo directo sin haproxy (se inscriben pero lento con el balanceo mas lento todavia) es notable como se ve que la maquina esta muy cargada si nos fijamos en el load average.

top - 15:31:54 up 4 days, 23:43, 2 users, load average: 12.22, 11.20, 9.34
Tasks: 629 total, 2 running, 627 sleeping, 0 stopped, 0 zombie
Cpu(s): 3.2%us, 0.1%sy, 0.0%ni, 96.5%id, 0.0%wa, 0.0%hi, 0.1%si, 0.0%st
Mem: 4147520k total, 3696988k used, 450532k free, 170500k buffers
Swap: 5144568k total, 0k used, 5144568k free, 1279652k cached

PID USER PR NI VIRT RES SHR S %CPU %MEM TIME+ COMMAND
2439 apache 15 0 29656 11m 4692 S 12.5 0.3 0:06.38 httpd
2394 apache 16 0 29664 11m 4696 S 10.7 0.3 0:05.82 httpd
2490 apache 15 0 29644 11m 4676 S 10.7 0.3 0:06.46 httpd
2244 apache 15 0 29312 11m 4660 S 8.9 0.3 0:06.11 httpd
2484 apache 15 0 29664 11m 4672 S 8.9 0.3 0:07.86 httpd
2519 apache 15 0 29620 11m 4660 S 8.9 0.3 0:06.45 httpd
2238 apache 15 0 29660 11m 4676 S 7.1 0.3 0:07.93 httpd
2258 apache 15 0 29584 11m 4672 S 7.1 0.3 0:07.37 httpd
2297 apache 15 0 29744 11m 4672 S 7.1 0.3 0:06.87 httpd
2425 apache 15 0 29540 11m 4648 S 7.1 0.3 0:06.08 httpd
2436 apache 15 0 29668 11m 4668 S 7.1 0.3 0:07.48 httpd
2454 apache 16 0 29660 11m 4660 S 7.1 0.3 0:07.12 httpd
2457 apache 16 0 29664 11m 4676 S 7.1 0.3 0:08.50 httpd
2607 apache 15 0 29664 11m 4692 S 7.1 0.3 0:07.83 httpd
2649 apache 15 0 29656 11m 4672 S 7.1 0.3 0:09.20 httpd
2673 apache 15 0 29640 11m 4664 S 7.1 0.3 0:05.21 httpd
2674 apache 15 0 29508 11m 4676 S 7.1 0.3 0:07.42 httpd
2730 apache 16 0 29664 11m 4664 S 7.1 0.3 0:06.97 httpd
2736 apache 15 0 29628 11m 4680 S 7.1 0.3 0:06.56 httpd
2738 apache 15 0 29676 11m 4672 S 7.1 0.3 0:05.02 httpd
2221 apache 16 0 29596 11m 4680 S 5.3 0.3 0:06.90 httpd
2266 apache 15 0 29644 11m 4676 S 5.3 0.3 0:07.49 httpd
2282 apache 16 0 29716 11m 4672 S 5.3 0.3 0:06.60 httpd
2311 apache 16 0 29680 11m 4664 S 5.3 0.3 0:08.80 httpd
2317 apache 16 0 29468 11m 4676 S 5.3 0.3 0:07.47 httpd
2366 apache 15 0 29624 11m 4672 S 5.3 0.3 0:08.26 httpd
2400 apache 15 0 29632 11m 4656 S 5.3 0.3 0:05.38 httpd
2421 apache 16 0 29416 11m 4672 S 5.3 0.3 0:06.53 httpd
2427 apache 15 0 29580 11m 4672 S 5.3 0.3 0:07.55 httpd
2438 apache 16 0 29692 11m 4672 S 5.3 0.3 0:05.92 httpd
2447 apache 15 0 29644 11m 4652 S 5.3 0.3 0:05.96 httpd
2460 apache 15 0 29556 11m 4656 S 5.3 0.3 0:07.34 httpd

si necesitan algun onstat me avisan y con gusto se los muestro!!

gracias!

Diego:

Podrás enviar el archivo ONCONFIG? Entiendo que con esa cantidad de procesadores y RAM, si el motor estuviera bien configurado y la base en condiciones no debería haber problemas,

Y cual es el problema??? Das muchos datos pero no nos decís cual es el problema … Problemas en el motor? En el servidor Web? Cuales son los síntomas? Que querés conseguir?

Saludos

Gustavo

PD: ayer me envio mi hija por Whatsapp una imagen de pantalla del Facebook de una amiga diciendo que otra vez se había colgado el SIU Guaraní … cuando le pregunté a que facultad / Universidad iba me dijo que a Arquitectura …

No comments …

que tal gustavo. el problema es que no se que se esta haciendo mal jaja.

el problema general es, cuando todos los alumnos entran para inscribirse. “se satura”

dejo el onconfig


onconfig.fadu_produccion.txt (10.8 KB)

Diego,

Estoy revisando los archivos que me mandaste por mail, un tema que me surge es que los procesos oninit de clase CPU tienen un alto consumo de CPU. Podrias ejectutar un

onstat -g rea -r 1 > onstat_g_rea.txt

Eso nos va a mostrar cada 1 segundo cuandos threads en estado ready hay en Informix. Si esta cantidad es alta, es un indicador de que a Informix le falta CPU.

Por otro lado hay que bajar la cantidad de oninits de clase shm, porque no estan haciendo nada

saludos

hola ignacio, aca te paso lo que me pediste.

Ready threads:
tid tcb rstcb prty status vp-class name
5068411 973b4820 98c6fd98 2 ready 4cpu sqlexec

Informix Dynamic Server 2000 Version 9.21.UC3 – On-Line – Up 10 days 21:33:44 – 1653396 Kbytes

Ready threads:
tid tcb rstcb prty status vp-class name
5068411 973b4820 98c6fd98 2 ready 4cpu sqlexec

Informix Dynamic Server 2000 Version 9.21.UC3 – On-Line – Up 10 days 21:33:45 – 1653396 Kbytes

Ready threads:
tid tcb rstcb prty status vp-class name
5068411 973b4820 98c6fd98 2 ready 4cpu sqlexec

Informix Dynamic Server 2000 Version 9.21.UC3 – On-Line – Up 10 days 21:33:46 – 1653396 Kbytes

Ready threads:
tid tcb rstcb prty status vp-class name
5068411 973b4820 98c6fd98 2 ready 4cpu sqlexec

Informix Dynamic Server 2000 Version 9.21.UC3 – On-Line – Up 10 days 21:33:47 – 1653396 Kbytes

Ready threads:
tid tcb rstcb prty status vp-class name
5068411 973b4820 98c6fd98 2 ready 4cpu sqlexec

esto es ahora, ya pasaron las inscripciones.
gracias!

Hola Diego ,

Habria que correrlo cuando se ponga lento, para ver si hay threads encolados en Informix.

saludos