Linux Linux, actualizacion de RedHat 6.4 a 6.8

Zuljin

Fundador
Miembro del Equipo
Fundador
ADMIN
Se incorporó
15 Enero 2004
Mensajes
11.775
Hace unos días el messages alertó errores en la lectura de memoria en uno de los servidores de base de datos de producción.

Código:
Aug 31 00:54:47 oracleprod1 kernel: sbridge: HANDLING MCE MEMORY ERROR
Aug 31 00:54:47 oracleprod1 kernel: CPU 1: Machine Check Exception: 0 Bank 9: cc001b08000800c1
Aug 31 00:54:47 oracleprod1 kernel: TSC 0 ADDR 4cf61bf000 MISC 90840c00040108c PROCESSOR 0:206d7 TIME 1472615687 SOCKET 1 APIC 20
Aug 31 00:54:47 oracleprod1 kernel: sbridge: HANDLING MCE MEMORY ERROR
Aug 31 00:54:47 oracleprod1 kernel: CPU 1: Machine Check Exception: 0 Bank 9: cc001b08000800c1
Aug 31 00:54:47 oracleprod1 kernel: TSC 0 ADDR 4cf61bf000 MISC 90840c00040108c PROCESSOR 0:206d7 TIME 1472615687 SOCKET 1 APIC 20
Aug 31 00:54:48 oracleprod1 kernel: EDAC MC1: CE row 0, channel 0, label "CPU_SrcID#1_Channel#0_DIMM#0": 108 Unknown error(s): memory scrubbing on FATAL area OVERFLOW: cpu=1 Err=0008:00c1 (ch=1), addr = 0x4cf61bf000 => socket=1, Channel=0(mask=1), rank=1


La gente de redHat me dice que es error de hardware y la gente de dell me dice que anda todo la raja porque el chequeo de hardware dice que anda todo impeque. Le mandé un reinicio al server pero a los dos días volvió a saltar el mismo error.

Finalmente Dell me dice "actualiza firmware" y bueno, actualicé firmware y el chequeo de hardware sigue impeque- Y ahora viene lo peor: aplicar yum update para pasar de RedHat 6.4 a RedHat 6.8.

Que el pulento se apiade de mi alma para que los servicios de Oracle levanten después de este update.
 

Zuljin

Fundador
Miembro del Equipo
Fundador
ADMIN
Se incorporó
15 Enero 2004
Mensajes
11.775
busca:
fgrep -i eth3 /var/log/messages y copia lo que sale para verlo

Código:
Sep  8 13:13:44 oracleprod2 kernel: bnx2x 0000:03:00.0: eth3: using MSI-X  IRQs: sp 144  fp[0] 146 ... fp[7] 153
Sep  8 13:13:44 oracleprod2 kernel: ADDRCONF(NETDEV_UP): eth3: link is not ready
Sep  8 13:13:44 oracleprod2 kernel: bnx2x 0000:03:00.0: eth3: NIC Link is Up, 10000 Mbps full duplex, Flow control: none
Sep  8 13:13:44 oracleprod2 kernel: ADDRCONF(NETDEV_CHANGE): eth3: link becomes ready
Sep  8 13:13:47 oracleprod2 ntpd[8686]: Listening on interface #16 eth3, fe80::e2db:55ff:fe7b:6f28#123 Enabled
Sep  8 13:20:31 oracleprod2 kernel: udev: renamed network interface eth3 to eth4
Sep  8 13:20:31 oracleprod2 kernel: udev: renamed network interface rename4 to eth3

Sabís que reinicié el server y la nic ya no levantó, y eso que tiene el flag ONBOOT en yes.
 
Upvote 0

Miguelwill

I am online
Miembro del Equipo
MOD
Se incorporó
23 Febrero 2004
Mensajes
12.283
# ip -a

Código:
2: em1: <BROADCAST,MULTICAST,UP,LOWER_UP> mtu 1500 qdisc mq state UP qlen 1000
    link/ether e0:db:55:10:19:32 brd ff:ff:ff:ff:ff:ff
    inet 172.20.30.132/16 brd 172.20.255.255 scope global em1
    inet6 fe80::e2db:55ff:fe10:1932/64 scope link
       valid_lft forever preferred_lft forever
3: em2: <BROADCAST,MULTICAST,UP,LOWER_UP> mtu 1500 qdisc mq state UP qlen 1000
    link/ether e0:db:55:10:19:34 brd ff:ff:ff:ff:ff:ff
    inet 10.0.1.12/16 brd 10.0.255.255 scope global em2
    inet6 fe80::e2db:55ff:fe10:1934/64 scope link
       valid_lft forever preferred_lft forever
4: eth3: <BROADCAST,MULTICAST> mtu 1500 qdisc noop state DOWN qlen 1000
    link/ether e0:db:55:7b:6f:28 brd ff:ff:ff:ff:ff:ff
5: eth4: <BROADCAST,MULTICAST> mtu 1500 qdisc noop state DOWN qlen 1000
    link/ether e0:db:55:7b:6f:2b brd ff:ff:ff:ff:ff:ff
6: bond0: <BROADCAST,MULTICAST,MASTER> mtu 1500 qdisc noop state DOWN
    link/ether 00:00:00:00:00:00 brd ff:ff:ff:ff:ff:ff

Hay alguna forma de "levantar" una interfaz de red en particular? No se, la eth3 por ejemplo?

si, de varias formas
con ifup o ifdown (eso activa y configura ip)
si quieres activarla sin configurar nada mas, prueba con ifconfig
ifconfig eth1 up
ifconfig eth1 down

por casualidad , no creo, pero igual pregunto, no te habra renombrado las interfaces fisicas ?

el bonding por lo general deberia levantar la interface de nombre "bond0" o "bond1" y asi consecutivamente
eth0 o em0 son nombres que el kernel le asigna a interfaces fisicas

para ver todas las interfaces disponibles para el kernel, prueba con "ifconfig -a"

saludos
 
Upvote 0

Zuljin

Fundador
Miembro del Equipo
Fundador
ADMIN
Se incorporó
15 Enero 2004
Mensajes
11.775
Está muy rara la huea. Estoy con el soporte de redHat ahora. Apenas termine les cuento. Mientras tanto, les adelanto que redHat me dijo que seteara el HWADDR a los archivos de configuración de interfaces.
 
Upvote 0

K3rnelpanic

non serviam
Miembro del Equipo
MOD
Se incorporó
1 Octubre 2007
Mensajes
6.052
Está muy rara la huea. Estoy con el soporte de redHat ahora. Apenas termine les cuento. Mientras tanto, les adelanto que redHat me dijo que seteara el HWADDR a los archivos de configuración de interfaces.
Si, es lo mejor. Pero qué marciano el error. Recomendaria reiniciar el servicio network mientras ves el /var/log/messages con
tail -f /var/log/messages para ir viendo qué hace.
 
Upvote 0

Miguelwill

I am online
Miembro del Equipo
MOD
Se incorporó
23 Febrero 2004
Mensajes
12.283
Está muy rara la huea. Estoy con el soporte de redHat ahora. Apenas termine les cuento. Mientras tanto, les adelanto que redHat me dijo que seteara el HWADDR a los archivos de configuración de interfaces.

bueno, eso ayudaria a fijar la interface a la tarjeta en cuestion
 
Upvote 0

Zuljin

Fundador
Miembro del Equipo
Fundador
ADMIN
Se incorporó
15 Enero 2004
Mensajes
11.775
Ya, problema resuelto.

Por alguna puta razón aleatoria, después de la actualización del firmware del servidor se cambió un flag del server y las macaddress SE CAMBIARON!!!! La cosa es que el soporte del fabricante me indicó que apretara un botoncillo, reinicié el server y pafff... las interfaces de red fueron reestablecidas.

Puta que es importante tener Alta Disponibilidad, compadre. Pude trabajar tranquilo porque el servicio lo estaba brindando el otro server.

PD: Puto Dell.
 
Upvote 0

K3rnelpanic

non serviam
Miembro del Equipo
MOD
Se incorporó
1 Octubre 2007
Mensajes
6.052
Ya, problema resuelto.

Por alguna puta razón aleatoria, después de la actualización del firmware del servidor se cambió un flag del server y las macaddress SE CAMBIARON!!!! La cosa es que el soporte del fabricante me indicó que apretara un botoncillo, reinicié el server y pafff... las interfaces de red fueron reestablecidas.

Puta que es importante tener Alta Disponibilidad, compadre. Pude trabajar tranquilo porque el servicio lo estaba brindando el otro server.

PD: Puto Dell.
Qué sería de nosotros si nada fallara :yao
 
Upvote 0

yakko

pingüino mal genio
Se incorporó
24 Agosto 2004
Mensajes
16.883
Ya, problema resuelto.

Por alguna puta razón aleatoria, después de la actualización del firmware del servidor se cambió un flag del server y las macaddress SE CAMBIARON!!!! La cosa es que el soporte del fabricante me indicó que apretara un botoncillo, reinicié el server y pafff... las interfaces de red fueron reestablecidas.

Puta que es importante tener Alta Disponibilidad, compadre. Pude trabajar tranquilo porque el servicio lo estaba brindando el otro server.

PD: Puto Dell.
siempre lo he dicho, dell vale guano.
 
Upvote 0

yakko

pingüino mal genio
Se incorporó
24 Agosto 2004
Mensajes
16.883
desde el 2002 trabajando con servidores hp, desde el 2007 dando soporte a cientos de empresas (casi todas usan servidores HP), nunca he tenido problemas.
hoy en día compramos servidores hp usados para pymes (cuestan una mierda) , aun así nunca un problema.
 
Upvote 0

Miguelwill

I am online
Miembro del Equipo
MOD
Se incorporó
23 Febrero 2004
Mensajes
12.283
desde el 2002 trabajando con servidores hp, desde el 2007 dando soporte a cientos de empresas (casi todas usan servidores HP), nunca he tenido problemas.
hoy en día compramos servidores hp usados para pymes (cuestan una mierda) , aun así nunca un problema.

fuera del desgaste de algunos pocos componentes, son bastante aperradores
aca un par de storages tuvimos que comprar las baterias un par de años despues (ya venian en modo reacondicionado) y luego de eso siguen funcionando igual de bien

con dell no hemos tenido este tipo de problemas, pero es que tampoco es que estuvieramos actualizando los firmwares muy seguido :p (un par de veces y solo cuando es necesario, pero nunca en un servidor en produccion, mas que nada porque no se necesitaba )
 
Upvote 0

K3rnelpanic

non serviam
Miembro del Equipo
MOD
Se incorporó
1 Octubre 2007
Mensajes
6.052
Entonces Zuljin tiene versionitis de Bios :zippyte

PD: Acá en la pega DELL Se ganó la cotización para renovar una plataforma crítica. Aydióhmio :naster
 
Upvote 0

whiplashh

Capo
Se incorporó
30 Marzo 2015
Mensajes
345
desde el 2002 trabajando con servidores hp, desde el 2007 dando soporte a cientos de empresas (casi todas usan servidores HP), nunca he tenido problemas.
hoy en día compramos servidores hp usados para pymes (cuestan una mierda) , aun así nunca un problema.

pero hay unos que valen callampa, esas weas chicas que venden en pcfactory son META malos, a esos me refiero XD
 
Upvote 0
Subir