Windows PROBLEMA WINDOWS SERVER 2019 / Se emitió un restablecimiento de dispositivo, \Device\RaidPort1.

buhoblue

Casi-gamer
Se incorporó
30 Septiembre 2020
Mensajes
677
Estimados
buenas tardes

Esperando que se encuentren bien, hace un tiempo tengo un problema con este servidor de Windows Server 2019, el cual está montado sobre un VMWare. Este es un servidor de SAP Business One 10, el cual cada cierto tiempo determinado es muy al azar se manda sus pantallazos azules y se reinicia... en el visor de eventos me arroja muy repetidamente esta advertencia;

Se emitió un restablecimiento de dispositivo, \Device\RaidPort1.

9DDn9SJ.png


Como dato, esta instalación no la hice yo, estaba cuando llegué a trabajar a esta empresa y quería ver la manera de solucionarla o mejorarla para que ya no pase más este problema, el tema es que SAP lo ocupan mucho acá, tiene muchos datos y cosas que no se pueden perder, obviamente están sus respectivos respaldos y toda la challa, pero más que eso me gustaría saber el origen del problema. Todo indica por las revisiones que he realizado, es problema del disco, por la antiguedad de este aparte que esta particionado como raid.

Atento a sus comentarios y gracias para quienes me puedan ayudar.

Saludos,
 

hpf

Jugador casual
Miembro del Equipo
MOD
Se incorporó
7 Mayo 2011
Mensajes
360
Tienes acceso a la controladora? Qué información te da? Deberías revisar el estado de los discos, quizás uno de ellos sea el del problema y podrías reemplazarlo. Dale un triple check al tipo de Raid que está implementado y a las configuraciones de la controladora, para estar seguros.

De todas formas siempre es bueno chequear el estado de actualizaciones de la controladora Raid, qué tipo de disco está configurado en VMWare para esa máquina, etc.

Tienes monitoreo de los recursos de la máquina, tanto física como virtual? Por el tema de los BSOD, quizás encuentres algún spike de CPU/Memoria/Temperatura que lo pueda estar provocando, adicional al tema de discos.

La otra vuelta larga: Si todo está debidamente licenciado y con plan de soporte, deberías abrir casos: VMWare, Microsoft, SAP en última instancia (aunque no creo que sea asociado a eso)
 
Upvote 0

Cosme

Gold Member
Se incorporó
27 Febrero 2005
Mensajes
8.276
Lo primero primerisimo es sacar un respaldo de las dbs de produccion de Business One.

después sacas un backup a la vm

y después te pones a revisar otras cosas.


Si es un raid con miembros apunto de cagar, es posible que no puedas hacer un rebuild al cambiar las unidades y te quede la cagá + 1
 
Upvote 0

buhoblue

Casi-gamer
Se incorporó
30 Septiembre 2020
Mensajes
677
Lo primero primerisimo es sacar un respaldo de las dbs de produccion de Business One.

después sacas un backup a la vm

y después te pones a revisar otras cosas.


Si es un raid con miembros apunto de cagar, es posible que no puedas hacer un rebuild al cambiar las unidades y te quede la cagá + 1
Tengo backup de las dbs y de la vm, pretendo comprar un SSD de servidor y montarle esxi y dentro de esxi hacer la instalación desde 0 de este servidor y después importar los backups, al hacer eso crees que exista el riesgo de que se importen con los mismos “daños” que presenta la máquina ahora?
 
Upvote 0

cliobrando

Capo
Se incorporó
6 Mayo 2021
Mensajes
107
Si es una máquina Virtual y está descartado que el host tenga un problema de HW (Discos), te recomiendo actualizar las vmware tools del Windows Server, a veces con los updates de Windows el driver de storage de VMware debe ser actualizado para mejorar la compatibilidad.
Olvide decir de que a veces errores de ese tipo aparecen cuando sacas snapshots/backups o el host tiene exceso de IO.

El error con ID 129 significa que no hubo respuesta de una operación I/O.
 
Upvote 0

buhoblue

Casi-gamer
Se incorporó
30 Septiembre 2020
Mensajes
677
Si es una máquina Virtual y está descartado que el host tenga un problema de HW (Discos), te recomiendo actualizar las vmware tools del Windows Server, a veces con los updates de Windows el driver de storage de VMware debe ser actualizado para mejorar la compatibilidad.
fué la primera "solución" que hice pero sigue igual, se actualizaron varios drivers la verdad, pero no lo que necesitaba que se arreglara. :(

precisamente, hemos tenido dramas con los backups, puesto que cuando los realizaba el el servidor se iba a la cresta y lo reiniciaba, lo cual decidimos dejar los backup automarizados a sacarlos manual.
 
Upvote 0

buhoblue

Casi-gamer
Se incorporó
30 Septiembre 2020
Mensajes
677
Tienes acceso a la controladora? Qué información te da? Deberías revisar el estado de los discos, quizás uno de ellos sea el del problema y podrías reemplazarlo. Dale un triple check al tipo de Raid que está implementado y a las configuraciones de la controladora, para estar seguros.

De todas formas siempre es bueno chequear el estado de actualizaciones de la controladora Raid, qué tipo de disco está configurado en VMWare para esa máquina, etc.

Tienes monitoreo de los recursos de la máquina, tanto física como virtual? Por el tema de los BSOD, quizás encuentres algún spike de CPU/Memoria/Temperatura que lo pueda estar provocando, adicional al tema de discos.

La otra vuelta larga: Si todo está debidamente licenciado y con plan de soporte, deberías abrir casos: VMWare, Microsoft, SAP en última instancia (aunque no creo que sea asociado a eso)
en el monitoreo esta todo ok, no me arroja nada, de hecho en el crystaldisk que le meti para ver si tenia sectores dañados no me muestra errores ni sectores dañados, lo que es raro puesto que estaba asumiendo que era el disco el drama.

HOST;

0wvTwzL.png



VM;
piQxL8A.png
 
Upvote 0

Cosme

Gold Member
Se incorporó
27 Febrero 2005
Mensajes
8.276
tienes licencias de vmware? mira que ahora cambió bastante el modelo de licenciamiento.

 
Upvote 0

cliobrando

Capo
Se incorporó
6 Mayo 2021
Mensajes
107
Ojo que en el diagnóstico debes hacerlo sobre el host, no sobre la VM, si es un server con integrated management revisa el estado de los discos a través de la controladora de discos.

Si no hay problemas de hardware fisico, revisa la capacidad del datastore donde está almacenado el disco duro de la VM, si el datastore está corriendo sobre discos mecánicos y el datastore está utilizado sobre el 60% vas a tener serios problemas de I/O.
 
Upvote 0

buhoblue

Casi-gamer
Se incorporó
30 Septiembre 2020
Mensajes
677
tienes licencias de vmware? mira que ahora cambió bastante el modelo de licenciamiento y la licencia más barata para on premise vale 5.000$ anuales

Si la licencia de VMWare que tenemos acá es comprada, hace bastantes años atras la verdad, estamos viendo ahora como lo haremos con el nuevo licenciamiento de estos tipos.
 
Upvote 0

cliobrando

Capo
Se incorporó
6 Mayo 2021
Mensajes
107
tienes licencias de vmware? mira que ahora cambió bastante el modelo de licenciamiento y la licencia más barata para on premise vale 5.000$ anuales

Hace poco coticé directamente con VMWare (hace 2 semanas?), 3 años Essential Kit+ era algo asi como 10800 dolares.
3 Host con 2 CPU de 32 cores físicos Max por server.
1 Virtual Center

Una máquina con 2 CPU de 32 Cores + 1.5TB de RAM (cerca del máximo que aguanta esa config) cuesta cerca de los 70 mil dolares.
El costo de la licencia de VMWare tampoco es TAN excesivo.
 
Upvote 0

Cosme

Gold Member
Se incorporó
27 Febrero 2005
Mensajes
8.276
bueno, debes ver el estado de los discos físicos con la utilidad de hp que está disponible para VMware, desde la interfaz de VMware; también puedes ver la latencia de disco por LUN que es un indicador para detectar posibles fallas de discos físicos.
 
Upvote 0

dwyer

Sonidista-Computin
Se incorporó
10 Mayo 2005
Mensajes
2.696
Igual si tienes acceso a la ILO de ese servidor (suponiendo que es HP), puedes revisar las alertas de la maquina por si hay discos con problemas
Tambien los SSD que pretendas comprar, que sean mínimo 2 para su raid 1
Si igual tan caros no están

Saludos
 
Upvote 0
Subir