Software de monitoreo para controlar tu plataforma

yakko

pingüino mal genio
lo que yo estoy usando ahora es icinga y la verdad anda muy bien, tengo uno que monitorea aprox 800 host, aprox 7000 servicios, y corre en una sola maquina y cero problemas
 

Mr_JaVa

Miembro Regular
Zabbix hace la pega, buena herramienta

Enviado desde mi SM-G950F mediante Tapatalk
 

Amenadiel

Ille qui nos omnes servabit
Fundador
OVERLORD
REPORTERO
PLW ahora new Relic te cobra aparte por las alertas :(
A estas alturas, dos años después, cobran por todo. Y es más. A sabiendas que cobran hasta por tirarse peos intenté tirarme uno y no salía, no quería salir.

Pensé que se me había pegado un yogur en la guatita como a Christell, pero cuando me metí al panel decía: "New relic APM ya no soporta peítos, pinche aquí para acceder a un free trial de 12 horas de New Relic Fart Manager".

En otras palabras estos CSM no sólo cobran por todo sino que van podando el servicio.


En fin... me gusta el vikingo, o sea digo, la idea del vikingo. ElasticSearch y Kibana andan un kilo, aunque te puedes gastar un resto en armarlo. El servicio elasticsearch de AWS viene con kibana preinstalado y sólo hace falta meterle datos. Yo lo que hago es mantener una cola (no la cola sino una cola cualquiera) en Redis, y cada pocos segundos vaciarla hacia elasticsearch. (pero no hice eso para el monitoreo sino para hacer machine learning sobre tweets, cuento corto, mi machine no aprendió ni raja)

Lo que sí vale la pena comentar es que una cosa es un visualizador de logs, para lo cual también hay implementaciones más simples (Logentries, Papertrail, Loggly... todos son un robo pero bonitos) pero no tienen relojitos mostrando el uso de RAM, disco duro libre, uso de CPU. Si estás corriendo en cualquier PaaS en todo caso esos relojitos están visibles de por sí o por un pequeño delta.
 

Harima

Pegao al tarro
REPORTERO
El
A estas alturas, dos años después, cobran por todo. Y es más. A sabiendas que cobran hasta por tirarse peos intenté tirarme uno y no salía, no quería salir.

Pensé que se me había pegado un yogur en la guatita como a Christell, pero cuando me metí al panel decía: "New relic APM ya no soporta peítos, pinche aquí para acceder a un free trial de 12 horas de New Relic Fart Manager".

En otras palabras estos CSM no sólo cobran por todo sino que van podando el servicio.


En fin... me gusta el vikingo, o sea digo, la idea del vikingo. ElasticSearch y Kibana andan un kilo, aunque te puedes gastar un resto en armarlo. El servicio elasticsearch de AWS viene con kibana preinstalado y sólo hace falta meterle datos. Yo lo que hago es mantener una cola (no la cola sino una cola cualquiera) en Redis, y cada pocos segundos vaciarla hacia elasticsearch. (pero no hice eso para el monitoreo sino para hacer machine learning sobre tweets, cuento corto, mi machine no aprendió ni raja)

Lo que sí vale la pena comentar es que una cosa es un visualizador de logs, para lo cual también hay implementaciones más simples (Logentries, Papertrail, Loggly... todos son un robo pero bonitos) pero no tienen relojitos mostrando el uso de RAM, disco duro libre, uso de CPU. Si estás corriendo en cualquier PaaS en todo caso esos relojitos están visibles de por sí o por un pequeño delta.
El elastic de Amazon como servicio vale wano , en la antigua pega pasamos con casos porque esa mierda no funcionaba como corresponde, así que no me arriesgaría a dejarlo como sistema de monitoreo, hay que asegurarse con levantar un cluster a manito no más
El sucesor de new relic se llama status cake (solo probé el monitoreo Web y alertas) y te puedes importar la cuenta de new relic
 

Amenadiel

Ille qui nos omnes servabit
Fundador
OVERLORD
REPORTERO
El

El elastic de Amazon como servicio vale wano , en la antigua pega pasamos con casos porque esa mierda no funcionaba como corresponde, así que no me arriesgaría a dejarlo como sistema de monitoreo, hay que asegurarse con levantar un cluster a manito no más
El sucesor de new relic se llama status cake (solo probé el monitoreo Web y alertas) y te puedes importar la cuenta de new relic
Hmmm en realidad ahora uso herramientas distintas para debug + trazas vs logs de sistema y errores... Aunque se superponen.

Me llama la atención que te haya funcionado tan mal ES. Cuántos nodos tenía ese clúster y de que tamaño cada uno?

Enviado desde mi HMA-L29 mediante Tapatalk
 

Harima

Pegao al tarro
REPORTERO
Hmmm en realidad ahora uso herramientas distintas para debug + trazas vs logs de sistema y errores... Aunque se superponen.

Me llama la atención que te haya funcionado tan mal ES. Cuántos nodos tenía ese clúster y de que tamaño cada uno?

Enviado desde mi HMA-L29 mediante Tapatalk
No recuerdo el tamaño pero era caro unos 7000 usd mensuales y no solo dio problemas de performance sino que con los filtros de la ip, le hicieron redeploy, lo cambiaron de server, pero desde soporte nunca lo pudieron hacer funcionar como corresponde, al final convencí a desarrollo y comenzamos a migrar a cosmosdb de azure. Llevábamos como 3 países cuando me fui pero andaba filete.
 

Amenadiel

Ille qui nos omnes servabit
Fundador
OVERLORD
REPORTERO
No recuerdo el tamaño pero era caro unos 7000 usd mensuales y no solo dio problemas de performance sino que con los filtros de la ip, le hicieron redeploy, lo cambiaron de server, pero desde soporte nunca lo pudieron hacer funcionar como corresponde, al final convencí a desarrollo y comenzamos a migrar a cosmosdb de azure. Llevábamos como 3 países cuando me fui pero andaba filete.
Uff por 7K yo hubiera contratado los servicios de un experto como Dani Pérez (epistemoniko) en vez de meterle mas lucas. El soporte de Amazon es como la diuca.

No estoy acostumbrado a usar Azure (estoy trepando la curva de Google) pero estoy consciente que su soporte es a toda raja.

Bueno... claramente tu necesitas más poder que el que yo usaba para meter 100 tweets por segundo,que ahora que lo pienso es una cagada

Enviado desde mi HMA-L29 mediante Tapatalk
 

yakko

pingüino mal genio
pero elastic+kibana no es un sistema de monitoreo, es un motor de búsqueda y está enfocado en recolectar datos y mostrar tendencias en el tiempo, performance, uptime, uso de recursos, crecimiento, etc. etc. Yo lo encuentro la raja pero no es pa monitorear.

cuento aparte, lo encuentro mas desordenado e inestable que mi salud mental si, kibana ordena las cosas como quiere, algunos parámetros los muestra a penas son leídos y si justo la lectura es nula o cero (pasa bastante) el gráfico se muestra como un error o como un valor nada que ver, lo mismo pasa con algunos valores en el tiempo, en vez de mostrar el promedio muestra una lectura actual y el gráfico se va a la mierda (no tiene solución aun, estuve hablando con uno de los desarroladores del módulo hace poco)
 

Amenadiel

Ille qui nos omnes servabit
Fundador
OVERLORD
REPORTERO
Cierto, con los tweets me pasaba harto, y entre que las inserciones son eventualmente consistentes pero nada mas, sumado a la propagación asincrona entre nodos... kibana pareciera comerse registros que al rato pueden aparecer.

Alguna vez use logentries y paperttail. Pero, como mencioné, hoy en dia me cunde mas la instrumentación a nivel de software. Rollbar o Sentry, por ejemplo, agrupan las excepciones y su traza. No servirian para un accesslog, y aunque podrias correr un demonio monitoreando el uso de memoria minuto a minuto, te comerias el free tier con una solar maquina

Respecto a los dashboards de monitoreo, Cuando newrelic se puso weon estuve cotizando alternativas, pero las mejorcitas implicaban recompilar paquetes (e.g. nginx ) con un modulo propietario. Eso, y ademas el cobro no era por plan sino por maquina. Si corres un cluster de maquinas chicas te hacen bolsa.

Enviado desde mi SM-T590 mediante Tapatalk
 

miguelwill

Matrix Operator
Miembro del Equipo
MOD
ZABBIX ES EL MEJOR en resumen xd
jaja esto no es una guerra santa como para buscar al "mejor"
total siempre hay necesidades diferentes y hay que buscar lo que mejor se acomode
 

epic

Capo
Acá uso Nagios, instale OpManager en su memento para ver una cosa especifica y me dio lo que necesitaba.
 

yakko

pingüino mal genio
ZABBIX ES EL MEJOR en resumen xd
zabbix no fue culo de soportar un ambiente de 1400 equipos y en promedio 16.000 servicios a chequear (usando un solo zabbix) , icinga2 lo hace sin arrugarse.

depende del uso que se le va a dar, depende de que quieres monitorear, de si necesitas que sea algo facil de configurar, etc. etc. hay para todos los gustos.
 

chikogollo

Network Engineer
Algun software que se alimente de netflow para monitorear un servicio. Ahora el desafio es que la maquina no puede llegar al host final si no que tiene acceso a los equipos que comunican los host.
 

chertsey

Capo
Algun software que se alimente de netflow para monitorear un servicio. Ahora el desafio es que la maquina no puede llegar al host final si no que tiene acceso a los equipos que comunican los host.
Elastic + Kibana tienen un addon llamado packetbeat , el cual soporta netflow como servidor (tienes que enviarle los datos)

Ahora es parte del SIEM que ellos promocionan, aunque esta bastante verde...


Enviado desde mi iPad utilizando Tapatalk
 
Subir