LIBRISTO
LIBROAMANTO
obligatorio
Entre a formar parte de una comunidad de amantes de los libros del mundo entero y acceda a un sinfín de ventajas. Crear una cuenta gratis
0
Envío gratuito con Zásilkovna para compras superiores a 59.99 €
Mensajería SEUR 4.99 Mensajería GLS 7.99 Mensajería Correos 5.49 Mensajería DHL 5.49 Punto SEUR 3.99

Envío gratis a partir de 69,99 euros.

HPC Observability

Production Monitoring, Profiling, and Site Reliability for Linux Clusters, GPUs, and Parallel Storage at Scale

Idioma InglésInglés
Libro Tapa blanda
Libro HPC Observability M. Edwards
Código Libristo: 52747456
Editores Independently published, mayo 2026
HPC Observability is a hands-on guide for the engineers and administrators who keep high-performance... Descripción completa
? points 56 b Nuevo Nuevo
22.69
Reaprovisionamiento previsto Lanzamiento 02. 06. 2026

Política de devolución de 30 días

HPC Observability is a hands-on guide for the engineers and administrators who keep high-performance computing systems running reliably at scale. It brings together the operational knowledge scattered across vendor documentation, conference papers, and forum threads into a practical framework for turning HPC telemetry into actionable insight.

Modern HPC environments - Slurm clusters, GPU-dense AI systems, Lustre and GPFS storage, InfiniBand and Slingshot fabrics - generate more data than any team can manually interpret. The result is wasted node-hours, failed simulations, hidden storage bottlenecks, fabric congestion, and GPU failures that surface only after days of runtime.

This book provides a complete operational approach to HPC observability through a five-layer model covering hardware, operating systems, schedulers, applications, storage, and networks. Readers learn how to build metrics pipelines for clusters from hundreds to tens of thousands of nodes; monitor GPUs with DCGM; profile MPI and OpenMP applications with PAPI and Score-P; diagnose storage and network slowdowns; create useful dashboards and alerts; and run effective incident response and post-mortems.

Drawing on peer-reviewed research and real production experience, the book includes original diagrams, practical workflows, reference material, Prometheus alert examples, and a step-by-step lab environment for learning on a laptop.

Written in the voice of a senior HPC engineer rather than an academic text, HPC Observability assumes readers already understand the fundamentals and focuses instead on the operational realities of running large-scale Linux, AI, and research-computing infrastructure.

Actriz & Políglota
EWA KASP para
Visualizar el vídeo
Ewa Kasp
Libristo tiene la oferta más extensa de literatura en idiomas extranjeros. Por eso compran aquí sus libros.

Sobre el libro

Nombre y apellidos HPC Observability
Autor M. Edwards
Idioma Inglés
Encuadernación Libro - Tapa blanda
Fecha de publicación 2026
Número de páginas 164
EAN 9798198765443
Código Libristo 52747456
Peso 397
Dimensiones 216 x 280 x 9
Regale este libro hoy
Es fácil
1 Añadir al carrito y elegir Entregar como regalo en el checkout 2 Le enviaremos un vale 3 El libro llegará a la dirección del destinatario

Inicio de sesión

Inicie sesión en su cuenta. ¿No tiene una cuenta Libristo? ¡Cree una ahora!

 
obligatorio
obligatorio

¿No tiene cuenta? Descubra las ventajas de tener una cuenta Libristo.

Si tiene una cuenta Libristo, lo tendrá todo bajo control.

Crear una cuenta Libristo
Asesor de libros Libroamiko
Hola, soy Libroamiko, ¿puedo ayudarte?