标签: monitoring

共 3 篇文章

大数据-219 Grafana 11.3.0 安装与启动实战:YUM 装 RPM、systemd 管理、登录与常见坑位排查

文章浏览阅读4k次,点赞34次,收藏20次。2026 年仍在使用 CentOS/RHEL 系(含兼容发行版)的运维/开发,给出 Grafana 11.3.0(grafana-enterprise-11.3.0-1.x86_64.rpm)通过 YUM 直接安装 RPM 的工程化落地流程:安装包来源、systemctl 启动与状态检查、默认 3000 端口访问与首次登录(admin/admin)验证链路,并补齐最常见的线上问题定位:服务未监听、端口被防火墙/安全组拦截、SELinux 拦截、反向代理/域名访问 404/502、以及「页面能开但登录失败/循环跳转」等场景的排查思路。

大数据-217 Prometheus 2.53.2 安装与配置实战:Scrape Targets、Exporter、告警链路与常见故障速查

文章浏览阅读4.4k次,点赞15次,收藏25次。Prometheus 2.53.2(2025/2026 仍常见在存量环境)给出一套可复用的落地流程:在监控机下载并解压二进制,编写 prometheus.yml 完成 scrape_interval 与多 scrape_configs 目标配置,拉取多台服务器 node_exporter(9100) 指标,并通过 /targets 页面快速验证抓取状态。文章同时覆盖 Prometheus 数据模型(metric + labels 的时间序列)、Pull 采集模型、PromQL 基础用途(rate/聚合/等)

大数据-218 Prometheus Node Exporter 1.8.2 + Pushgateway 1.10.0:下载、启动、接入与避坑

常见的 Prometheus 监控落地场景:在 Rocky Linux(兼容 CentOS/RHEL)上安装 node_exporter-1.8.2 暴露主机指标,并接入 Prometheus(示例版本 2.53.2)完成 targets 采集;同时介绍 Pushgateway-1.10.0 的定位与边界:用于短期任务、cron、CI/CD、ETL 等无法长期暴露 /metrics 的作业,通过「任务 push 到 Pushgateway,Prometheus 再 pull」的方式统一采集。