我的思想随着这些闪耀的绿叶而闪耀;我的心灵因了这日光的抚触而歌唱;

可靠性度量——BFD

华为认证 致远 180℃ 0评论

通常,我们使用平均故障间隔时间MTBF(Mean Time Between Failures)和平均修复时间MTTR(Mean Time to Repair)这两个技术指标来评价系统的可靠性。

MTBF——MTBF是指一个系统无故障运行的平均时间,通常以小时为单位。MTBF越多,可靠性也就越高。
MTTR——MTTR是指一个系统从故障发生到恢复所需的平均时间,广义的MTTR还涉及备件管理、客户服务等,是设备维护的一项重要指标。
MTTR的计算公式为:MTTR=故障检测时间+硬件更换时间+系统初始化时间+链路恢复时间+路由覆盖时间+转发恢复时间。MTTR值越小,可靠性就越高。

BFD 简介

定义——双向转发检测BFD(Bidirectional Forwarding Detection)是一种全网统一的检测机制,用于快速检测、监控网络中链路或者IP路由的转发连通状况。

目的为了减小设备故障对业务的影响,提高网络的可靠性,网络设备需要能够尽快检测到与相邻设备间的通信故障,以便及时采取措施,保证业务继续进行。在现有网络中,有些链路通常通过硬件检测信号,如SDH告警,检测链路故障,但并不是所有的介质都能够提供硬件检测。此时,应用就要依靠上层协议自身的Hello报文机制来进行故障检测。上层协议的检测时间都在1秒以上,这样的故障检测时间对某些应用来说是不能容忍的。

同时,在一些小型三层网络中,如果没有部署路由协议,则无法使用路由协议的Hello报文机制来检测故障。BFD协议就是在这种背景下产生的,BFD提供了一个通用的标准化的介质无关和协议无关的快速故障检测机制。具有以下优点:
l 对相邻转发引擎之间的通道提供轻负荷、快速故障检测。这些故障包括接口、数据链路,甚至有可能是转发引擎本身。
l 用单一的机制对任何介质、任何协议层进行实时检测。
受益
BFD可以实现快速检测并监控网络中链路或IP路由的转发连通状态,改善网络性能。相邻系统之间通过快速检测发现通信故障,可以更快地帮助用户建立起备份通道以便恢复通信,保证网络可靠性。

BFD 的检测机制可以概括为:首先在两个设备之间建立起BFD 会话,然后相互周期性地发送BFD 控制报文,如果一方在预定的时间范围内没有收到另一方发送的BFD控制报文,则认为传输路径上发生了故障。为满足快速检测故障的需求, BFD 规定发送和接收控制报文的时间间隔大致在微秒级别。但是,限于目前的设备处理能力,大部分厂商的设备在实际运用BFD 时都只能达到毫秒级别。

转载请注明:致远博客 » 可靠性度量——BFD

喜欢 (0)
发表我的评论
取消评论

表情

Hi,您需要填写昵称和邮箱!

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址