CAN总线错误帧及排查方法

Controller Area Network(CAN)总线是一种常用于车辆和工业应用中的通信协议,它允许多个设备在同一总线上进行通信。

一、错误帧的基础知识

 

 

(一)、错误帧的作用

 

错误帧是CAN总线用于进行错误通知的报文,可以将任何一个节点发现的错误通知给其他节点,包括发送节点;进而丢弃错误的报文,发送节点再进行报文的重新发送,保证传递信息的准确性。

 

)、错误类型

 

按照分层的理念,CAN的错误检测和错误信号的发送都处于二层,即数据链路层,因此,错误检测所检测的报文也是检测数据链路层的报文。

 

其次,当总线上的帧出现错误时,节点就会发出错误帧,而错误也有多种类型:

 

1、位错误:位错误是发送节点在发送数据,进行回读,检测到总线上的数据与自身发出的数据不同时,发出的错误。由于CAN的仲裁机制和ACK应答机制,在仲裁场和ACK处发出隐性位,而回读到显性位时并不会认为是位错误。

 

2、格式错误:格式错误是在固定格式的位场处检测到非法位,例如:ACK界定符固定是一个隐性位,若检测到显性,就认为是格式错误。

 

3、ACK错误:发送节点在自身发送的报文的ACK位检测到隐性时,会认为没有其他节点接收到此条报文,即为ACK错误。

 

4、填充错误:CAN的填充机制是每检测到5个连续相同的位时,即填充一个相反的位,以提供足够的跳变沿来进行同步,当在总线上有报文时,检测到连续的6个相同的位时,即认为是填充错误。

 

5、CRC错误:接收节点接收到的CRC序列与发送节点发送的CRC序列不同时,即识别为CRC错误。

 

)、错误帧的类型

 

上文已经说了CAN错误的类型,当检测到错误时,就会有错误帧发出,处于不同错误状态的节点,所发送的错误帧格式是不同的。

 

从错误的角度分析,节点有三种不同的状态,分别是主动错误状态,被动错误状态和总线关闭状态。并有两种不同的错误计数器,分别是接收错误计数器REC和发送错误计数器TEC。当节点检测到错误时,会发出错误帧,并增加错误计数器的值,根据错误计数器的值,节点会进入不同的状态。具体的计数算法参照 ISO 11898-1。

 

1、当TEC和REC的值都小于128时,节点处于主动错误状态时,节点发送的错误帧由6个显性位(主动错误标志)加8个隐性位(错误界定符)组成,共14位。一个节点发出错误帧,其他节点识别到后会跟着发出错误帧,由此机制,将一个节点检测到的错误通知给其他节点,也能防止其他节点接收到错误的报文。

 

2、当TEC或REC大于127时,节点处于被动错误状态时,节点发送的错误帧由6个隐性位(被动错误标志)加8个隐性位(错误界定符)即14个连续的隐性位组成,当处于被动错误状态的节点在接收报文时检测到错误进而发出的错误帧,一定会被正常的报文或者其他节点的错误帧覆盖掉。只有当处于被动错误状态的节点在主动发出报文,发出的错误帧才会被其他节点正常检测到并触发其他节点发出错误帧。

 

3、当TEC大于255时,节点处于总线关闭状态(busoff)时,节点会停止收发报文,直到有用户请求(如:重启)或总线连续128次出现11个连续的隐性位时,节点重新恢复到主动错误的状态。总线关闭状态主要是为了防止一个节点出现故障或持续被干扰时,不断发出错误帧,从而影响其他节点的正常收发报文。

 

综上,错误帧按具体格式分类只有两类,即6个显性0 + 8个隐性1和6个隐性1 + 8个隐性1两种。当一个节点连续检测到多个错误,进入到被动错误模式时,此时很有可能是此节点出了问题或者受到干扰,这个时候这个节点检测出的错误可能已经不被信任,所以处于被动错误模式的节点发出的错误帧是14个隐性位,可以被正常报文或正常的错误帧覆盖掉。

 

二、错误帧的排查方法示例

 

进行错误帧的原因排查,观察错误帧的类型等信息,可借助Vector公司软件工具CANoe、示波器、万用表等。在CANoe的Trace窗口中可以看到报文的详细信息,错误类型等。

 

实车上出现错误帧时,综合出现错误帧的原因,如下部分典型排查方法可以参考。

 

1、先判断终端节点是否在线,加载DBC来判断是否有终端节点的报文,或者用万用表测量终端电阻阻值是否正确。

 

2、确认错误帧出现的频率,是否为周期型或仅在固定的时间段内出现

 

3、排查错误帧出现时,对应的报文是否有固定的ID,或者是固定的节点

 

4、根据错误帧的信息排查,是否与正常报文相关;同时再结合重传和报文的优先级综合分析。

< 返回