MySQL 8.0 参考手册 / 第 23 章 MySQL NDB Cluster 8.0 / 23.6 NDB Cluster的管理 / 23.6.2 NDB Cluster 日志消息 /
21.6.2.1 NDB Cluster:Cluster 日志中的消息
下表列出了最常见的
NDB
集群日志消息。有关集群日志、日志事件和事件类型的信息,请参阅第 21.6.3 节,“NDB Cluster 中生成的事件报告”。这些日志消息也对应于 MGM API 中的日志事件类型;有关 Cluster API 开发人员感兴趣的相关信息,
请参阅
Ndb_logevent_type 类型。
表 21.47 常见的 NDB cluster 日志消息
日志消息 | 描述 | 活动名称 | 事件类型 | 优先 | 严重性 |
---|---|---|---|---|---|
Node |
具有节点 ID 的数据节点node_id 已连接到管理服务器(节点
mgm_node_id )。 |
Connected |
Connection |
8个 | INFO |
Node |
具有节点 ID 的数据节点data_node_id 已与管理服务器 (node ) 断开连接
mgm_node_id 。 |
Disconnected |
Connection |
8个 | ALERT |
Node |
具有节点 ID 的 API 节点或 SQL 节点
api_node_id 不再与数据节点通信
data_node_id 。 |
CommunicationClosed |
Connection |
8个 | INFO |
Node |
具有节点 ID 的 API 节点或 SQL 节点
api_node_id 现在正在与数据节点通信
data_node_id 。 |
CommunicationOpened |
Connection |
8个 | INFO |
Node |
具有节点ID的API节点已使用
API版本
api_node_id 连接到管理节点
(通常与MySQL版本号相同)。mgm_node_id NDB version |
ConnectedApiVersion |
Connection |
8个 | INFO |
Node |
一个ID为全局的checkpointgci 已经启动;节点node_id 是负责此全局检查点的主节点。 |
GlobalCheckpointStarted |
Checkpoint |
9 | INFO |
Node |
具有ID的全局检查点gci 已经完成;节点node_id
是负责这个全局检查点的主节点。 |
GlobalCheckpointCompleted |
Checkpoint |
10 | INFO |
Node |
具有序列 ID 的本地检查点lcp
已在节点上启动
node_id 。可以使用的最新 GCI 具有 index
current_gci ,而可以从中恢复集群的最旧 GCI 具有 index
old_gci 。 |
LocalCheckpointStarted |
Checkpoint |
7 | INFO |
Node |
lcp
节点上具有序列 ID 的本地检查点node_id 已完成。 |
LocalCheckpointCompleted |
Checkpoint |
8个 | INFO |
Node |
节点无法确定最近可用的 GCI。 | LCPStoppedInCalcKeepGci |
Checkpoint |
0 | ALERT |
Node |
一个表片段已被检查点到节点上的磁盘
node_id 。进行中的 GCI 有索引started_gci ,最近完成的 GCI 有索引
completed_gci 。 |
LCPFragmentCompleted |
Checkpoint |
11 | INFO |
Node |
撤消日志记录被阻止,因为日志缓冲区接近溢出。 | UndoLogBlocked |
Checkpoint |
7 | INFO |
Node |
node_id 运行
NDB 版本
的数据节点version 正在开始其启动过程。 |
NDBStartStarted |
StartUp |
1个 | INFO |
Node |
node_id 运行
NDB 版本
的数据节点version 已成功启动。 |
NDBStartCompleted |
StartUp |
1个 | INFO |
Node |
节点已收到指示集群重启已完成的信号。 | STTORRYRecieved |
StartUp |
15 | INFO |
Node |
该节点已完成启动phase 的
启动阶段type 。有关启动阶段的列表,请参阅
第 21.6.4 节,“NDB Cluster 启动阶段的摘要”。(type 是
initial 、system 、
node 、initial node 或之一<Unknown> 。) |
StartPhaseCompleted |
StartUp |
4个 | INFO |
Node |
节点president_id 已被选为
“总统”。
own_id 并且
dynamic_id 应该始终与node_id 报告节点的 ID ( ) 相同。 |
CM_REGCONF |
StartUp |
3个 | INFO |
Node |
报告节点 (ID node_id ) 无法接受节点president_id 作为总统。问题的cause 是Busy 、
Election with wait = false 、
Not president 、Election
without selecting new candidate 或之一No
such cause 。 |
CM_REGREF |
StartUp |
8个 | INFO |
Node |
该节点已发现其在集群中的相邻节点(节点
id_1 和节点
id_2 )。
node_id ,
own_id , 并且
dynamic_id 应该始终相同;如果不是,则表明集群节点配置严重错误。 |
FIND_NEIGHBOURS |
StartUp |
8个 | INFO |
Node |
节点已收到关闭信号。shutdowntype 是
Cluster 或。
Node |
NDBStopStarted |
StartUp |
1个 | INFO |
Node [ ] [ ],
Initiated by signal
|
节点已关闭。此报告可能包含
action ,如果存在,则为restarting 、no
start 或之一initial 。该报告还可能包括对
NDB 议定书
的引用signal ;有关可能的信号,请参阅
操作和信号。 |
NDBStopCompleted |
StartUp |
1个 | INFO |
Node [ ,
action ] . [ ] [ ] [
[ ]]Occurred
during startphase
Initiated by
Caused by error
(extra info
|
节点已被强制关闭。随后采取的
action ( 、 或 之一
restarting )no
start ,如果有的话,也会被报告。initial 如果关闭发生在节点启动时,则报告包括start_phase 节点发生故障的时间。如果这是
signal 发送到节点的结果,则还会提供此信息(有关更多信息,请参阅
操作和信号)。如果导致失败的错误是已知的,这也包括在内;有关
NDB 错误消息和分类的更多信息,请参阅NDB Cluster API 错误。 |
NDBStopForced |
StartUp |
1个 | ALERT |
Node |
节点关闭过程被用户中止。 | NDBStopAborted |
StartUp |
1个 | INFO |
Node |
这会报告在节点启动期间引用的全局检查点。之前的重做日志keep_pos 被丢弃。last_pos 是数据节点参与的最后一个全局检查点;
restore_pos 是实际用于恢复所有数据节点的全局检查点。 |
StartREDOLog |
StartUp |
4个 | INFO |
startup_message [单独列出;见下文。] |
在不同情况下可以记录许多可能的启动消息。这些是单独列出的;请参阅 第 21.6.2.2 节,“NDB Cluster 日志启动消息”。 | StartReport |
StartUp |
4个 | INFO |
Node |
已完成将数据字典信息复制到重启的节点。 | NR_CopyDict |
NodeRestart |
8个 | INFO |
Node |
已完成向重启节点复制数据分布信息。 | NR_CopyDistr |
NodeRestart |
8个 | INFO |
Node |
片段复制到起始数据节点
node_id 已经开始 |
NR_CopyFragsStarted |
NodeRestart |
8个 | INFO |
Node |
fragment_id 表
中的片段table_id 已复制到数据节点node_id |
NR_CopyFragDone |
NodeRestart |
10 | INFO |
Node |
node_id 已完成将所有表碎片复制到重新启动的数据节点
|
NR_CopyFragsCompleted |
NodeRestart |
8个 | INFO |
Node |
数据节点node1_id 检测到数据节点故障node2_id |
NodeFailCompleted |
NodeRestart |
8个 | ALERT |
All nodes completed failure of Node
|
所有(剩余)数据节点都检测到数据节点故障
node_id |
NodeFailCompleted |
NodeRestart |
8个 | ALERT |
Node failure of
|
node_id 在内核块中检测到
数据节点故障
,其中块是
、
、
或
中的 1 个;有关详细信息,请参阅
NDB 内核块block NDB DBTC DBDICT DBDIH DBLQH |
NodeFailCompleted |
NodeRestart |
8个 | ALERT |
Node |
数据节点发生故障。它在失败时的状态由仲裁状态代码描述
state_code :可以在文件中找到可能的状态代码值
include/kernel/signaldata/ArbitSignalData.hpp 。 |
NODE_FAILREP |
NodeRestart |
8个 | ALERT |
President restarts arbitration thread
[state= 或
或
或
或
或
或
Prepare arbitrator node
Receive arbitrator node
Started arbitrator node
Lost arbitrator node
Lost arbitrator node
Lost arbitrator node
|
这是关于集群中仲裁的当前状态和进度的报告。node_id 是被选为仲裁者的管理节点或 SQL 节点的节点 ID。state_code 是仲裁状态代码,如在
include/kernel/signaldata/ArbitSignalData.hpp . 发生错误时,将
提供error_message 也在 中定义的
ArbitSignalData.hpp 。
ticket_id 是仲裁员在被选中时分发给所有参与其选择的节点的唯一标识符;这用于确保每个请求仲裁的节点都是参与选择过程的节点之一。 |
ArbitState |
NodeRestart |
6个 | INFO |
Arbitration check lost - less than 1/2 nodes left 或
Arbitration check won - all node groups and more
than 1/2 nodes left 或Arbitration
check won - node group majority 或
Arbitration check lost - missing node
group 或Network partitioning -
arbitration required 或或
或
或或Arbitration won
- positive reply from node
Arbitration lost - negative reply from node
Network partitioning - no arbitrator
available Network partitioning - no
arbitrator configured Arbitration
failure - |
此消息报告仲裁结果。在仲裁失败的情况下,
提供error_message 仲裁state_code ;这两个的定义都可以在
include/kernel/signaldata/ArbitSignalData.hpp . |
ArbitResult |
NodeRestart |
2个 | ALERT |
Node |
该节点正在尝试承担下一个全局检查点的责任(即它正在成为主节点) | GCP_TakeoverStarted |
NodeRestart |
7 | INFO |
Node |
该节点已经成为master,并承担了下一个全局检查点的责任 | GCP_TakeoverCompleted |
NodeRestart |
7 | INFO |
Node |
该节点正在尝试承担下一组本地检查点的责任(即它正在成为主节点) | LCP_TakeoverStarted |
NodeRestart |
7 | INFO |
Node |
该节点已经成为主节点,并承担了下一组本地检查点的责任 | LCP_TakeoverCompleted |
NodeRestart |
7 | INFO |
Node |
这种交易活动报告大约每 10 秒给出一次 | TransReportCounters |
Statistic |
8个 | INFO |
Node |
此节点执行的操作数,大约每 10 秒提供一次 | OperationReportCounters |
Statistic |
8个 | INFO |
Node |
已创建具有所示表 ID 的表 | TableCreated |
Statistic |
7 | INFO |
Node |
JobStatistic |
Statistic |
9 | INFO |
|
Mean send size to Node = |
该节点每次发送到节点的平均bytes
字节数node_id |
SendBytesStatistic |
Statistic |
9 | INFO |
Mean receive size to Node = |
bytes 每次从节点接收数据时,
该节点平均接收数据node_id |
ReceiveBytesStatistic |
Statistic |
9 | INFO |
Node /
Node |
DUMP
1000 当在集群管理客户端中发出命令时生成此报告 |
MemoryUsage |
Statistic |
5个 | INFO |
Node |
与节点通信时发生传输器错误
node2_id ;有关传输器错误代码和消息的列表,请参阅
MySQL NDB Cluster Internals Manual中的
NDB Transporter Errors |
TransporterError |
Error |
2个 | ERROR |
Node |
与节点通信时潜在传输器问题的警告node2_id ;有关传输器错误代码和消息的列表,请参阅
NDB 传输器错误,了解更多信息 |
TransporterWarning |
Error |
8个 | WARNING |
Node |
此节点错过了来自节点的心跳
node2_id |
MissedHeartbeat |
Error |
8个 | WARNING |
Node |
此节点至少错过了 3 个来自节点的心跳
node2_id ,因此已宣布该节点“已死” |
DeadDueToHeartbeat |
Error |
8个 | ALERT |
Node |
此节点已向节点发送心跳
node2_id |
SentHeartbeat |
Info |
12 | INFO |
( NDB 7.5.0 及更早版本:)Node
|
在大量使用事件缓冲区期间会看到此报告,例如,在相对较短的时间内应用许多更新时;该报告显示字节数和已用事件缓冲区内存的百分比、分配的字节数和仍然可用的百分比,以及最新和最新的可恢复时期 | EventBufferStatus |
Info |
7 | INFO |
( NDB 7.5.1 及更高版本:)Node
|
在大量使用事件缓冲区期间会看到此报告,例如,在相对较短的时间内应用许多更新时;该报告显示字节数和已用事件缓冲区内存的百分比、分配的字节数和仍然可用的百分比,以及最新缓冲和消耗的时期;有关更多信息,请参阅 第 21.6.2.3 节,“集群日志中的事件缓冲区报告” | EventBufferStatus2 |
Info |
7 | INFO |
Node , ,Node
Node
|
这些报告在进入和退出单用户模式时写入集群日志;API_node_id
是对集群具有独占访问权限的 API 或 SQL 的节点 ID(有关更多信息,请参阅
第 21.6.6 节,“NDB 集群单用户模式”);该消息表明发生了错误,在正常操作中不应出现Unknown single user report
|
SingleUser |
Info |
7 | INFO |
Node |
已使用具有的管理节点开始备份
mgm_node_id ;START BACKUP 发出命令时,此消息也会显示在集群管理客户端
中;有关更多信息,请参阅
第 21.6.8.2 节,“使用 NDB Cluster Management Client 创建备份” |
BackupStarted |
Backup |
7 | INFO |
Node |
具有ID的备份backup_id 已经完成;有关更多信息,请参阅
第 21.6.8.2 节,“使用 NDB Cluster Management Client 创建备份” |
BackupCompleted |
Backup |
7 | INFO |
Node |
备份启动失败;有关错误代码,请参阅 MGM API 错误 | BackupFailedToStart |
Backup |
7 | ALERT |
Node |
备份在启动后终止,可能是由于用户干预 | BackupAborted |
Backup |
7 | ALERT |