MySQL 8.0 参考手册 / 第 23 章 MySQL NDB Cluster 8.0 / 23.6 NDB Cluster的管理 / 23.6.2 NDB Cluster 日志消息 /
21.6.2.1 NDB Cluster:Cluster 日志中的消息
下表列出了最常见的
NDB集群日志消息。有关集群日志、日志事件和事件类型的信息,请参阅第 21.6.3 节,“NDB Cluster 中生成的事件报告”。这些日志消息也对应于 MGM API 中的日志事件类型;有关 Cluster API 开发人员感兴趣的相关信息,
请参阅
Ndb_logevent_type 类型。
表 21.47 常见的 NDB cluster 日志消息
| 日志消息 | 描述 | 活动名称 | 事件类型 | 优先 | 严重性 |
|---|---|---|---|---|---|
Node |
具有节点 ID 的数据节点node_id已连接到管理服务器(节点
mgm_node_id)。 |
Connected |
Connection |
8个 | INFO |
Node |
具有节点 ID 的数据节点data_node_id已与管理服务器 (node ) 断开连接
mgm_node_id。 |
Disconnected |
Connection |
8个 | ALERT |
Node |
具有节点 ID 的 API 节点或 SQL 节点
api_node_id不再与数据节点通信
data_node_id。 |
CommunicationClosed |
Connection |
8个 | INFO |
Node |
具有节点 ID 的 API 节点或 SQL 节点
api_node_id现在正在与数据节点通信
data_node_id。 |
CommunicationOpened |
Connection |
8个 | INFO |
Node |
具有节点ID的API节点已使用
API版本
api_node_id连接到管理节点
(通常与MySQL版本号相同)。mgm_node_idNDBversion |
ConnectedApiVersion |
Connection |
8个 | INFO |
Node |
一个ID为全局的checkpointgci已经启动;节点node_id是负责此全局检查点的主节点。 |
GlobalCheckpointStarted |
Checkpoint |
9 | INFO |
Node |
具有ID的全局检查点gci已经完成;节点node_id
是负责这个全局检查点的主节点。 |
GlobalCheckpointCompleted |
Checkpoint |
10 | INFO |
Node |
具有序列 ID 的本地检查点lcp
已在节点上启动
node_id。可以使用的最新 GCI 具有 index
current_gci,而可以从中恢复集群的最旧 GCI 具有 index
old_gci。 |
LocalCheckpointStarted |
Checkpoint |
7 | INFO |
Node |
lcp
节点上具有序列 ID 的本地检查点node_id已完成。 |
LocalCheckpointCompleted |
Checkpoint |
8个 | INFO |
Node |
节点无法确定最近可用的 GCI。 | LCPStoppedInCalcKeepGci |
Checkpoint |
0 | ALERT |
Node |
一个表片段已被检查点到节点上的磁盘
node_id。进行中的 GCI 有索引started_gci,最近完成的 GCI 有索引
completed_gci。 |
LCPFragmentCompleted |
Checkpoint |
11 | INFO |
Node |
撤消日志记录被阻止,因为日志缓冲区接近溢出。 | UndoLogBlocked |
Checkpoint |
7 | INFO |
Node |
node_id运行
NDB版本
的数据节点version正在开始其启动过程。 |
NDBStartStarted |
StartUp |
1个 | INFO |
Node |
node_id运行
NDB版本
的数据节点version已成功启动。 |
NDBStartCompleted |
StartUp |
1个 | INFO |
Node |
节点已收到指示集群重启已完成的信号。 | STTORRYRecieved |
StartUp |
15 | INFO |
Node |
该节点已完成启动phase的
启动阶段type。有关启动阶段的列表,请参阅
第 21.6.4 节,“NDB Cluster 启动阶段的摘要”。(type是
initial、system、
node、initial node或之一<Unknown>。) |
StartPhaseCompleted |
StartUp |
4个 | INFO |
Node |
节点president_id已被选为
“总统”。
own_id并且
dynamic_id应该始终与node_id报告节点的 ID ( ) 相同。 |
CM_REGCONF |
StartUp |
3个 | INFO |
Node |
报告节点 (ID node_id) 无法接受节点president_id作为总统。问题的cause是Busy、
Election with wait = false、
Not president、Election
without selecting new candidate或之一No
such cause。 |
CM_REGREF |
StartUp |
8个 | INFO |
Node |
该节点已发现其在集群中的相邻节点(节点
id_1和节点
id_2)。
node_id,
own_id, 并且
dynamic_id应该始终相同;如果不是,则表明集群节点配置严重错误。 |
FIND_NEIGHBOURS |
StartUp |
8个 | INFO |
Node |
节点已收到关闭信号。shutdowntype是
Cluster或。
Node |
NDBStopStarted |
StartUp |
1个 | INFO |
Node [ ] [ ],
Initiated by signal
|
节点已关闭。此报告可能包含
action,如果存在,则为restarting、no
start或之一initial。该报告还可能包括对
NDB议定书
的引用signal;有关可能的信号,请参阅
操作和信号。 |
NDBStopCompleted |
StartUp |
1个 | INFO |
Node [ ,
action] .[ ] [ ] [
[ ]]Occurred
during startphase
Initiated by
Caused by error
(extra info
|
节点已被强制关闭。随后采取的
action( 、 或 之一
restarting)no
start,如果有的话,也会被报告。initial如果关闭发生在节点启动时,则报告包括start_phase节点发生故障的时间。如果这是
signal发送到节点的结果,则还会提供此信息(有关更多信息,请参阅
操作和信号)。如果导致失败的错误是已知的,这也包括在内;有关
NDB错误消息和分类的更多信息,请参阅NDB Cluster API 错误。 |
NDBStopForced |
StartUp |
1个 | ALERT |
Node |
节点关闭过程被用户中止。 | NDBStopAborted |
StartUp |
1个 | INFO |
Node |
这会报告在节点启动期间引用的全局检查点。之前的重做日志keep_pos被丢弃。last_pos是数据节点参与的最后一个全局检查点;
restore_pos是实际用于恢复所有数据节点的全局检查点。 |
StartREDOLog |
StartUp |
4个 | INFO |
startup_message[单独列出;见下文。] |
在不同情况下可以记录许多可能的启动消息。这些是单独列出的;请参阅 第 21.6.2.2 节,“NDB Cluster 日志启动消息”。 | StartReport |
StartUp |
4个 | INFO |
Node |
已完成将数据字典信息复制到重启的节点。 | NR_CopyDict |
NodeRestart |
8个 | INFO |
Node |
已完成向重启节点复制数据分布信息。 | NR_CopyDistr |
NodeRestart |
8个 | INFO |
Node |
片段复制到起始数据节点
node_id已经开始 |
NR_CopyFragsStarted |
NodeRestart |
8个 | INFO |
Node |
fragment_id表
中的片段table_id已复制到数据节点node_id |
NR_CopyFragDone |
NodeRestart |
10 | INFO |
Node |
node_id已完成将所有表碎片复制到重新启动的数据节点
|
NR_CopyFragsCompleted |
NodeRestart |
8个 | INFO |
Node |
数据节点node1_id检测到数据节点故障node2_id |
NodeFailCompleted |
NodeRestart |
8个 | ALERT |
All nodes completed failure of Node
|
所有(剩余)数据节点都检测到数据节点故障
node_id |
NodeFailCompleted |
NodeRestart |
8个 | ALERT |
Node failure of
|
node_id在内核块中检测到
数据节点故障
,其中块是
、
、
或
中的 1 个;有关详细信息,请参阅
NDB 内核块blockNDBDBTCDBDICTDBDIHDBLQH |
NodeFailCompleted |
NodeRestart |
8个 | ALERT |
Node |
数据节点发生故障。它在失败时的状态由仲裁状态代码描述
state_code:可以在文件中找到可能的状态代码值
include/kernel/signaldata/ArbitSignalData.hpp。 |
NODE_FAILREP |
NodeRestart |
8个 | ALERT |
President restarts arbitration thread
[state=或
或
或
或
或
或
Prepare arbitrator node
Receive arbitrator node
Started arbitrator node
Lost arbitrator node
Lost arbitrator node
Lost arbitrator node
|
这是关于集群中仲裁的当前状态和进度的报告。node_id是被选为仲裁者的管理节点或 SQL 节点的节点 ID。state_code是仲裁状态代码,如在
include/kernel/signaldata/ArbitSignalData.hpp. 发生错误时,将
提供error_message也在 中定义的
ArbitSignalData.hpp。
ticket_id是仲裁员在被选中时分发给所有参与其选择的节点的唯一标识符;这用于确保每个请求仲裁的节点都是参与选择过程的节点之一。 |
ArbitState |
NodeRestart |
6个 | INFO |
Arbitration check lost - less than 1/2 nodes left或
Arbitration check won - all node groups and more
than 1/2 nodes left或Arbitration
check won - node group majority或
Arbitration check lost - missing node
group或Network partitioning -
arbitration required或或
或
或或Arbitration won
- positive reply from node
Arbitration lost - negative reply from node
Network partitioning - no arbitrator
availableNetwork partitioning - no
arbitrator configuredArbitration
failure - |
此消息报告仲裁结果。在仲裁失败的情况下,
提供error_message仲裁state_code;这两个的定义都可以在
include/kernel/signaldata/ArbitSignalData.hpp. |
ArbitResult |
NodeRestart |
2个 | ALERT |
Node |
该节点正在尝试承担下一个全局检查点的责任(即它正在成为主节点) | GCP_TakeoverStarted |
NodeRestart |
7 | INFO |
Node |
该节点已经成为master,并承担了下一个全局检查点的责任 | GCP_TakeoverCompleted |
NodeRestart |
7 | INFO |
Node |
该节点正在尝试承担下一组本地检查点的责任(即它正在成为主节点) | LCP_TakeoverStarted |
NodeRestart |
7 | INFO |
Node |
该节点已经成为主节点,并承担了下一组本地检查点的责任 | LCP_TakeoverCompleted |
NodeRestart |
7 | INFO |
Node |
这种交易活动报告大约每 10 秒给出一次 | TransReportCounters |
Statistic |
8个 | INFO |
Node |
此节点执行的操作数,大约每 10 秒提供一次 | OperationReportCounters |
Statistic |
8个 | INFO |
Node |
已创建具有所示表 ID 的表 | TableCreated |
Statistic |
7 | INFO |
Node |
JobStatistic |
Statistic |
9 | INFO |
|
Mean send size to Node = |
该节点每次发送到节点的平均bytes
字节数node_id |
SendBytesStatistic |
Statistic |
9 | INFO |
Mean receive size to Node = |
bytes每次从节点接收数据时,
该节点平均接收数据node_id |
ReceiveBytesStatistic |
Statistic |
9 | INFO |
Node /
Node |
DUMP
1000当在集群管理客户端中发出命令时生成此报告 |
MemoryUsage |
Statistic |
5个 | INFO |
Node |
与节点通信时发生传输器错误
node2_id;有关传输器错误代码和消息的列表,请参阅
MySQL NDB Cluster Internals Manual中的
NDB Transporter Errors |
TransporterError |
Error |
2个 | ERROR |
Node |
与节点通信时潜在传输器问题的警告node2_id;有关传输器错误代码和消息的列表,请参阅
NDB 传输器错误,了解更多信息 |
TransporterWarning |
Error |
8个 | WARNING |
Node |
此节点错过了来自节点的心跳
node2_id |
MissedHeartbeat |
Error |
8个 | WARNING |
Node |
此节点至少错过了 3 个来自节点的心跳
node2_id,因此已宣布该节点“已死” |
DeadDueToHeartbeat |
Error |
8个 | ALERT |
Node |
此节点已向节点发送心跳
node2_id |
SentHeartbeat |
Info |
12 | INFO |
( NDB 7.5.0 及更早版本:)Node
|
在大量使用事件缓冲区期间会看到此报告,例如,在相对较短的时间内应用许多更新时;该报告显示字节数和已用事件缓冲区内存的百分比、分配的字节数和仍然可用的百分比,以及最新和最新的可恢复时期 | EventBufferStatus |
Info |
7 | INFO |
( NDB 7.5.1 及更高版本:)Node
|
在大量使用事件缓冲区期间会看到此报告,例如,在相对较短的时间内应用许多更新时;该报告显示字节数和已用事件缓冲区内存的百分比、分配的字节数和仍然可用的百分比,以及最新缓冲和消耗的时期;有关更多信息,请参阅 第 21.6.2.3 节,“集群日志中的事件缓冲区报告” | EventBufferStatus2 |
Info |
7 | INFO |
Node , ,Node
Node
|
这些报告在进入和退出单用户模式时写入集群日志;API_node_id
是对集群具有独占访问权限的 API 或 SQL 的节点 ID(有关更多信息,请参阅
第 21.6.6 节,“NDB 集群单用户模式”);该消息表明发生了错误,在正常操作中不应出现Unknown single user report
|
SingleUser |
Info |
7 | INFO |
Node |
已使用具有的管理节点开始备份
mgm_node_id;START BACKUP发出命令时,此消息也会显示在集群管理客户端
中;有关更多信息,请参阅
第 21.6.8.2 节,“使用 NDB Cluster Management Client 创建备份” |
BackupStarted |
Backup |
7 | INFO |
Node |
具有ID的备份backup_id已经完成;有关更多信息,请参阅
第 21.6.8.2 节,“使用 NDB Cluster Management Client 创建备份” |
BackupCompleted |
Backup |
7 | INFO |
Node |
备份启动失败;有关错误代码,请参阅 MGM API 错误 | BackupFailedToStart |
Backup |
7 | ALERT |
Node |
备份在启动后终止,可能是由于用户干预 | BackupAborted |
Backup |
7 | ALERT |