18.6.2.1 NDB Cluster：集群日志中的消息

MySQL 8.0 参考手册 / 第 23 章 MySQL NDB Cluster 8.0 / 23.6 NDB Cluster的管理 / 23.6.2 NDB Cluster 日志消息 / 18.6.2.1 NDB Cluster：集群日志中的消息

18.6.2.1 NDB Cluster：集群日志中的消息

下表列出了最常见的 NDB集群日志消息。有关集群日志、日志事件和事件类型的信息，请参阅第 18.6.3 节，“NDB Cluster 中生成的事件报告”。这些日志消息也对应于 MGM API 中的日志事件类型；有关 Cluster API 开发人员感兴趣的相关信息，请参阅 Ndb_logevent_type 类型。

表 18.39 常见的 NDB cluster 日志消息

日志消息	描述	活动名称	事件类型	优先	严重性
`Node mgm_node_id: Node data_node_id Connected`	具有节点 ID 的数据节点`node_id`已连接到管理服务器（节点 `mgm_node_id`）。	`Connected`	`Connection`	8个	`INFO`
`Node mgm_node_id: Node data_node_id Disconnected`	具有节点 ID 的数据节点`data_node_id`已与管理服务器 (node ) 断开连接 `mgm_node_id`。	`Disconnected`	`Connection`	8个	`ALERT`
`Node data_node_id: Communication to Node api_node_id closed`	具有节点 ID 的 API 节点或 SQL 节点 `api_node_id`不再与数据节点通信 `data_node_id`。	`CommunicationClosed`	`Connection`	8个	`INFO`
`Node data_node_id: Communication to Node api_node_id opened`	具有节点 ID 的 API 节点或 SQL 节点 `api_node_id`现在正在与数据节点通信 `data_node_id`。	`CommunicationOpened`	`Connection`	8个	`INFO`
`Node mgm_node_id: Node api_node_id: API version`	具有节点ID的API节点已使用 API版本 `api_node_id`连接到管理节点（通常与MySQL版本号相同）。`mgm_node_id``NDB``version`	`ConnectedApiVersion`	`Connection`	8个	`INFO`
`Node node_id: Global checkpoint gci started`	一个ID为全局的checkpoint`gci`已经启动；节点`node_id`是负责此全局检查点的主节点。	`GlobalCheckpointStarted`	`Checkpoint`	9	`INFO`
`Node node_id: Global checkpoint gci completed`	具有ID的全局检查点`gci`已经完成；节点`node_id` 是负责这个全局检查点的主节点。	`GlobalCheckpointCompleted`	`Checkpoint`	10	`INFO`
`Node node_id: Local checkpoint lcp started. Keep GCI = current_gci oldest restorable GCI = old_gci`	具有序列 ID 的本地检查点`lcp` 已在节点上启动 `node_id`。可以使用的最新 GCI 具有 index `current_gci`，而可以从中恢复集群的最旧 GCI 具有 index `old_gci`。	`LocalCheckpointStarted`	`Checkpoint`	7	`INFO`
`Node node_id: Local checkpoint lcp completed`	`lcp` 节点上具有序列 ID 的本地检查点`node_id`已完成。	`LocalCheckpointCompleted`	`Checkpoint`	8个	`INFO`
`Node node_id: Local Checkpoint stopped in CALCULATED_KEEP_GCI`	节点无法确定最近可用的 GCI。	`LCPStoppedInCalcKeepGci`	`Checkpoint`	0	`ALERT`
`Node node_id: Table ID = table_id, fragment ID = fragment_id has completed LCP on Node node_id maxGciStarted: started_gci maxGciCompleted: completed_gci`	一个表片段已被检查点到节点上的磁盘 `node_id`。进行中的 GCI 有索引`started_gci`，最近完成的 GCI 有索引 `completed_gci`。	`LCPFragmentCompleted`	`Checkpoint`	11	`INFO`
`Node node_id: ACC Blocked num_1 and TUP Blocked num_2 times last second`	撤消日志记录被阻止，因为日志缓冲区接近溢出。	`UndoLogBlocked`	`Checkpoint`	7	`INFO`
`Node node_id: Start initiated version`	`node_id`运行 `NDB`版本的数据节点`version`正在开始其启动过程。	`NDBStartStarted`	`StartUp`	1个	`INFO`
`Node node_id: Started version`	`node_id`运行 `NDB`版本的数据节点`version`已成功启动。	`NDBStartCompleted`	`StartUp`	1个	`INFO`
`Node node_id: STTORRY received after restart finished`	节点已收到指示集群重启已完成的信号。	`STTORRYRecieved`	`StartUp`	15	`INFO`
`Node node_id: Start phase phase completed (type)`	该节点已完成启动`phase`的启动阶段`type`。有关启动阶段的列表，请参阅第 18.6.4 节，“NDB Cluster 启动阶段的摘要”。（`type`是 `initial`、`system`、 `node`、`initial node`或之一`<Unknown>`。）	`StartPhaseCompleted`	`StartUp`	4个	`INFO`
`Node node_id: CM_REGCONF president = president_id, own Node = own_id, our dynamic id = dynamic_id`	节点`president_id`已被选为 “总统”。 `own_id`并且 `dynamic_id`应该始终与`node_id`报告节点的 ID ( ) 相同。	`CM_REGCONF`	`StartUp`	3个	`INFO`
`Node node_id: CM_REGREF from Node president_id to our Node node_id. Cause = cause`	报告节点 (ID `node_id`) 无法接受节点`president_id`作为总统。问题的`cause`是`Busy`、 `Election with wait = false`、 `Not president`、`Election without selecting new candidate`或之一`No such cause`。	`CM_REGREF`	`StartUp`	8个	`INFO`
`Node node_id: We are Node own_id with dynamic ID dynamic_id, our left neighbor is Node id_1, our right is Node id_2`	该节点已发现其在集群中的相邻节点（节点 `id_1`和节点 `id_2`）。 `node_id`, `own_id`, 并且 `dynamic_id`应该始终相同；如果不是，则表明集群节点配置严重错误。	`FIND_NEIGHBOURS`	`StartUp`	8个	`INFO`
`Node node_id: type shutdown initiated`	节点已收到关闭信号。shutdown`type`是 `Cluster`或。 `Node`	`NDBStopStarted`	`StartUp`	1个	`INFO`
`Node node_id: Node shutdown completed`[ ] [ ]`, actionInitiated by signal signal.`	节点已关闭。此报告可能包含 `action`，如果存在，则为`restarting`、`no start`或之一`initial`。该报告还可能包括对 `NDB`议定书的引用`signal`；有关可能的信号，请参阅操作和信号。	`NDBStopCompleted`	`StartUp`	1个	`INFO`
`Node node_id: Forced node shutdown completed`[ `, action`] `.`[ ] [ ] [ [ ]]`Occurred during startphase start_phase.Initiated by signal.Caused by error error_code: 'error_message(error_classification). error_status'.(extra info extra_code)`	节点已被强制关闭。随后采取的 `action`（、或之一 `restarting`）`no start`，如果有的话，也会被报告。`initial`如果关闭发生在节点启动时，则报告包括`start_phase`节点发生故障的时间。如果这是 `signal`发送到节点的结果，则还会提供此信息（有关更多信息，请参阅操作和信号）。如果导致失败的错误是已知的，这也包括在内；有关 `NDB`错误消息和分类的更多信息，请参阅NDB Cluster API 错误。	`NDBStopForced`	`StartUp`	1个	`ALERT`
`Node node_id: Node shutdown aborted`	节点关闭过程被用户中止。	`NDBStopAborted`	`StartUp`	1个	`INFO`
`Node node_id: StartLog: [GCI Keep: keep_pos LastCompleted: last_pos NewestRestorable: restore_pos]`	这会报告在节点启动期间引用的全局检查点。之前的重做日志`keep_pos`被丢弃。`last_pos`是数据节点参与的最后一个全局检查点； `restore_pos`是实际用于恢复所有数据节点的全局检查点。	`StartREDOLog`	`StartUp`	4个	`INFO`
`startup_message`[单独列出；见下文。]	在不同情况下可以记录许多可能的启动消息。这些是单独列出的；请参阅第 18.6.2.2 节，“NDB Cluster 日志启动消息”。	`StartReport`	`StartUp`	4个	`INFO`
`Node node_id: Node restart completed copy of dictionary information`	已完成将数据字典信息复制到重启的节点。	`NR_CopyDict`	`NodeRestart`	8个	`INFO`
`Node node_id: Node restart completed copy of distribution information`	已完成向重启节点复制数据分布信息。	`NR_CopyDistr`	`NodeRestart`	8个	`INFO`
`Node node_id: Node restart starting to copy the fragments to Node node_id`	片段复制到起始数据节点 `node_id`已经开始	`NR_CopyFragsStarted`	`NodeRestart`	8个	`INFO`
`Node node_id: Table ID = table_id, fragment ID = fragment_id have been copied to Node node_id`	`fragment_id`表中的片段`table_id`已复制到数据节点`node_id`	`NR_CopyFragDone`	`NodeRestart`	10	`INFO`
`Node node_id: Node restart completed copying the fragments to Node node_id`	`node_id`已完成将所有表碎片复制到重新启动的数据节点	`NR_CopyFragsCompleted`	`NodeRestart`	8个	`INFO`
`Node node_id: Node node1_id completed failure of Node node2_id`	数据节点`node1_id`检测到数据节点故障`node2_id`	`NodeFailCompleted`	`NodeRestart`	8个	`ALERT`
`All nodes completed failure of Node node_id`	所有（剩余）数据节点都检测到数据节点故障 `node_id`	`NodeFailCompleted`	`NodeRestart`	8个	`ALERT`
`Node failure of node_idblock completed`	`node_id`在内核块中检测到数据节点故障，其中块是、、或中的 1 个；有关详细信息，请参阅 NDB 内核块`block``NDBDBTCDBDICTDBDIHDBLQH`	`NodeFailCompleted`	`NodeRestart`	8个	`ALERT`
`Node mgm_node_id: Node data_node_id has failed. The Node state at failure was state_code`	数据节点发生故障。它在失败时的状态由仲裁状态代码描述 `state_code`：可以在文件中找到可能的状态代码值 `include/kernel/signaldata/ArbitSignalData.hpp`。	`NODE_FAILREP`	`NodeRestart`	8个	`ALERT`
`President restarts arbitration thread [state=state_code]`或或或或或或 `Prepare arbitrator node node_id [ticket=ticket_id]Receive arbitrator node node_id [ticket=ticket_id]Started arbitrator node node_id [ticket=ticket_id]Lost arbitrator node node_id - process failure [state=state_code]Lost arbitrator node node_id - process exit [state=state_code]Lost arbitrator node node_id - error_message [state=state_code]`	这是关于集群中仲裁的当前状态和进度的报告。`node_id`是被选为仲裁者的管理节点或 SQL 节点的节点 ID。`state_code`是仲裁状态代码，如在 `include/kernel/signaldata/ArbitSignalData.hpp`. 发生错误时，将提供`error_message`也在中定义的 `ArbitSignalData.hpp`。 `ticket_id`是仲裁员在被选中时分发给所有参与其选择的节点的唯一标识符；这用于确保每个请求仲裁的节点都是参与选择过程的节点之一。	`ArbitState`	`NodeRestart`	6个	`INFO`
`Arbitration check lost - less than 1/2 nodes left`或 `Arbitration check won - all node groups and more than 1/2 nodes left`或`Arbitration check won - node group majority`或 `Arbitration check lost - missing node group`或`Network partitioning - arbitration required`或或或或或`Arbitration won - positive reply from node node_idArbitration lost - negative reply from node node_idNetwork partitioning - no arbitrator availableNetwork partitioning - no arbitrator configuredArbitration failure - error_message [state=state_code]`	此消息报告仲裁结果。在仲裁失败的情况下，提供`error_message`仲裁`state_code`；这两个的定义都可以在 `include/kernel/signaldata/ArbitSignalData.hpp`.	`ArbitResult`	`NodeRestart`	2个	`ALERT`
`Node node_id: GCP Take over started`	该节点正在尝试承担下一个全局检查点的责任（即它正在成为主节点）	`GCP_TakeoverStarted`	`NodeRestart`	7	`INFO`
`Node node_id: GCP Take over completed`	该节点已经成为master，并承担了下一个全局检查点的责任	`GCP_TakeoverCompleted`	`NodeRestart`	7	`INFO`
`Node node_id: LCP Take over started`	该节点正在尝试承担下一组本地检查点的责任（即它正在成为主节点）	`LCP_TakeoverStarted`	`NodeRestart`	7	`INFO`
`Node node_id: LCP Take over completed`	该节点已经成为主节点，并承担了下一组本地检查点的责任	`LCP_TakeoverCompleted`	`NodeRestart`	7	`INFO`
`Node node_id: Trans. Count = transactions, Commit Count = commits, Read Count = reads, Simple Read Count = simple_reads, Write Count = writes, AttrInfo Count = AttrInfo_objects, Concurrent Operations = concurrent_operations, Abort Count = aborts, Scans = scans, Range scans = range_scans`	这种交易活动报告大约每 10 秒给出一次	`TransReportCounters`	`Statistic`	8个	`INFO`
`Node node_id: Operations=operations`	此节点执行的操作数，大约每 10 秒提供一次	`OperationReportCounters`	`Statistic`	8个	`INFO`
`Node node_id: Table with ID = table_id created`	已创建具有所示表 ID 的表	`TableCreated`	`Statistic`	7	`INFO`
`Node node_id: Mean loop Counter in doJob last 8192 times = count`		`JobStatistic`	`Statistic`	9	`INFO`
`Mean send size to Node = node_id last 4096 sends = bytes bytes`	该节点每次发送到节点的平均`bytes` 字节数`node_id`	`SendBytesStatistic`	`Statistic`	9	`INFO`
`Mean receive size to Node = node_id last 4096 sends = bytes bytes`	`bytes`每次从节点接收数据时，该节点平均接收数据`node_id`	`ReceiveBytesStatistic`	`Statistic`	9	`INFO`
`Node node_id: Data usage is data_memory_percentage% (data_pages_used 32K pages of total data_pages_total)`/ `Node node_id: Index usage is index_memory_percentage% (index_pages_used 8K pages of total index_pages_total)`	该报告`DUMP 1000`在集群管理客户端中发出命令时生成；有关更多信息，请参阅 MySQL NDB Cluster 内部手册中的 DUMP 1000	`MemoryUsage`	`Statistic`	5个	`INFO`
`Node node1_id: Transporter to node node2_id reported error error_code: error_message`	与节点通信时发生传输器错误 `node2_id`；有关传输器错误代码和消息的列表，请参阅 MySQL NDB Cluster Internals Manual中的 NDB Transporter Errors	`TransporterError`	`Error`	2个	`ERROR`
`Node node1_id: Transporter to node node2_id reported error error_code: error_message`	与节点通信时潜在传输器问题的警告`node2_id`；有关传输器错误代码和消息的列表，请参阅 NDB 传输器错误，了解更多信息	`TransporterWarning`	`Error`	8个	`WARNING`
`Node node1_id: Node node2_id missed heartbeat heartbeat_id`	此节点错过了来自节点的心跳 `node2_id`	`MissedHeartbeat`	`Error`	8个	`WARNING`
`Node node1_id: Node node2_id declared dead due to missed heartbeat`	此节点至少错过了 3 个来自节点的心跳 `node2_id`，因此已宣布该节点“已死”	`DeadDueToHeartbeat`	`Error`	8个	`ALERT`
`Node node1_id: Node Sent Heartbeat to node = node2_id`	此节点已向节点发送心跳 `node2_id`	`SentHeartbeat`	`Info`	12	`INFO`
( NDB 7.5.0 及更早版本:)`Node node_id: Event buffer status: used=bytes_used (percent_used%) alloc=bytes_allocated (percent_available%) max=bytes_available apply_epoch=latest_restorable_epoch latest_epoch=latest_epoch`	在大量使用事件缓冲区期间会看到此报告，例如，在相对较短的时间内应用许多更新时；该报告显示字节数和已用事件缓冲区内存的百分比、分配的字节数和仍然可用的百分比，以及最新和最新的可恢复时期	`EventBufferStatus`	`Info`	7	`INFO`
`Node node_id: Entering single user mode`, ,`Node node_id: Entered single user mode Node API_node_id has exclusive accessNode node_id: Entering single user mode`	这些报告在进入和退出单用户模式时写入集群日志；`API_node_id` 是对集群具有独占访问权限的 API 或 SQL 的节点 ID（有关更多信息，请参阅第 18.6.6 节，“NDB 集群单用户模式”）；该消息表明发生了错误，在正常操作中不应出现`Unknown single user report API_node_id`	`SingleUser`	`Info`	7	`INFO`
`Node node_id: Backup backup_id started from node mgm_node_id`	已使用具有的管理节点开始备份 `mgm_node_id`；`START BACKUP`发出命令时，此消息也会显示在集群管理客户端中；有关更多信息，请参阅第 18.6.8.2 节，“使用 NDB Cluster Management Client 创建备份”	`BackupStarted`	`Backup`	7	`INFO`
`Node node_id: Backup backup_id started from node mgm_node_id completed. StartGCP: start_gcp StopGCP: stop_gcp #Records: records #LogRecords: log_records Data: data_bytes bytes Log: log_bytes bytes`	具有ID的备份`backup_id`已经完成；有关更多信息，请参阅第 18.6.8.2 节，“使用 NDB Cluster Management Client 创建备份”	`BackupCompleted`	`Backup`	7	`INFO`
`Node node_id: Backup request from mgm_node_id failed to start. Error: error_code`	备份启动失败；有关错误代码，请参阅 MGM API 错误	`BackupFailedToStart`	`Backup`	7	`ALERT`
`Node node_id: Backup backup_id started from mgm_node_id has been aborted. Error: error_code`	备份在启动后终止，可能是由于用户干预	`BackupAborted`	`Backup`	7	`ALERT`