Documentation Home
MySQL 8.0 参考手册  / 第 23 章 MySQL NDB Cluster 8.0  / 23.6 NDB Cluster的管理  / 23.6.2 NDB Cluster 日志消息  /  18.6.2.1 NDB Cluster:集群日志中的消息

18.6.2.1 NDB Cluster:集群日志中的消息

下表列出了最常见的 NDB集群日志消息。有关集群日志、日志事件和事件类型的信息,请参阅第 18.6.3 节,“NDB Cluster 中生成的事件报告”。这些日志消息也对应于 MGM API 中的日志事件类型;有关 Cluster API 开发人员感兴趣的相关信息, 请参阅 Ndb_logevent_type 类型。

表 18.39 常见的 NDB cluster 日志消息

日志消息 描述 活动名称 事件类型 优先 严重性
Node mgm_node_id: Node data_node_id Connected 具有节点 ID 的数据节点node_id已连接到管理服务器(节点 mgm_node_id)。 Connected Connection 8个 INFO
Node mgm_node_id: Node data_node_id Disconnected 具有节点 ID 的数据节点data_node_id已与管理服务器 (node ) 断开连接 mgm_node_id Disconnected Connection 8个 ALERT
Node data_node_id: Communication to Node api_node_id closed 具有节点 ID 的 API 节点或 SQL 节点 api_node_id不再与数据节点通信 data_node_id CommunicationClosed Connection 8个 INFO
Node data_node_id: Communication to Node api_node_id opened 具有节点 ID 的 API 节点或 SQL 节点 api_node_id现在正在与数据节点通信 data_node_id CommunicationOpened Connection 8个 INFO
Node mgm_node_id: Node api_node_id: API version 具有节点ID的API节点已使用 API​​版本 api_node_id连接到管理节点 (通常与MySQL版本号相同)。mgm_node_idNDBversion ConnectedApiVersion Connection 8个 INFO
Node node_id: Global checkpoint gci started 一个ID为全局的checkpointgci已经启动;节点node_id是负责此全局检查点的主节点。 GlobalCheckpointStarted Checkpoint 9 INFO
Node node_id: Global checkpoint gci completed 具有ID的全局检查点gci已经完成;节点node_id 是负责这个全局检查点的主节点。 GlobalCheckpointCompleted Checkpoint 10 INFO
Node node_id: Local checkpoint lcp started. Keep GCI = current_gci oldest restorable GCI = old_gci 具有序列 ID 的本地检查点lcp 已在节点上启动 node_id。可以使用的最新 GCI 具有 index current_gci,而可以从中恢复集群的最旧 GCI 具有 index old_gci LocalCheckpointStarted Checkpoint 7 INFO
Node node_id: Local checkpoint lcp completed lcp 节点上具有序列 ID 的本地检查点node_id已完成。 LocalCheckpointCompleted Checkpoint 8个 INFO
Node node_id: Local Checkpoint stopped in CALCULATED_KEEP_GCI 节点无法确定最近可用的 GCI。 LCPStoppedInCalcKeepGci Checkpoint 0 ALERT
Node node_id: Table ID = table_id, fragment ID = fragment_id has completed LCP on Node node_id maxGciStarted: started_gci maxGciCompleted: completed_gci 一个表片段已被检查点到节点上的磁盘 node_id。进行中的 GCI 有索引started_gci,最近完成的 GCI 有索引 completed_gci LCPFragmentCompleted Checkpoint 11 INFO
Node node_id: ACC Blocked num_1 and TUP Blocked num_2 times last second 撤消日志记录被阻止,因为日志缓冲区接近溢出。 UndoLogBlocked Checkpoint 7 INFO
Node node_id: Start initiated version node_id运行 NDB版本 的数据节点version正在开始其启动过程。 NDBStartStarted StartUp 1个 INFO
Node node_id: Started version node_id运行 NDB版本 的数据节点version已成功启动。 NDBStartCompleted StartUp 1个 INFO
Node node_id: STTORRY received after restart finished 节点已收到指示集群重启已完成的信号。 STTORRYRecieved StartUp 15 INFO
Node node_id: Start phase phase completed (type) 该节点已完成启动phase的 启动阶段type。有关启动阶段的列表,请参阅 第 18.6.4 节,“NDB Cluster 启动阶段的摘要”。(typeinitialsystemnodeinitial node或之一<Unknown>。) StartPhaseCompleted StartUp 4个 INFO
Node node_id: CM_REGCONF president = president_id, own Node = own_id, our dynamic id = dynamic_id 节点president_id已被选为 总统own_id并且 dynamic_id应该始终与node_id报告节点的 ID ( ) 相同。 CM_REGCONF StartUp 3个 INFO
Node node_id: CM_REGREF from Node president_id to our Node node_id. Cause = cause 报告节点 (ID node_id) 无法接受节点president_id作为总统。问题的causeBusyElection with wait = falseNot presidentElection without selecting new candidate或之一No such cause CM_REGREF StartUp 8个 INFO
Node node_id: We are Node own_id with dynamic ID dynamic_id, our left neighbor is Node id_1, our right is Node id_2 该节点已发现其在集群中的相邻节点(节点 id_1和节点 id_2)。 node_id, own_id, 并且 dynamic_id应该始终相同;如果不是,则表明集群节点配置严重错误。 FIND_NEIGHBOURS StartUp 8个 INFO
Node node_id: type shutdown initiated 节点已收到关闭信号。shutdowntypeCluster或。 Node NDBStopStarted StartUp 1个 INFO
Node node_id: Node shutdown completed [ ] [ ], actionInitiated by signal signal. 节点已关闭。此报告可能包含 action,如果存在,则为restartingno start或之一initial。该报告还可能包括对 NDB议定书 的引用signal;有关可能的信号,请参阅 操作和信号 NDBStopCompleted StartUp 1个 INFO
Node node_id: Forced node shutdown completed [ , action] .[ ] [ ] [ [ ]]Occurred during startphase start_phase. Initiated by signal.Caused by error error_code: 'error_message(error_classification). error_status'.(extra info extra_code) 节点已被强制关闭。随后采取的 action( 、 或 之一 restartingno start,如果有的话,也会被报告。initial如果关闭发生在节点启动时,则报告包括start_phase节点发生故障的时间。如果这是 signal发送到节点的结果,则还会提供此信息(有关更多信息,请参阅 操作和信号)。如果导致失败的错误是已知的,这也包括在内;有关 NDB错误消息和分类的更多信息,请参阅NDB Cluster API 错误 NDBStopForced StartUp 1个 ALERT
Node node_id: Node shutdown aborted 节点关闭过程被用户中止。 NDBStopAborted StartUp 1个 INFO
Node node_id: StartLog: [GCI Keep: keep_pos LastCompleted: last_pos NewestRestorable: restore_pos] 这会报告在节点启动期间引用的全局检查点。之前的重做日志keep_pos被丢弃。last_pos是数据节点参与的最后一个全局检查点; restore_pos是实际用于恢复所有数据节点的全局检查点。 StartREDOLog StartUp 4个 INFO
startup_message[单独列出;见下文。] 在不同情况下可以记录许多可能的启动消息。这些是单独列出的;请参阅 第 18.6.2.2 节,“NDB Cluster 日志启动消息” StartReport StartUp 4个 INFO
Node node_id: Node restart completed copy of dictionary information 已完成将数据字典信息复制到重启的节点。 NR_CopyDict NodeRestart 8个 INFO
Node node_id: Node restart completed copy of distribution information 已完成向重启节点复制数据分布信息。 NR_CopyDistr NodeRestart 8个 INFO
Node node_id: Node restart starting to copy the fragments to Node node_id 片段复制到起始数据节点 node_id已经开始 NR_CopyFragsStarted NodeRestart 8个 INFO
Node node_id: Table ID = table_id, fragment ID = fragment_id have been copied to Node node_id fragment_id表 中的片段table_id已复制到数据节点node_id NR_CopyFragDone NodeRestart 10 INFO
Node node_id: Node restart completed copying the fragments to Node node_id node_id已完成将所有表碎片复制到重新启动的数据节点 NR_CopyFragsCompleted NodeRestart 8个 INFO
Node node_id: Node node1_id completed failure of Node node2_id 数据节点node1_id检测到数据节点故障node2_id NodeFailCompleted NodeRestart 8个 ALERT
All nodes completed failure of Node node_id 所有(剩余)数据节点都检测到数据节点故障 node_id NodeFailCompleted NodeRestart 8个 ALERT
Node failure of node_idblock completed node_id在内核块中检测到 数据节点故障 ,其中块是 、 、 或 中的 1 个;有关详细信息,请参阅 NDB 内核块blockNDBDBTCDBDICTDBDIHDBLQH NodeFailCompleted NodeRestart 8个 ALERT
Node mgm_node_id: Node data_node_id has failed. The Node state at failure was state_code 数据节点发生故障。它在失败时的状态由仲裁状态代码描述 state_code:可以在文件中找到可能的状态代码值 include/kernel/signaldata/ArbitSignalData.hpp NODE_FAILREP NodeRestart 8个 ALERT
President restarts arbitration thread [state=state_code]或 或 或 或 或 或 Prepare arbitrator node node_id [ticket=ticket_id]Receive arbitrator node node_id [ticket=ticket_id]Started arbitrator node node_id [ticket=ticket_id]Lost arbitrator node node_id - process failure [state=state_code]Lost arbitrator node node_id - process exit [state=state_code]Lost arbitrator node node_id - error_message [state=state_code] 这是关于集群中仲裁的当前状态和进度的报告。node_id是被选为仲裁者的管理节点或 SQL 节点的节点 ID。state_code是仲裁状态代码,如在 include/kernel/signaldata/ArbitSignalData.hpp. 发生错误时,将 提供error_message也在 中定义的 ArbitSignalData.hppticket_id是仲裁员在被选中时分发给所有参与其选择的节点的唯一标识符;这用于确保每个请求仲裁的节点都是参与选择过程的节点之一。 ArbitState NodeRestart 6个 INFO
Arbitration check lost - less than 1/2 nodes leftArbitration check won - all node groups and more than 1/2 nodes leftArbitration check won - node group majorityArbitration check lost - missing node groupNetwork partitioning - arbitration required或或 或 或或Arbitration won - positive reply from node node_idArbitration lost - negative reply from node node_idNetwork partitioning - no arbitrator availableNetwork partitioning - no arbitrator configuredArbitration failure - error_message [state=state_code] 此消息报告仲裁结果。在仲裁失败的情况下, 提供error_message仲裁state_code;这两个的定义都可以在 include/kernel/signaldata/ArbitSignalData.hpp. ArbitResult NodeRestart 2个 ALERT
Node node_id: GCP Take over started 该节点正在尝试承担下一个全局检查点的责任(即它正在成为主节点) GCP_TakeoverStarted NodeRestart 7 INFO
Node node_id: GCP Take over completed 该节点已经成为master,并承担了下一个全局检查点的责任 GCP_TakeoverCompleted NodeRestart 7 INFO
Node node_id: LCP Take over started 该节点正在尝试承担下一组本地检查点的责任(即它正在成为主节点) LCP_TakeoverStarted NodeRestart 7 INFO
Node node_id: LCP Take over completed 该节点已经成为主节点,并承担了下一组本地检查点的责任 LCP_TakeoverCompleted NodeRestart 7 INFO
Node node_id: Trans. Count = transactions, Commit Count = commits, Read Count = reads, Simple Read Count = simple_reads, Write Count = writes, AttrInfo Count = AttrInfo_objects, Concurrent Operations = concurrent_operations, Abort Count = aborts, Scans = scans, Range scans = range_scans 这种交易活动报告大约每 10 秒给出一次 TransReportCounters Statistic 8个 INFO
Node node_id: Operations=operations 此节点执行的操作数,大约每 10 秒提供一次 OperationReportCounters Statistic 8个 INFO
Node node_id: Table with ID = table_id created 已创建具有所示表 ID 的表 TableCreated Statistic 7 INFO
Node node_id: Mean loop Counter in doJob last 8192 times = count JobStatistic Statistic 9 INFO
Mean send size to Node = node_id last 4096 sends = bytes bytes 该节点每次发送到节点的平均bytes 字节数node_id SendBytesStatistic Statistic 9 INFO
Mean receive size to Node = node_id last 4096 sends = bytes bytes bytes每次从节点接收数据时, 该节点平均接收数据node_id ReceiveBytesStatistic Statistic 9 INFO
Node node_id: Data usage is data_memory_percentage% (data_pages_used 32K pages of total data_pages_total)/ Node node_id: Index usage is index_memory_percentage% (index_pages_used 8K pages of total index_pages_total) 该报告DUMP 1000在集群管理客户端中发出命令时生成;有关更多信息,请参阅 MySQL NDB Cluster 内部手册中的 DUMP 1000 MemoryUsage Statistic 5个 INFO
Node node1_id: Transporter to node node2_id reported error error_code: error_message 与节点通信时发生传输器错误 node2_id;有关传输器错误代码和消息的列表,请参阅 MySQL NDB Cluster Internals Manual中的 NDB Transporter Errors TransporterError Error 2个 ERROR
Node node1_id: Transporter to node node2_id reported error error_code: error_message 与节点通信时潜在传输器问题的警告node2_id;有关传输器错误代码和消息的列表,请参阅 NDB 传输器错误,了解更多信息 TransporterWarning Error 8个 WARNING
Node node1_id: Node node2_id missed heartbeat heartbeat_id 此节点错过了来自节点的心跳 node2_id MissedHeartbeat Error 8个 WARNING
Node node1_id: Node node2_id declared dead due to missed heartbeat 此节点至少错过了 3 个来自节点的心跳 node2_id,因此已宣布该节点已死 DeadDueToHeartbeat Error 8个 ALERT
Node node1_id: Node Sent Heartbeat to node = node2_id 此节点已向节点发送心跳 node2_id SentHeartbeat Info 12 INFO
( NDB 7.5.0 及更早版本:)Node node_id: Event buffer status: used=bytes_used (percent_used%) alloc=bytes_allocated (percent_available%) max=bytes_available apply_epoch=latest_restorable_epoch latest_epoch=latest_epoch 在大量使用事件缓冲区期间会看到此报告,例如,在相对较短的时间内应用许多更新时;该报告显示字节数和已用事件缓冲区内存的百分比、分配的字节数和仍然可用的百分比,以及最新和最新的可恢复时期 EventBufferStatus Info 7 INFO
Node node_id: Entering single user mode, ,Node node_id: Entered single user mode Node API_node_id has exclusive accessNode node_id: Entering single user mode 这些报告在进入和退出单用户模式时写入集群日志;API_node_id 是对集群具有独占访问权限的 API 或 SQL 的节点 ID(有关更多信息,请参阅 第 18.6.6 节,“NDB 集群单用户模式”);该消息表明发生了错误,在正常操作中不应出现Unknown single user report API_node_id SingleUser Info 7 INFO
Node node_id: Backup backup_id started from node mgm_node_id 已使用具有的管理节点开始备份 mgm_node_idSTART BACKUP发出命令时,此消息也会显示在集群管理客户端 中;有关更多信息,请参阅 第 18.6.8.2 节,“使用 NDB Cluster Management Client 创建备份” BackupStarted Backup 7 INFO
Node node_id: Backup backup_id started from node mgm_node_id completed. StartGCP: start_gcp StopGCP: stop_gcp #Records: records #LogRecords: log_records Data: data_bytes bytes Log: log_bytes bytes 具有ID的备份backup_id已经完成;有关更多信息,请参阅 第 18.6.8.2 节,“使用 NDB Cluster Management Client 创建备份” BackupCompleted Backup 7 INFO
Node node_id: Backup request from mgm_node_id failed to start. Error: error_code 备份启动失败;有关错误代码,请参阅 MGM API 错误 BackupFailedToStart Backup 7 ALERT
Node node_id: Backup backup_id started from mgm_node_id has been aborted. Error: error_code 备份在启动后终止,可能是由于用户干预 BackupAborted Backup 7 ALERT