开源共建 | 长安链开发常见问题及规避

ops/2024/11/14 12:21:15/

长安链开源社区鼓励社区成员参与社区共建,参与形式包括不限于代码贡献、文章撰写、社区答疑等。腾讯云区块链王燕飞在参与长安链测试工作过程中,深入细致地总结了长安链实际开发应用中的常见问题及其有效的规避方法,相关内容多次解答社区成员开发过程中遇到的问题,帮助开发者提升开发效率与质量。

长安链开发常见问题及规避

前言

此文是记录长安链开发过程中可能遇到的问题以及如何规避相关问题。

问题一:日志存储CFS引发的问题

引发风险:

日志存储在CFS盘后,引起的dag超时,tps下降,内存溢出等。

引发原因:

因为日志存储在cfs上,网络io的延时比较高,所以写日志就会变得很慢,导致整体变慢,最后导致内存溢出。

规避建议:

链上的日志存储,不建议在cfs盘(网络盘)存储,建议存储到ssd盘。

问题二:文件存储出现两个.END文件

引发风险:

出现两个.END文件以后,节点启动就会panic,相关报错:panic: kvdb height: 218142 should not bigger than logdb: 215131, chain data maybe missed。

引发原因:

暂时未知,这里遇到多次,多数是文件存储配置在cfs盘。

规避建议:

如果遇到上述报错,建议在文件存储中找到老的.END文件,进行删除,这样直接重启节点,可以恢复。

问题三:链升级过程中wasmer库引发的panic

引发风险:

由于在升级过程中(例如:224版本升级231版本),不需要重新构造链,只需要替换二进制,因此wasmer库在启动的时候,还用的旧版本,启动后,节点panic:./chainmaker: symbol lookup error: ./chainmaker: undefined symbol: wasm_extern_vec_destroy。

引发原因:

主要是因为wasmer库升级,老版本的libwasmer.so文件与新版本的不兼容,因此会报错如上。

规避建议:

如果遇到上述错误,需要去新的工程中重新build一条新的链,然后去任意1个节点下面的lib文件夹下面,找到libwasmer.so文件,然后直接替换到旧的链上的每个节点下面的lib文件下,如:

这里的libwasmer.so文件,就是用的231版本新编译出来的,直接替换在这里即可。

图片

问题四:日志太大磁盘不够存

引发风险:

在日常使用链的过程中,当开启debug或者数据量很大时,每个日志文件都会占用大量的磁盘空间,所以经常会导致磁盘写满使得整个链停止运行。

引发原因:

日志文件过大,且存储的日志文件过多,导致磁盘不够用。

规避建议:

如果遇到上述问题,可以修改log.yml文件,如图所示:

图片

max_age字段表示日志保存时长,上图表示日志可保留一年的日志,这里建议可以结合当前磁盘空间进行存储时长设置,比如:磁盘资源较少可以保存一个星期的日志。

问题五:docker容器kill不掉

引发风险:

执行stop脚本时,容器kill不掉,虽然执行结果提示成功,但是容器并没有kill掉;

图片

再次执行启动脚本时,提示先停掉容器;

图片

去查看容器状态时,发现容器没有停掉。

图片

引发原因:

docker状态管理异常。

规避建议:

如果遇到上述问题,直接手动kill掉docker容器,重启即可恢复正常。

问题六:[signal SIGBUS: bus error code=0x2 addr=0x7f6432119000 pc=0x1040a69]

引发风险:

当前出现这个panic时,节点则会宕机。

引发原因:

磁盘写满导致。

规避建议:

出现报错信息如下:

 

unexpected fault address 0x7f6432119000

fatal error: fault

[signal SIGBUS: bus error code=0x2 addr=0x7f6432119000 pc=0x1040a69]

goroutine 6139175623 [running]:

runtime.throw({0x317977a?, 0x1c23672?})

/usr/local/go/src/runtime/panic.go:992 +0x71 fp=0xc075a0d7c0 sp=0xc075a0d790 pc=0x100a811

runtime.sigpanic()

/usr/local/go/src/runtime/signal_unix.go:815 +0x125 fp=0xc075a0d810 sp=0xc075a0d7c0 pc=0x1021345

runtime.memmove()

这个报错其实就是磁盘写满了,只需要保证磁盘有空间,节点重启就不会再出现此类问题。

问题七:单笔交易可以上链,并发交易无法上链

问题现象:

报错日志如下

 

2023-09-07 22:05:57.610 [WARN]  [Access] ^[[31;1m@chain1^[[0m   accesscontrol/cert_ac.go:929    verify principal signer in cache failed, [endorsement: signer:<org_id:"wx-org1.chainmaker.org" member_info:"-----BEGIN CERTIFICATE-----\nMIICeDCCAh6gAwIBAgIDAZHSMAoGCCqBHM9VAYN1MIGKMQswCQYDVQQGEwJDTjEQ\nMA4GA1UECBMHQmVpamluZzEQMA4GA1UEBxMHQmVpamluZzEfMB0GA1UEChMWd3gt\nb3JnMS5jaGFpbm1ha2VyLm9yZzESMBAGA1UECxMJcm9vdC1jZXJ0MSIwIAYDVQQD\nExlj

2023-09-07 22:05:57.611 [ERROR] [Rpc]   rpcserver/api_service.go:205    tx verify failed, verify tx authentation failed, authentication error: authentication failed, [refine endorsements failed, all endorsers have failed verification], txId:1782a2ef16a10b54ca4e4407bba9cda556c35e6021bc47beb678c56a5c49d346, sender:2d2d2d2d2d424547494e2043455254494649434154452d2d2d2d2d0a4d49494365444343416836674177494241674944415a48534d416f47434371424

2023-09-07 22:05:57.611 [WARN]  [Access] ^[[31;1m@chain1^[[0m   accesscontrol/cert_ac.go:1067   information for invalid signature:

sdk调用报错提示

 

______invoke result_________

Error: tx verify failed, verify tx authentation failed, authentication error: authentication failed, [refine endorsements failed, all endorsers have failed verification], txId:17aa7a7d0caf8e18ca6d6de7dd4135016c91030ddd294486ae93f082e3621544, sender:2d2d2d2d2d424547494e205055424c4943204b45592d2d2d2d2d0a4d466b77457759484b6f5a497a6a3043415159494b6f5a497a6a3044415163445167414542745553663753445478656d5853484b674972626c727a514d3278780a336d716f414134764454596d3374785a356c666e414237444247794158355162617039514c63437263434e353657474f356947594e3753706c673d3d0a2d2d2d2d2d454e44205055424c4943204b45592d2d2d2d2d0a

引发风险:

权限校验失败,导致交易无法正常上链,报错信息常见关键日志如上

引发原因:

chainmaker-cryptogen工程丢失文件或者版本不正确、cryoto.hash配置不正确,如下图所示:

图片

规避建议:

出现上述问题,这里涉及到几个点,也是日常大家经常容易踩雷的地方,出现这个问题可以确定的是,证书肯定是存在问题了,我们要确认几个关键点:

  • 证书类型确认:检查当前使用的证书是否为国密或非国密类型;确保cmc命令或SDK参数与证书类型完全匹配。

  • 配置检查:在发送交易前,需检查使用的sdk_config.yml文件中crypto.hash字段配置是否与节点一致。

  • 命令与参数校验:如果cmc命令执行和SDK参数调用均无误,且单笔交易能成功上链,则需进一步检查以下内容。

  • chainmaker-cryptogen工程检查:确认所选分支是否正确;检查是否存在文件丢失的情况;若无法自行判断或确认,建议直接删除当前工程并重新拉取最新版本,然后创建软链接。

  • 证书更新操作:完成上述步骤后,重启链服务;将cmc目录下的新证书重新拷贝至相应位置(若通过SDK调用,同样需替换为新证书)。

 

#去chainmaker-go的tools目录下,安装证书,具体操作如下:

cd chainmaker-go/tools

git

#编译部署包:

cd chainmaker-go/tools/chainmaker-cryptogen

make

#编译部署失败,不通过,试试下面的:

git submodule update --init

# 进入工具目录

$ cd chainmaker-go/tools

# 软连接chainmaker-cryptogen到tools目录下

$ ln -s ../../chainmaker-cryptogen/ .

问题八:并发过程中出现panic,提示:cache add block fail,panic:time out goroutine xxxx

问题现象:

 

panic: time out [recovered]
panic: cache add block fail, panic: time out goroutine 86659 [running]:
runtime/debug.Stack(0xc0166f5590, 0xc02fc771d0, 0x7ff23c131170)
/usr/local/go/src/runtime/debug/stack.go:24 +0x9f
http://chainmaker.org/chainmaker-go/module/core/common.(*BlockCommitterImpl).AddBlock.func1(0xc013d5e7e0,
/chainmaker-go/module/core/common/block_helper.go:996 +0x56a
panic(0x30fb0e0, 0xc028b6b3a0)
/usr/local/go/src/runtime/panic.go:965 +0x1b9
http://chainmaker.org/chainmaker-go/module/core/common.(*CommitBlock).CommitBlock(0xc0007295e0,
/chainmaker-go/module/core/common/committer.go:59 +0xa3b
http://chainmaker.org/chainmaker-go/module/core/common.(*BlockCommitterImpl).AddBlock(0xc013d5e7e0,
/chainmaker-go/module/core/common/block_helper.go:1040 +0x890
http://chainmaker.org/chainmaker-go/module/core/syncmode.(*CoreEngine).OnMessage.func2(0xc02fdf6708,
/chainmaker-go/module/core/syncmode/core_syncmode_impl.go:177 +0x6d

引发风险:

出现上述panic问题,即便是重启了节点,也会出现这种问题。

引发原因:

磁盘io读写过高,导致程序在读取bfdb文件出现超时情况,程序自动给出panic。

规避建议:

出现上述问题,不要慌,我们从以下几个点去思考:

1.  你的节点是否存储在网络盘,如果存储在网络盘出现问题很正常,具体情况我们参看问题1;

2.  如果我们节点就是存储在本地盘,但是可能磁盘io较高导致我们读取存储文件超时,我们可以用以下方案解决:增加存储配置,read_bfdb_timeout: 10000,添加位置如下。

 

disable_block_file_db: false #是否禁用区块文件存储功能, 默认为true,也就是未启用,新节点建议此处设置为false。
logdb_segment_async: false #区块文件异步落盘与否, 默认为false,也就是默认同步落盘,异步落盘时存在断电后数据损坏风险。
logdb_segment_size: 128 #区块文件大小,单位MB,默认64MB。
read_bfdb_timeout: 10000 # 读取 bfdb 下区块文件的超时时间,单位ms, 默认: 1000,即1s。

问题九:拉取镜像报错:You have reached your pull rate limit

问题现象:

 

toomanyrequests: You have reached your pull rate limit. You may increase the limit by authenticating and upgrading: https://www.docker.com/increase-rate-limit
make: *** [docker-build] Error 1

引发风险:

拉取镜像直接无法拉取。

引发原因:

这是因为使用Docker的时候没有登录,导致拉取代码有限制。

解决办法:

方案1(推荐方案),去长安链官网网站拉去镜像:

docker pull hub-dev.cnbn.org.cn/chainmakerofficial/chainmaker:v2.3.5

图片

方案2,去Docker官方网站注册账号:https://hub.docker.com/。

2.  Linux登录账号密码,命令为docker login:

3.  如图所示:

图片


http://www.ppmy.cn/ops/133563.html

相关文章

Linux下通过sqlplus连Oracle提示字符是乱码▒▒▒[

先参考https://www.cnblogs.com/wrencai/articles/4374451.html 理解下Oracle编码字符集的概念 如下图,刚开始连上是软吗▒▒▒[ 执行export NLS_LANGJAPANESE_JAPAN.AL32UTF8 (这个仅在当前会话起作用)如果好了,说明字符集是这个,不行在尝试别的字符集 如果要永久设置 vim …

Python练习19

Python日常练习 题目&#xff1a; 打印如下九九乘法表 1*11 2*12 2*24 3*13 3*26 3*39 4*14 4*28 4*312 4*416 5*15 5*210 5*315 5*420 5*525 6*16 6*212 6*318 6*424 6*530 6*636 7*17 7*214 7*321 7*428 7*535 7*642 7*749 8*18 8*216 8*324 8*432 8*540 8*648 8*756 8*86…

「QT」几何数据类 之 QVector4D 四维向量类

✨博客主页何曾参静谧的博客&#x1f4cc;文章专栏「QT」QT5程序设计&#x1f4da;全部专栏「VS」Visual Studio「C/C」C/C程序设计「UG/NX」BlockUI集合「Win」Windows程序设计「DSA」数据结构与算法「UG/NX」NX二次开发「QT」QT5程序设计「File」数据文件格式「PK」Parasolid…

java常用工具介绍

1. 集成开发环境&#xff08;IDE&#xff09;&#xff1a; • Eclipse&#xff1a;一个开放源代码的、基于Java的可扩展开发平台。它提供了一个框架和一组服务&#xff0c;用于通过插件组件构建开发环境。Eclipse 还包括用于Java开发的工具&#xff08;Java Development Tools,…

基于SpringBoot的垃圾分类回收系统+LW示例参考

1.项目介绍 系统角色&#xff1a;管理员、普通用户、回收员功能模块&#xff1a;管理员&#xff08;用户管理、回收员管理、垃圾类型管理、商品分类管理、环保商城管理、上门回收管理、订单分配管理、订单管理、系统管理等&#xff09;、回收员&#xff08;订单分配、订单管理…

人工智能理论之opencv图像预处理、数据库、GUI布局的综合应用(图像预处理版块)

文章目录 前言图像预处理卷积核概念图像平滑处理高斯滤波 双边滤波中值滤波Canny边缘检测图像形态学操作形态学梯度顶帽小结 图片预处理1.引入库 图像预处理错误尝试成功运行 总结 前言 对前面学习综合应用的总结&#xff0c;不单是一个版块&#xff0c;而是三个版块综合到一起…

【大数据测试HDFS + Flask详细教程与实例】

大数据测试HDFS Flask 1. 环境准备安装工具安装Hadoop&#xff08;以单机模式为例&#xff09;安装Flask和HDFS Python客户端 2. HDFS Flask基本架构基本文件结构 3. 创建Flask应用与与HDFS交互步骤1&#xff1a;配置HDFS连接步骤2&#xff1a;构建Flask应用 4. 创建前端界面…

图论导引 - 第三章 第四节 - 11/13

相关算法 在本节中&#xff0c;我们简要描述与本章相关的三个问题——最短路径问题、中国邮递员问题和旅行商问题。 最短路径问题可以通过一种高效算法来解决&#xff0c;即通过一个有限的、逐步执行的程序能快速得出解决方案。邮递员问题只考虑一种特殊情况。旅行商问题&…