长安链开源社区鼓励社区成员参与社区共建,参与形式包括不限于代码贡献、文章撰写、社区答疑等。腾讯云区块链王燕飞在参与长安链测试工作过程中,深入细致地总结了长安链实际开发应用中的常见问题及其有效的规避方法,相关内容多次解答社区成员开发过程中遇到的问题,帮助开发者提升开发效率与质量。
长安链开发常见问题及规避
前言
此文是记录长安链开发过程中可能遇到的问题以及如何规避相关问题。
问题一:日志存储CFS引发的问题
引发风险:
日志存储在CFS盘后,引起的dag超时,tps下降,内存溢出等。
引发原因:
因为日志存储在cfs上,网络io的延时比较高,所以写日志就会变得很慢,导致整体变慢,最后导致内存溢出。
规避建议:
链上的日志存储,不建议在cfs盘(网络盘)存储,建议存储到ssd盘。
问题二:文件存储出现两个.END文件
引发风险:
出现两个.END文件以后,节点启动就会panic,相关报错:panic: kvdb height: 218142 should not bigger than logdb: 215131, chain data maybe missed。
引发原因:
暂时未知,这里遇到多次,多数是文件存储配置在cfs盘。
规避建议:
如果遇到上述报错,建议在文件存储中找到老的.END文件,进行删除,这样直接重启节点,可以恢复。
问题三:链升级过程中wasmer库引发的panic
引发风险:
由于在升级过程中(例如:224版本升级231版本),不需要重新构造链,只需要替换二进制,因此wasmer库在启动的时候,还用的旧版本,启动后,节点panic:./chainmaker: symbol lookup error: ./chainmaker: undefined symbol: wasm_extern_vec_destroy。
引发原因:
主要是因为wasmer库升级,老版本的libwasmer.so文件与新版本的不兼容,因此会报错如上。
规避建议:
如果遇到上述错误,需要去新的工程中重新build一条新的链,然后去任意1个节点下面的lib文件夹下面,找到libwasmer.so文件,然后直接替换到旧的链上的每个节点下面的lib文件下,如:
这里的libwasmer.so文件,就是用的231版本新编译出来的,直接替换在这里即可。
问题四:日志太大磁盘不够存
引发风险:
在日常使用链的过程中,当开启debug或者数据量很大时,每个日志文件都会占用大量的磁盘空间,所以经常会导致磁盘写满使得整个链停止运行。
引发原因:
日志文件过大,且存储的日志文件过多,导致磁盘不够用。
规避建议:
如果遇到上述问题,可以修改log.yml文件,如图所示:
max_age字段表示日志保存时长,上图表示日志可保留一年的日志,这里建议可以结合当前磁盘空间进行存储时长设置,比如:磁盘资源较少可以保存一个星期的日志。
问题五:docker容器kill不掉
引发风险:
执行stop脚本时,容器kill不掉,虽然执行结果提示成功,但是容器并没有kill掉;
再次执行启动脚本时,提示先停掉容器;
去查看容器状态时,发现容器没有停掉。
引发原因:
docker状态管理异常。
规避建议:
如果遇到上述问题,直接手动kill掉docker容器,重启即可恢复正常。
问题六:[signal SIGBUS: bus error code=0x2 addr=0x7f6432119000 pc=0x1040a69]
引发风险:
当前出现这个panic时,节点则会宕机。
引发原因:
磁盘写满导致。
规避建议:
出现报错信息如下:
unexpected fault address 0x7f6432119000
fatal error: fault
[signal SIGBUS: bus error code=0x2 addr=0x7f6432119000 pc=0x1040a69]
goroutine 6139175623 [running]:
runtime.throw({0x317977a?, 0x1c23672?})
/usr/local/go/src/runtime/panic.go:992 +0x71 fp=0xc075a0d7c0 sp=0xc075a0d790 pc=0x100a811
runtime.sigpanic()
/usr/local/go/src/runtime/signal_unix.go:815 +0x125 fp=0xc075a0d810 sp=0xc075a0d7c0 pc=0x1021345
runtime.memmove()
这个报错其实就是磁盘写满了,只需要保证磁盘有空间,节点重启就不会再出现此类问题。
问题七:单笔交易可以上链,并发交易无法上链
问题现象:
报错日志如下
2023-09-07 22:05:57.610 [WARN] [Access] ^[[31;1m@chain1^[[0m accesscontrol/cert_ac.go:929 verify principal signer in cache failed, [endorsement: signer:<org_id:"wx-org1.chainmaker.org" member_info:"-----BEGIN CERTIFICATE-----\nMIICeDCCAh6gAwIBAgIDAZHSMAoGCCqBHM9VAYN1MIGKMQswCQYDVQQGEwJDTjEQ\nMA4GA1UECBMHQmVpamluZzEQMA4GA1UEBxMHQmVpamluZzEfMB0GA1UEChMWd3gt\nb3JnMS5jaGFpbm1ha2VyLm9yZzESMBAGA1UECxMJcm9vdC1jZXJ0MSIwIAYDVQQD\nExlj
2023-09-07 22:05:57.611 [ERROR] [Rpc] rpcserver/api_service.go:205 tx verify failed, verify tx authentation failed, authentication error: authentication failed, [refine endorsements failed, all endorsers have failed verification], txId:1782a2ef16a10b54ca4e4407bba9cda556c35e6021bc47beb678c56a5c49d346, sender:2d2d2d2d2d424547494e2043455254494649434154452d2d2d2d2d0a4d49494365444343416836674177494241674944415a48534d416f47434371424
2023-09-07 22:05:57.611 [WARN] [Access] ^[[31;1m@chain1^[[0m accesscontrol/cert_ac.go:1067 information for invalid signature:
sdk调用报错提示
______invoke result_________
Error: tx verify failed, verify tx authentation failed, authentication error: authentication failed, [refine endorsements failed, all endorsers have failed verification], txId:17aa7a7d0caf8e18ca6d6de7dd4135016c91030ddd294486ae93f082e3621544, sender:2d2d2d2d2d424547494e205055424c4943204b45592d2d2d2d2d0a4d466b77457759484b6f5a497a6a3043415159494b6f5a497a6a3044415163445167414542745553663753445478656d5853484b674972626c727a514d3278780a336d716f414134764454596d3374785a356c666e414237444247794158355162617039514c63437263434e353657474f356947594e3753706c673d3d0a2d2d2d2d2d454e44205055424c4943204b45592d2d2d2d2d0a
引发风险:
权限校验失败,导致交易无法正常上链,报错信息常见关键日志如上
引发原因:
chainmaker-cryptogen工程丢失文件或者版本不正确、cryoto.hash配置不正确,如下图所示:
规避建议:
出现上述问题,这里涉及到几个点,也是日常大家经常容易踩雷的地方,出现这个问题可以确定的是,证书肯定是存在问题了,我们要确认几个关键点:
-
证书类型确认:检查当前使用的证书是否为国密或非国密类型;确保cmc命令或SDK参数与证书类型完全匹配。
-
配置检查:在发送交易前,需检查使用的sdk_config.yml文件中crypto.hash字段配置是否与节点一致。
-
命令与参数校验:如果cmc命令执行和SDK参数调用均无误,且单笔交易能成功上链,则需进一步检查以下内容。
-
chainmaker-cryptogen工程检查:确认所选分支是否正确;检查是否存在文件丢失的情况;若无法自行判断或确认,建议直接删除当前工程并重新拉取最新版本,然后创建软链接。
-
证书更新操作:完成上述步骤后,重启链服务;将cmc目录下的新证书重新拷贝至相应位置(若通过SDK调用,同样需替换为新证书)。
#去chainmaker-go的tools目录下,安装证书,具体操作如下:
cd chainmaker-go/tools
git
#编译部署包:
cd chainmaker-go/tools/chainmaker-cryptogen
make
#编译部署失败,不通过,试试下面的:
git submodule update --init
# 进入工具目录
$ cd chainmaker-go/tools
# 软连接chainmaker-cryptogen到tools目录下
$ ln -s ../../chainmaker-cryptogen/ .
问题八:并发过程中出现panic,提示:cache add block fail,panic:time out goroutine xxxx
问题现象:
panic: time out [recovered]
panic: cache add block fail, panic: time out goroutine 86659 [running]:
runtime/debug.Stack(0xc0166f5590, 0xc02fc771d0, 0x7ff23c131170)
/usr/local/go/src/runtime/debug/stack.go:24 +0x9f
http://chainmaker.org/chainmaker-go/module/core/common.(*BlockCommitterImpl).AddBlock.func1(0xc013d5e7e0,
/chainmaker-go/module/core/common/block_helper.go:996 +0x56a
panic(0x30fb0e0, 0xc028b6b3a0)
/usr/local/go/src/runtime/panic.go:965 +0x1b9
http://chainmaker.org/chainmaker-go/module/core/common.(*CommitBlock).CommitBlock(0xc0007295e0,
/chainmaker-go/module/core/common/committer.go:59 +0xa3b
http://chainmaker.org/chainmaker-go/module/core/common.(*BlockCommitterImpl).AddBlock(0xc013d5e7e0,
/chainmaker-go/module/core/common/block_helper.go:1040 +0x890
http://chainmaker.org/chainmaker-go/module/core/syncmode.(*CoreEngine).OnMessage.func2(0xc02fdf6708,
/chainmaker-go/module/core/syncmode/core_syncmode_impl.go:177 +0x6d
引发风险:
出现上述panic问题,即便是重启了节点,也会出现这种问题。
引发原因:
磁盘io读写过高,导致程序在读取bfdb文件出现超时情况,程序自动给出panic。
规避建议:
出现上述问题,不要慌,我们从以下几个点去思考:
1. 你的节点是否存储在网络盘,如果存储在网络盘出现问题很正常,具体情况我们参看问题1;
2. 如果我们节点就是存储在本地盘,但是可能磁盘io较高导致我们读取存储文件超时,我们可以用以下方案解决:增加存储配置,read_bfdb_timeout: 10000,添加位置如下。
disable_block_file_db: false #是否禁用区块文件存储功能, 默认为true,也就是未启用,新节点建议此处设置为false。
logdb_segment_async: false #区块文件异步落盘与否, 默认为false,也就是默认同步落盘,异步落盘时存在断电后数据损坏风险。
logdb_segment_size: 128 #区块文件大小,单位MB,默认64MB。
read_bfdb_timeout: 10000 # 读取 bfdb 下区块文件的超时时间,单位ms, 默认: 1000,即1s。
问题九:拉取镜像报错:You have reached your pull rate limit
问题现象:
toomanyrequests: You have reached your pull rate limit. You may increase the limit by authenticating and upgrading: https://www.docker.com/increase-rate-limit
make: *** [docker-build] Error 1
引发风险:
拉取镜像直接无法拉取。
引发原因:
这是因为使用Docker的时候没有登录,导致拉取代码有限制。
解决办法:
方案1(推荐方案),去长安链官网网站拉去镜像:
docker pull hub-dev.cnbn.org.cn/chainmakerofficial/chainmaker:v2.3.5
方案2,去Docker官方网站注册账号:https://hub.docker.com/。
2. Linux登录账号密码,命令为docker login:
3. 如图所示: