HarmonyOS Next 方舟字节码文件格式介绍

server/2025/2/10 9:50:46/

在开发中,可读的编程语言要编译成二进制的字节码格式才能被机器识别。在HarmonyOS Next开发中,arkts会编译成方舟字节码。方舟字节码长什么样呢?我们以一个demo编译出的abc文件:
![[HarmonyOS Next 方舟字节码文件格式介绍.png]]

二进制就是长这样,怎么去理解呢?就需要理解方舟字节码的文件格式。

字节码文件布局

上面图中看到有个可以认识的几个字母PANDA,什么意思呢?先了解下字节码文件布局。

字节码文件起始于Header结构。文件中的所有结构均可以从Header出发,直接或间接地访问到。字节码文件中结构的引用方式包括偏移量和索引。偏移量是一个32位长度的值,表示当前结构的起始位置在字节码文件中相对于文件头的距离,从0开始计算。索引是一个16位长度的值,表示当前结构在索引区域中的位置。

Header

先来看看Header结构:

名称格式说明
magicuint8_t[8]文件头魔数,值必须是’P’ ‘A’ ‘N’ ‘D’ ‘A’ ‘\0’ ‘\0’ ‘\0’。
checksumuint32_t字节码文件除文件头魔数和本校验字段之外的内容的adler32校验和。
versionuint8_t[4]字节码文件的版本号 (Version) 。
file_sizeuint32_t字节码文件的大小,以字节为单位。
foreign_offuint32_t一个偏移量,指向外部区域。外部区域中仅包含类型为ForeignClass或ForeignMethod的元素。foreign_off指向该区域的第一个元素。
foreign_sizeuint32_t外部区域的大小,以字节为单位。
num_classesuint32_tClassIndex结构中元素的数量,即文件中定义的Class的数量。
class_idx_offuint32_t一个偏移量,指向ClassIndex。
num_lnpsuint32_tLineNumberProgramIndex结构中元素的数量,即文件中定义的Line number program的数量。
lnp_idx_offuint32_t一个偏移量,指向LineNumberProgramIndex。
reserveduint32_t方舟字节码文件内部使用的保留字段。
reserveduint32_t方舟字节码文件内部使用的保留字段。
num_index_regionsuint32_tIndexSection结构中元素的数量,即文件中IndexHeader的数量。
index_section_offuint32_t一个偏移量,指向IndexSection。
  • magic:最开始的0x50、0x41、0x4e、0x44、0x41对应的就是PANDA的ASCII码,接下来是三个0
  • checksum:四个字节的校验位0x5d、0xe8、0xde、0xdf
  • version:自个字节的版本号0x0C、0x00、0x06、0x00
Version

字节码版本号由4个部分组成,格式为:主版本号.次版本号.特性版本号.编译版本号。

名称格式说明
主版本号uint8_t标识整体架构调整引入的字节码文件格式变更。
次版本号uint8_t标识局部架构调整或者重大特性调整引入的字节码文件格式变更。
特性版本号uint8_t标识中小特性引入的字节码文件格式变更。
编译版本号uint8_t标识缺陷修复引入的字节码文件格式变更。
ForeignClass

描述字节码文件中的外部类。外部类在其他文件中声明,并在当前字节码文件中被引用。

名称格式说明
nameString外部类的名称,命名遵循TypeDescriptor语法。
ForeignMethod

描述字节码文件中的外部方法。外部方法在其他文件中声明,并在当前字节码文件中被引用。

名称格式说明
class_idxuint16_t一个指向该方法所从属的类的索引,指向一个在ClassRegionIndex中的位置,该位置的值是一个指向Class或ForeignClass的偏移量。
reserveduint16_t方舟字节码文件内部使用的保留字段。
name_offuint32_t一个偏移量,指向字符串,表示方法名称。
index_datauleb128方法的MethodIndexData数据。
通过ForeignMethod的偏移量,可以找到适当的IndexHeader以解析class_idx。

此外还有Class、Class、ClassAccessFlag、ClassTag、Field、FieldTag、Method、MethodIndexData、MethodTag、Code、TryBlock、CatchBlock、Annotation、AnnotationElementTag、AnnotationElement、Value formats、LineNumberProgramIndex、DebugInfo、IndexSection、IndexHeader、ClassRegionIndex、Type、MethodStringLiteralRegionIndex、LiteralArray、Literal,这里不一一介绍。

接下来介绍下字节码文件数据类型。

字节码文件数据类型

整型
名称说明
uint8_t8-bit无符号整数。
uint16_t16-bit无符号整数,采用小端字节序。
uint32_t32-bit无符号整数,采用小端字节序。
uleb128leb128编码的无符号整数。
sleb128leb128编码的有符号整数。
字符串
名称格式说明
utf16_lengthuleb128值为len << 1 | is_ascii,其中len是字符串在UTF-16编码中的大小,is_ascii标记该字符串是否仅包含ASCII字符,可能的值是0或1。
datauint8_t[]以’\0’结尾的MUTF-8编码字符序列。
TaggedValue
名称格式说明
taguint8_t表示数据种类的标记。
datauint8_t[]根据不同的标记,data是不同类型的数据或者为空。

字节码文件中所有的多字节值均采用小端字节序。


http://www.ppmy.cn/server/166462.html

相关文章

基于DeepSeek API和VSCode的自动化网页生成流程

1.创建API key 访问官网DeepSeek &#xff0c;点击API开放平台。 在开放平台界面左侧点击API keys&#xff0c;进入API keys管理界面&#xff0c;点击创建API key按钮创建API key&#xff0c;名称自定义。 2.下载并安装配置编辑器VSCode 官网Visual Studio Code - Code Editing…

一文速览DeepSeek-R1的本地部署——可联网、可实现本地知识库问答:包括671B满血版和各个蒸馏版的部署

前言 自从deepseek R1发布之后「详见《一文速览DeepSeek R1&#xff1a;如何通过纯RL训练大模型的推理能力以比肩甚至超越OpenAI o1(含Kimi K1.5的解读)》」&#xff0c;deepseek便爆火 爆火以后便应了“人红是非多”那句话&#xff0c;不但遭受各种大规模攻击&#xff0c;即便…

对比Spring组件和Python的Module

在Spring框架中&#xff0c;组件&#xff08;Component&#xff09; 和 Python中的模块&#xff08;Module&#xff09; 在概念上有一定的相似性&#xff0c;但它们在具体的功能和用途上存在一些差异。以下是对两者的类比和区别&#xff1a; 相似性 可重用性&#xff1a; Spri…

Elasticsearch去分析目标服务器的日志,需要在目标服务器上面安装Elasticsearch 软件吗

Elasticsearch 本身并不直接收集目标服务器的日志&#xff0c;它主要用于存储、搜索和分析数据。要收集目标服务器的日志&#xff0c;通常会借助其他工具&#xff0c;并且一般不需要在目标服务器上安装 Elasticsearch 软件&#xff0c;常见的日志收集方案&#xff1a; Filebeat…

ES6 Map 数据结构是用总结

1. Map 基本概念 Map 是 ES6 提供的新的数据结构&#xff0c;它类似于对象&#xff0c;但是"键"的范围不限于字符串&#xff0c;各种类型的值&#xff08;包括对象&#xff09;都可以当作键。Map 也可以跟踪键值对的原始插入顺序。 1.1 基本用法 // 创建一个空Map…

加速汽车软件升级——堆栈刷写技术的应用与挑战

一、背景和挑战 | 背景&#xff1a; 当前汽车市场竞争激烈&#xff0c;多品牌并存&#xff0c;新车发布速度加快&#xff0c;价格逐渐降低&#xff0c;功能日益多样化。随着车辆功能的不断提升与优化&#xff0c;ECU&#xff08;电子控制单元&#xff09;的代码量也随之增加&…

22.2、Apache安全分析与增强

目录 Apache Web安全分析与增强 - Apache Web概述Apache Web安全分析与增强 - Apache Web安全威胁Apache Web安全机制Apache Web安全增强 Apache Web安全分析与增强 - Apache Web概述 阿帕奇是一个用于搭建WEB服务器的应用程序&#xff0c;它是开源的&#xff0c;它的配置文件…

【Flink快速入门-8.Flink Flink 架构介绍】

Flink 架构介绍 实验介绍 经过前⾯的⼏个实验&#xff0c;相信⼤家已经对 Flink 有了⼀定的认识。但是在学习⼀个技术框架 的时候&#xff0c;除了 API &#xff0c;我们还必须了解其架构体系&#xff0c;这样我们才会对它有一个更加全面的认识。所以本节实验我们重点来学习 …