【论文阅读】WaDec: Decompiling WebAssembly Using Large Language Model

server/2024/11/19 21:09:01/

论文阅读笔记:WaDec: Decompiling WebAssembly Using Large Language Model

在这里插入图片描述

1. 来源出处
  • 论文标题: WaDec: Decompiling WebAssembly Using Large Language Model
  • 作者: Xinyu She, Yanjie Zhao, Haoyu Wang
  • 会议: 39th IEEE/ACM International Conference on Automated Software Engineering (ASE 2024)
  • DOI: 10.1145/3691620.3695020
2. 研究背景与问题陈述

WebAssembly(Wasm)是一种跨平台二进制指令格式,旨在实现接近本地速度的高效执行。尽管其在多种领域(如区块链、物联网和云计算)得到了广泛应用,但由于其二进制本质,Wasm 在可读性和调试方面面临挑战。为了进行逆向工程,开发者和研究人员依赖于反编译工具。然而,传统反编译器在生成可读代码方面存在显著问题,这使得高效的反编译成为一种迫切需求。

2.1 先前方法的不足
  1. 传统静态工具的限制:

    • 可读性差:如 Ghidra、Wasm2c 和 Wasm-decompile 等工具生成的代码缺乏可读性和结构化组织,通常只能逐条指令翻译,保留了过多的低级指令风格。
    • 代码膨胀:传统工具的输出常包含冗余中间表示,导致代码量膨胀,难以维护。
    • 无法处理代码片段:这些工具通常只能处理完整程序,而无法应对代码片段。
  2. 基于机器学习的方法:

    • 响应不稳定:ML 模型输出通常是概率性的,复杂输入(如嵌套循环)会引起输出不稳定或无关内容。
    • 嵌套循环处理能力弱:AI 反编译器在处理复杂嵌套结构时表现不佳,影响代码逻辑的准确还原。
2.2 当前面临的挑战
  • Wasm 的特

http://www.ppmy.cn/server/143298.html

相关文章

Python读取prophesee相机输出的raw文件

import cv2 import json import numpy as np from pathlib import Path import matplotlib.pyplot as plt from metavision_core.event_io import EventsIteratordef visualization_event_streams(p_list, t_list, x_list, y_list, save_pathNone):# 事件流的3D表示fig plt.fi…

网络协议之IP(包含V4和V6)

一、IPv4协议 1. 基本概念 IPv4(Internet Protocol version 4),即互联网协议第4版,是网际协议开发过程中的第四个修订版本,也是此协议第一个被广泛部署的版本。IPv4使用32位(4字节)地址&#…

亚历克斯的无聊游戏 | 动态规划

描述 亚历克斯不喜欢无聊。这就是为什么每当他感到无聊时,他都会想出一些游戏。一个漫长的冬夜,他想出了一个游戏。 给定由n个整数组成的序列a。玩家可以选择其中的整数。在一个步骤中,他可以选择序列中的一个元素(让我们把它表…

Python高级编程模式和设计模式

一 装饰器模式 order_sources:source1:on_agreement: "reduce_receivable"on_completion: "reduce_receivable"on_rejection: "none"source2:on_agreement: "none"on_completion: "reduce_receivable"on_rejection: "…

无插件H5播放器EasyPlayer.js网页web无插件播放器选择全屏时,视频区域并没有全屏问题的解决方案

EasyPlayer.js H5播放器,是一款能够同时支持HTTP、HTTP-FLV、HLS(m3u8)、WS、WEBRTC、FMP4视频直播与视频点播等多种协议,支持H.264、H.265、AAC、G711A、MP3等多种音视频编码格式,支持MSE、WASM、WebCodec等多种解码方…

大模型(LLMs)RAG 版面分析——表格识别方法篇

大模型(LLMs)RAG 版面分析——表格识别方法篇 一、为什么需要识别表格? 表格的尺寸、类型和样式展现出多样化的特征,如背景填充的差异性、行列合并方法的多样性以及内容文本类型的不一致性等。同时,现有的文档资料不…

计算机编程中的异步编程模型及其在提升应用响应性中的作用

💓 博客主页:瑕疵的CSDN主页 📝 Gitee主页:瑕疵的gitee主页 ⏩ 文章专栏:《热点资讯》 计算机编程中的异步编程模型及其在提升应用响应性中的作用 计算机编程中的异步编程模型及其在提升应用响应性中的作用 计算机编程…

HTML5实现趣味飞船捡金币小游戏(附源码)

文章目录 1.设计来源1.1 主界面1.2 游戏中界面1.2 飞船边界框效果 2.效果和源码2.1 动态效果2.2 源代码 源码下载 作者:xcLeigh 文章地址:https://blog.csdn.net/weixin_43151418/article/details/143799554 HTML5实现趣味飞船捡金币小游戏(附源码)&…