Flex和Bison

server/2024/9/20 7:27:19/ 标签: linux, 词法, 语法

Flex和Bison是Linux和Unix环境下两个非常强大的工具,分别用于生成词法分析器和语法分析器。它们在编译器设计、文本处理等领域有着广泛的应用。下面我将详细介绍Flex和Bison的基本概念、功能、用法以及它们之间的关系。

一、Flex

1. 基本概念

Flex(其前身是Lex)是一个词法分析器生成器。它接受一组正则表达式和对应的动作(通常是C语言代码),然后生成一个C程序(词法分析器),该程序能够识别和处理输入文本中的词法单元(如标识符、关键字、运算符等)。

2. 功能

  • 词法分析:将输入文本分割成一个个词法单元(token),每个单元都具有一定的意义。
  • 正则表达式匹配:使用正则表达式在输入文本中查找特定的字符模式。
  • 动作执行:当匹配到正则表达式时,执行相应的动作(如计数、打印等)。

3. 用法

Flex的使用通常包括以下几个步骤:

  • 编写Flex程序(.l文件),定义正则表达式和对应的动作。
  • 使用Flex工具编译Flex程序,生成C语言源代码(通常是lex.yy.c)。
  • 编译生成的C代码,并链接必要的库(如libfl),生成可执行文件。
  • 运行可执行文件,对输入文本进行词法分析。

4. Flex程序示例

%{  
#include <stdio.h>  
#include "y.tab.h" /* 假设与bison一起使用,包含由bison生成的头文件 */  void count() {  /* 这里可以添加一些用于调试或统计的代码 */  
}  
%}  %option noyywrap  %%  /* 关键字 */  
PROGRAM|VAR|VAR_INPUT|VAR_OUTPUT|VAR_IN_OUT|VAR_EXTERNAL|TEMP|TEMP_VAR|END_PROGRAM|  
BEGIN_PROGRAM|END_VAR|BEGIN_VAR|END_STRUCT|BEGIN_STRUCT|FUNCTION_BLOCK|FUNCTION|  
METHOD|INTERFACE|END_INTERFACE|END_FUNCTION_BLOCK|END_FUNCTION|END_METHOD|  
TRUE|FALSE|VAR_ACCESS|AT|RETAIN|CONSTANT|TYPE|ALIAS|ARRAY|STRUCT|OF|POINTER|  
REF_TO|MOD|DIV|AND|OR|XOR|NOT|SHL|SHR|ROL|ROR|ASGN|ADD|SUB|MUL|REAL|INT|BOOL|  
STRING|TIME|DATE|DURATION|LREAL|DINT|UINT|SINT|BYTE|WORD|DWORD|LWORD|USINT|  
S5TIME|TIME_OF_DAY|DATE_AND_TIME|TIMESTAMP|TOD|DT|TS { return yytext[0]; }  /* 标识符 */  
[a-zA-Z_][a-zA-Z0-9_]*   { yylval.str = strdup(yytext); return IDENTIFIER; }  /* 数字(整数和浮点数) */  
[0-9]+(\.[0-9]+)?([eE][-+]?[0-9]+)? { yylval.double_val = atof(yytext); return NUMBER; }  /* 字符串 */  
\"([^\\\"\n]|(\\.))*\"   { yylval.str = strdup(yytext+1); yylval.str[strlen(yylval.str)-1] = '\0'; return STRING; }  /* 注释(单行和多行) */  
//.*    { /* 忽略单行注释 */ }  
/* 和多行注释可能需要更复杂的规则来处理嵌套,但这里简化处理 */  
/\/*([^*]|\*+[^/*])*\*/ { /* 忽略多行注释 */ }  /* 空白字符 */  
[ \t\n]+   { /* 忽略 */ }  /* 操作符和分隔符 */  
[:=.,;(){}\[\]+-*/%<>^|&!~]   { return yytext[0]; }  /* 其他字符 */  
.           { fprintf(stderr, "Unknown character '%s'\n", yytext); return ERROR; }  %%  int yywrap(void) {  return 1;  
}  int main(void) {  yylex();  return 0;  
}  /* 注意:  
1. 关键字列表可能不完整,需要根据实际的ST语言规范进行扩展。  
2. 注释的处理可能需要更复杂的Flex规则来正确处理嵌套注释,但这里为了简化而省略了。  
3. 确保yylval的结构和类型与你的解析器(如bison生成的)兼容。  
4. 编译时可能需要链接到flex库和bison生成的解析器。  
*/

在这个Flex程序中,我定义了几个部分来匹配ST语言的关键元素:

  • 关键字:列出了ST语言中可能使用的一些关键字。注意,这里的关键字列表是不完整的,你需要根据实际的ST语言规范进行扩展。
  • 标识符:匹配以字母或下划线开头,后跟字母、数字或下划线的字符串。
  • 数字:匹配整数和浮点数。
  • 字符串:匹配被双引号包围的字符串,其中可以包含转义字符。
  • 注释:简化了单行和多行注释的处理。注意,多行注释的处理可能需要更复杂的规则来正确处理嵌套情况。
  • 空白字符:被忽略的空格、制表符和换行符。
  • 操作符和分隔符:匹配ST语言中常用的操作符和分隔符。
  • 其他字符:任何不匹配上述规则的字符都将被视为未知字符,并打印错误信息。

二、Bison

1. 基本概念

Bison(其前身是Yacc)是一个语法分析器生成器。它接受一个上下文无关文法(CFG)和对应的动作(也通常是C语言代码),然后生成一个C程序(语法分析器),该程序能够根据文法规则分析输入文本的结构,并生成相应的语法树或执行相应的动作。

2. 功能

  • 语法分析:确定输入文本中的词法单元是如何彼此关联的,即构建语法树。
  • 错误处理:在语法分析过程中检测并报告错误。
  • 代码生成:根据语法树生成目标代码(尽管这通常不是Bison的直接功能,但语法树可以用于此目的)。

3. 用法

Bison的使用也包括类似的步骤:

  • 编写Bison程序(.y文件),定义文法规则和对应的动作。
  • 使用Bison工具编译Bison程序,生成C语言源代码(通常是y.tab.c和y.tab.h)。
  • 编译生成的C代码,并链接必要的库(如libbison),生成可执行文件。
  • 运行可执行文件,对输入文本进行语法分析。

4. Bison程序示例

%{  
#include <stdio.h>  
#include <stdlib.h>  void yyerror(const char *s);  // 假设有一些用于存储解析结果的数据结构  
// 例如,一个全局的符号表或AST节点  %}  %token IDENTIFIER NUMBER STRING  
%token PROGRAM VAR VAR_INPUT VAR_OUTPUT VAR_IN_OUT VAR_EXTERNAL TEMP TEMP_VAR  
%token BEGIN_PROGRAM END_PROGRAM BEGIN_VAR END_VAR BEGIN_STRUCT END_STRUCT  
%token FUNCTION_BLOCK FUNCTION METHOD INTERFACE END_INTERFACE END_FUNCTION_BLOCK END_FUNCTION END_METHOD  
%token TRUE FALSE  
%token OPERATOR /* 假设我们有一个通用的OPERATOR token用于所有操作符 */  %start program  %%  program:  PROGRAM IDENTIFIER ';' block { printf("Parsed a program\n"); }  ;  block:  /* 这里可以添加更复杂的块结构,如BEGIN_VAR ... END_VAR, BEGIN_PROGRAM ... END_PROGRAM等 */  declarations  ;  declarations:  /* 变量声明 */  VAR declarations_list ';'  | /* 空声明列表 */  { 
$$= NULL; /* 假设我们有一个返回类型,这里用NULL表示空 */ }  ;  declarations_list:  IDENTIFIER ':' type  | declarations_list ',' IDENTIFIER ':' type  ;  type:  /* 这里可以添加对类型的解析,如INT, REAL, BOOL等 */  IDENTIFIER  ;  /* 更多的语法规则可以根据需要添加 */  %%  void yyerror(const char *s) {  fprintf(stderr, "%s\n", s);  
}  int main(void) {  yyparse();  return 0;  
}  // 注意:这个示例中的语法规则非常简化,并且没有处理ST语言的许多特性。  
// 你需要根据实际的ST语言规范来扩展这些规则。

重要说明

  1. Token定义:在Bison文件中,我们使用%token指令来定义由Flex生成的词法单元(tokens)。这些tokens应该与Flex文件中定义的tokens相匹配。

  2. 起始符号%start program指定了语法分析的起始符号。在这个例子中,我们期望输入以PROGRAM关键字开始。

  3. 语法规则:我们定义了几个简单的语法规则来解析程序、块和变量声明。这些规则可以根据需要进行扩展和修改。

  4. 错误处理yyerror函数用于处理解析过程中的错误。

  5. 主函数main函数调用yyparse()来启动解析过程。

注意

  • 这个Bison程序是一个非常简化的示例,它不会处理ST语言的全部特性。
  • 你需要根据实际的ST语言规范来扩展和修改语法规则。
  • 你可能还需要实现一些额外的功能,如符号表管理、抽象语法树(AST)构建等。
  • 编译Bison程序时,你需要使用Bison工具生成C代码,并将其与Flex生成的词法分析器代码以及任何额外的C代码一起编译。通常,这可以通过在Makefile中添加适当的规则来完成。

三、Flex和Bison的关系

Flex和Bison通常一起使用来构建编译器或解析器。Flex负责词法分析,将输入文本分割成词法单元;Bison则负责语法分析,确定这些词法单元是如何根据文法规则关联的。Flex生成的词法分析器可以作为Bison生成的语法分析器的输入源,从而实现完整的编译过程。

四、总结

Flex和Bison是Linux和Unix环境下强大的工具,分别用于生成词法分析器和语法分析器。它们在编译器设计、文本处理等领域有着广泛的应用。Flex通过正则表达式进行词法分析,而Bison则通过上下文无关文法进行语法分析。两者通常一起使用,以构建完整的编译或解析过程。


http://www.ppmy.cn/server/65314.html

相关文章

数字通云平台 智慧政务OA PayslipUser SQL注入漏洞复现

0x01 产品简介 数字通云平台智慧政务OA产品是基于云计算、大数据、人工智能等先进技术,为政府部门量身定制的智能化办公系统。该系统旨在提高政府部门的办公效率、协同能力和信息资源共享水平,推动电子政务向更高层次发展。 0x02 漏洞概述 数字通云平台 智慧政务OA Paysli…

怎样在 PostgreSQL 中进行用户权限的精细管理?

&#x1f345;关注博主&#x1f397;️ 带你畅游技术世界&#xff0c;不错过每一次成长机会&#xff01;&#x1f4da;领书&#xff1a;PostgreSQL 入门到精通.pdf 文章目录 怎样在 PostgreSQL 中进行用户权限的精细管理&#xff1f;一、权限管理的重要性二、PostgreSQL 中的权…

02-用户画像-技术架构+业务划分

技术架构 python开发 es flume 流数据读取写入kafka文件 kafka 消息队列 sqoop 将数据导入数仓hive StructureStream 动态画像的处理 SparkSQL 静态画像的处理 &#xff0c;批数据处理 读取kafka获取用户行为数据 fineBI 数据展示 业务划分 离线业务 静态画像 …

[计算机网络] VPN技术

1. 概述 虚拟专用网络&#xff08;VPN&#xff09;技术利用互联网服务提供商&#xff08;ISP&#xff09;和网络服务提供商&#xff08;NSP&#xff09;的网络基础设备&#xff0c;在公用网络中建立专用的数据通信通道。VPN的主要优点包括节约成本和提供安全保障。 优点&#…

Android 性能优化之线程优化

文章目录 Android 性能优化之线程优化线程调度原理Android线程调度注意点 异步方式线程使用准则线程池配置 Android 性能优化之线程优化 线程调度原理 分时调度模型&#xff1a;让线程轮流获取CPU的使用权&#xff0c;并且平均每个线程占用CPU的时间片。这种方式确保了每个线…

电脑没有声音了怎么恢复?3个硬核操作,解救静音危机!

当你沉迷于电脑中的音乐、电影或是游戏时&#xff0c;突然一阵寂静袭来&#xff0c;是不是感觉就像突然按下了暂停键&#xff1f;这无疑是一场大灾难&#xff01;电脑没有声音了怎么恢复呢&#xff1f;急&#xff0c;今天小编带来了3个硬核操作&#xff0c;让你从无声的幽谷中爬…

微分段Microsegmentation简介

目录 微分段Microsegmentation简介什么是微分段&#xff1f;微分段的防范措施微分段的防护层级 基于网络的微分段微分段基本工作机制微分段的角色VxLAN的额外字段 业务链分组与传输策略场景1&#xff1a;三层报文本地转发场景场景2&#xff1a;三层报文跨设备转发场景 微分段的…

解决GoLand添加GOROOT提示The selected directory is not a valid home for Go Sdk的问题

现象 解决 在Go安装路径下找到zversion.go文件&#xff0c;我的在D:\Program Files\Go1.21.1\src\runtime\internal\sys下面 打开文件&#xff0c;添加如下内容&#xff1a; const TheVersion go1.21.1保存后再重新添加GOROOT即可

【数据分享】2013-2022年我国省市县三级的逐日SO2数据(excel\shp格式\免费获取)

空气质量数据是在我们日常研究中经常使用的数据&#xff01;之前我们给大家分享了2000——2022年的省市县三级的逐日PM2.5数据和2013-2022年的省市县三级的逐日CO数据&#xff08;均可查看之前的文章获悉详情&#xff09;&#xff01; 本次我们分享的是我国2013——2022年的省…

高精度滚珠导轨:驱动装配线自动化升级!

滚珠导轨是一种先进的运动控制装置&#xff0c;具有高精度、高稳定性和高可靠性等特点&#xff0c;被广泛应用于各个行业&#xff0c;为工业生产带来了巨大的影响。 滚珠导轨技术的广泛应用&#xff0c;尤其是在实现装配流程自动化中&#xff0c;不仅提高了生产效率&#xff0c…

宝塔Wordpress 插件 Redis object cache 导致内存很高 80%以上的原因和解决

查看内存前X 使用以下命令查看前10&#xff0c;修改10数字即可查看前X ps aux | head -1;ps aux |grep -v PID |sort -rn -k 4 | head -10 查看cpu占用 查看前10 ps aux | head -1;ps aux |grep -v PID |sort -rn -k 3 | head -10 原因是 4GiB 内存的服务器&#xff0c;Redis会…

[技术总结] C++ 使用经验

const 和 constexpr 有什么区别. const 一般是设置一个只读的属性, 在运行时还有可能通过cast变成一个可修改的. 但是constexpr是告诉编译器这就是一个常亮, 在编译时就可以计算出来然后进行替换.static 修饰的成员函数 & 成员变量 static 修饰的成员函数只能访问 static 修…

鸿蒙Navigation路由能力汇总

基本使用步骤&#xff1a; 1、新增配置文件router_map&#xff1a; 2、在moudle.json5中添加刚才新增的router_map配置&#xff1a; 3、使用方法&#xff1a; 属性汇总&#xff1a; https://developer.huawei.com/consumer/cn/doc/harmonyos-references/ts-basic-compone…

40、PHP 实现对称的二叉树(含源码)

题目&#xff1a; PHP 实现对称的二叉树 描述&#xff1a; 请实现一个函数&#xff0c;用来判断一颗二叉树是不是对称的。 注意&#xff0c;如果一个二叉树同此二叉树的镜像是同样的&#xff0c;定义其为对称的。 <?php/*class TreeNode{var $val;var $left NULL;var $r…

云原生:容器技术全解!

一、什么是容器&#xff1f; 容器是一种自包含、轻量级、可移植的软件打包技术&#xff0c;它使得应用程序可以在几乎任何地方以相同的方式运行。开发人员在自己笔记本上创建并测试好的容器&#xff0c;无须任何修改就能够在生产系统的虚拟机、物理服务器或公有云上运行。 所谓…

数据库管理-第222期 RDMACPU(20240722)

数据库管理222期 2024-07-22 数据库管理-第222期 RDMA&CPU&#xff08;20240722&#xff09;1 NIC释放CPU2 时间模型3 不仅是内存总结 数据库管理-第222期 RDMA&CPU&#xff08;20240722&#xff09; 作者&#xff1a;胖头鱼的鱼缸&#xff08;尹海文&#xff09; Orac…

稀疏支持向量机(Sparse Support Vector Machine, Sparse SVM)

稀疏支持向量机&#xff08;Sparse Support Vector Machine, Sparse SVM&#xff09; 稀疏支持向量机是一种在支持向量机的基础上&#xff0c;通过引入稀疏性约束&#xff0c;使得模型参数更加稀疏&#xff0c;从而提高模型的可解释性和计算效率的方法。以下是稀疏支持向量机的…

新手小白的pytorch学习第五弹-----pytorch的工作流

我们之前学习了 pytorch 中的基本数据 tensor 今天我们要开始学习 pytorch 的简单工作流程了 数据 -> 构建或选择一个预训练的模型 -> 使得模型适应数据并能够进行预测 -> 评估模型 -> 通过实验提升性能 -> 保存并重新加载你训练的模型 机器学习和深度学习的关…

【嵌入式开发之标准I/O】二进制文件的读写及实验

文本文件和二进制的区别 文本文件和二进制文件的区别主要在于它们的编码方式和数据组织方式。‌ 编码方式&#xff1a;‌文本文件是基于字符编码的文件&#xff0c;‌常见的编码有ASCII编码、‌UNICODE编码等。‌这些编码将字符映射到特定的二进制值&#xff0c;‌使得字符可以…

jvm-证明cpu指令是乱序执行的案例

package jvm;/*** 证明cpu指令是乱序执行的** author 1* version 1.0* description: TODO* date 2024-07-19 9:31*/ public class T04_Disorder {private static int x 0, y 0;private static int a 0, b 0;public static void main(String[] args) throws InterruptedExcep…