- 微信
- 微博
  
  分享文章到微博
- 复制链接
  
  复制链接到剪贴板

Python实现SLR（1）语法分析器详解

nineteens 发表于 2020/11/13 11:10:01 2020/11/13

【摘要】 Python实现SLR（1）语法分析器详解

　　Python实现SLR(1)语法分析器

　　getCol函数(该函数将终结符和非终结符映射到action和goto表中相应的列)，initProduction函数(该函数定义了文法产生式(拓广文法)，在本文中有28个产生式)，source(输入单词序列)，varset(非终结符集合)，terminalset(终结符集合)

　　SLR(1)分析流程

　　输入文法

　　求first集

　　求follow集

　　构造LR(0)项目集DFA

　　构造Action和Goto

　　按照Action和Goto进行分析

　　1.主要数据结构定义和基础函数：

　　基础函数

　　isVariable函数判断是不是非终结符

　　isTerminal函数判断是不是终结

　　transf(production_set, var)函数 production_set为一个LR(0)项目，尝试通过var(终结符或非终结符)进行转移

　　isSameStatus(status1, status2)函数：判断status1和status2是不是两个相同的LR(0)项目

　　isInPointset(production_set, pointset):#用来检验production_set是不是已经存在的point ，如果存在就把point返回(生成DFA时用到)

　　数据结构

　　产生式采用类来存储，left和right分别为list，number‘为产生式编号

　　GraphPoint存储DFA转移，transfer为有向边集合，集合中的一个元素由var(终结符或非终结符)，和另一个GraphPoint组成

　　class Production:

　　def __init__(self, left, right, number):

　　self.left = left

　　self.right = right

　　self.number = number

　　class GraphPoint:

　　def __init__(self, begin_production, id):

　　self.status = begin_production

　　self.transfer = []

　　self.id = id

　　def add_transfer(self, var, graphPoint):

　　self.transfer.append([var, graphPoint])

　　2.文法定义

　　1.分析目标代码：int lexicalanalysis(){ float a; int b; a=1.1; b=2; while(b<100){ b=b+1; a=a+3;}; if(a>5) {b=b-1;} else {b=b+1;}}

　　2.语法分析器输入为目标代码的词法分析器输出的单词序列

　　source = [[5, "int", " 关键字"], [1, "lexicalanalysis", " 标识符"], [13, "(", " 左括号"], [14, ")", " 右括号"], [20, "{", " 左大括号"],

　　[4, "float", " 关键字"], [1, "a", " 标识符"], [15, ";", " 分号"], [5, "int", " 关键字"], [1, "b", " 标识符"],

　　[15, ";", " 分号"], [1, "a", " 标识符"], [12, "=", " 赋值号"], [3, "1.1", " 浮点数"], [15, ";", " 分号"], [1, "b", " 标识符"],

　　[12, "=", " 赋值号"], [2, "2", " 整数"], [15, ";", " 分号"], [8, "while", " 关键字"], [13, "(", " 左括号"],

　　[1, "b", " 标识符"], [17, "<", " 小于号"], [2, "100", " 整数"], [14, ")", " 右括号"], [20, "{", " 左大括号"],

　　[1, "b", " 标识符"], [12, "=", " 赋值号"], [1, "b", " 标识符"], [9, "+", " 加号"], [2, "1", " 整数"], [15, ";", " 分号"],

　　[1, "a", " 标识符"], [12, "=", " 赋值号"], [1, "a", " 标识符"], [9, "+", " 加号"], [2, "3", " 整数"], [15, ";", " 分号"],

　　[21, "}", " 右大括号"], [15, ";", " 分号"], [6, "if", " 关键字"], [13, "(", " 左括号"], [1, "a", " 标识符"],

　　[16, ">", " 大于号"], [2, "5", " 整数"], [14, ")", " 右括号"], [20, "{", " 左大括号"], [1, "b", " 标识符"],

　　[12, "=", " 赋值号"], [1, "b", " 标识符"], [10, "-", " 减号"], [2, "1", " 整数"], [15, ";", " 分号"], [21, "}", " 右大括号"],

　　[7, "else", " 关键字"], [20, "{", " 左大括号"], [1, "b", " 标识符"], [12, "=", " 赋值号"], [1, "b", " 标识符"],

　　[9, "+", " 加号"], [2, "1", " 整数"], [15, ";", " 分号"], [21, "}", " 右大括号"], [21, "}", " 右大括号"]]

　　3.文法定义：拓广文法共有28个产生式，0号产生式为保证分析器只有一个接受状态，而拓广的产生式。

　　def initProduction():

　　production_list = []

　　production = Production(["A1"], ["A"], 0)