- 微信
- 微博
  
  分享文章到微博
- 复制链接
  
  复制链接到剪贴板

【F#从入门到实战】11. F#库FParsec入门

jackwangcumt 发表于 2021/06/08 08:17:42 2021/06/08

【摘要】 FParsec 是一个F#语言构建的解析器组合库，主要用于解析文本，并结构化输出，可以为形式语法实现递归下降文本解析器。本文给出简单的解析器示例。

欢迎大家来到【F#从入门到实战】，在这里我将分享关于F#编程语言的系列文章，带大家一起去学习和成长，并探索函数编程语言F#这个有趣的世界。所有文章都会结合示例代码和笔者的经验进行讲解，真心想把十余年的IT经验分享给大家，希望对您有所帮助，文章中也定有不足之处，请海涵！本系统文章将从F#基本语法入手，逐步通过自定义类型来实现数学表达式的各种常见解析操作，如对表达式进行求值、化简、展开、求导和求积分等。此系统博文也是了解和实现一个简易的计算机代数系统的基础。

下面给出【F#从入门到实战】系统专题文章的目录：

下面将正式开始本文的介绍：

FParsec 是一个F#语言构建的解析器组合库，主要用于解析文本，并结构化输出，可以为形式语法实现递归下降文本解析器。根据官网的介绍，FParsec库的主要功能包括：

支持上下文相关的无限前瞻文法
自动生成、高度可读的错误消息
Unicode 支持
对非常大的文件的有效支持
一个可嵌入的、运行时可配置的运算符优先级解析器组件
一个简单、高效且易于扩展的 API
针对性能进行彻底优化的实现
全面的文档
一个宽松的开源许可证，源代码和二进制形式的 FParsec 库是在简化的 BSD 许可下分发

官网为 http://www.quanttec.com/fparsec/ ，可以从官网查看具体的用法。FParsec 源代码在 GitHub 上可以下载：github.com/stephan-tolksdorf/fparsec

FParsec 库的源代码用 C# 和 F# 编写的，包含两个DLL库：FParsec.dll和 FParsecCS.dll ，项目需要引用此DLL库。下面给出一些示例，用来直观的掌握如何使用这个解析器库：

首先，所有 FParsec 类型和模块都在FParsec命名空间中声明。该命名空间包含一些基本类和4个 F# 模块，即：

Primitives：包含基本类型定义和解析器组合器
CharParsers：包含字符、字符串和数字的解析器，以及将解析器应用于输入流的函数
Error：包含用于创建、处理和格式化解析器错误消息的类型和辅助函数
StaticMapping：包含将静态键值映射编译为优化函数的函数

因此如果要使用open FParsec库，则应该首先引入此库：

open FParsec

首先需要需要根据解析的对象，构建合适的解析器Parser，当然，FParsec库中的模块如 FParsec.Primitives和FParsec.CharParsers模块中包含了内置的解析器，如解析float类型的解析器pfloat，其定义为：

val pfloat: Parser<float,'u>

如果要想调用此解析器，并返回结果（ParserResult<'Result,unit>），则需要run来进行调用，其中的ParserResult定义为：

type ParserResult<'Result,'UserState>=
     | Success of 'Result * 'UserState * Position
     | Failure of string * ParserError * 'UserState

解析器pfloat示例为：

let f2 = run pfloat "1.25"
printfn "%O" f2  //Success: 1.25

当然，为了方便的进行测试运行，可以构建一个test函数：

let test p str =
    match run p str with
    | Success(value, _, _)   -> printfn "OK: %A" value
    | Failure(err, _, _) -> printfn "Fail: %s" err

用此test函数来运行pfloat解析器示例，如下所示：

//解析float类型
test pfloat "1.25" //OK: 1.25
test pfloat "1.25E" //Fail: Error ...

其中对文本"1.25E"解析会出现如下错误信息：

Fail: Error in Ln: 1 Col: 6
1.25E
     ^
Note: The error occurred at the end of the input stream.
Expecting: decimal digit

如果这个数值字符中有空字符（如空格）会解析正确吗？可以看下面的示例：

 //数值后面可以有空格字符
 test pfloat "1.27 " //OK: 1.27
//数值前面不可以有空格字符
test pfloat " 1.28" //Fail: Error ..

下面介绍一下如何从括号中提取数值，示例如下：

//解析string类型，忽略空白 ' ', '\t', '\r' ', '\n' 
let pstr_ws s = pstring s .>> spaces
let pfloat_ws = pfloat  .>> spaces
//()中间的解析出float
let pfloatBetKK = pstr_ws "(" >>. pfloat_ws .>> pstr_ws ")"
test pfloatBetKK "(2.6)" //OK: 2.6
test pfloatBetKK "(2.7 )" //OK: 2.7
test pfloatBetKK "( 2.8 ) " //OK: 2.8
test pfloatBetKK " ( 2.9 ) " //Fail: Error... 左括号有空格

另外，还可以对特定括号中的字符按照分隔符进行拆分并解析，具体示例如下：

let parray = pstr_ws "[" >>. sepBy pfloat_ws (pstr_ws ";") .>> pstr_ws "]"
//OK: [1.0; 2.0; 3.0]
test parray @"[ 1 ; 2 ;
                            3 ] "

有时候，我们解析字符时，希望跳过特定字符，具体示例如下：

//spaces >>. 左空白   .>> spaces 右空白
let pfloat_ws2 = spaces >>.  pfloat  .>> spaces
let f  s = (skipStringCI "<float>" >>. pfloat_ws2) s
test  f "<FLOAT> 1.0 " //OK:1.0

上述示例，则跳过<float>字符串，且忽略大小写，从而提取出1.0

最后，这个解析器还可以构建更加复杂的逻辑，比如判断变量命名是否合法：

let identifier =
     let isIdentifierFirstChar c = isLetter c || c = '_'
     let isIdentifierChar c = isLetter c || isDigit c || c = '_'  
     many1Satisfy2L isIdentifierFirstChar isIdentifierChar "identifier"
     .>> spaces   // 忽略右空白

let id =  spaces >>.  identifier  .>> spaces 
test id "_name" //OK: "_name"
test id " _name "//OK: "_name"
(*
    Fail: Error in Ln: 1 Col: 1
    1_name
    ^
    Expecting: identifier
*)
test id "1_name "

由上示例可知，_name是合法的变量名，而1_name以数字开头，则不合法。

【声明】本内容来自华为云开发者社区博主，不代表华为云及华为云开发者社区的观点和立场。转载时必须标注文章的来源（华为云社区）、文章链接、文章作者等基本信息，否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容，欢迎发送邮件进行举报，并提供相关证据，一经查实，本社区将立刻删除涉嫌侵权内容，举报邮箱： cloudbbs@huaweicloud.com

点赞
收藏
关注作者

0/1000

抱歉，系统识别当前为高风险访问，暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称，即可参与社区互动！

*长度不超过10个汉字或20个英文字符，设置后3个月内不可修改。

确认取消

加入云驻计划，成为创作者

华为云周边好礼
免费体验产品
特殊身份标识
线下官方门票
内部专家零距离
与10000+优质创作者共同成长

立即加入

【F#从入门到实战】11. F#库FParsec入门

全部回复

设置昵称

关于作者

目录

加入云驻计划，成为创作者

推荐阅读

相关产品