焦点热门:几百行代码实现一个脚本解释器
2022-06-29 09:54:07来源:今日头条
最近又在重新学习编译原理了,其实两年前也复习过,当初是为了能实现通过MySQL的DDL生成Python中sqlalchemy的model。
虽然完成了相关功能,但现在看来其实实现的比较糙的,而且也只运用到了词法分析;所以这次我的目的是可以通过词法分析->语法分析->语义分析 最终能实现一个功能完善的脚本"语言"。
效果现在也有了一些阶段性的成果,如下图所示:
(资料图)
目前具备以下基本功能:
变量声明与赋值(只支持 int)。二次运算(优先级支持)。语法检查。debug 模式,可以打印 AST。感兴趣的朋友可以在这里查看源码: https://github.com/crossoverJie/gscript。
本地有 go 环境的话也可以安装运行。
go get github.com/crossoverJie/gscriptgscript -h
或者直接下载二进制文件运行:https://github.com/crossoverJie/gscript/releases。
实现当前版本是使用 go 编写的,确实也如标题所说,核心代码还不到 1k 行代码,当然这也和目前功能简陋有关。
不过麻雀虽小五脏俱全,从当前版本还是运用到了编译原理中的部分知识:词法、语法分析。
基本实现流程如上图:
通过词法分析器将源码中解析出 token。再通过对 token 推导生成出抽象语法树(AST) 如果语法语法出现错误,这一步骤便会抛出编译失败,比如2*(1+少了一个括号。因为没有使用类似于ANTLR这样工具来辅助生成代码(不然功能也不会只有这么点),所以其中的词法、语法分析都是手写的,代码量并不大,对于想要调试的朋友可以直接查看源码。
词法分析器:token/token.go:39语法分析器:syntax/syntax.go。
其中会涉及到一些概念,比如有限状态机、递归下降算法等知识点就没在本文讨论了,后续这个项目功能更加完善后也会重头整理。
规划最后是画饼阶段了,不出意外后续会继续新增如下功能:
更多的基础类型,string/long 之类的。变量作用域、函数。甚至是闭包。OOP 肯定也少不了。这些特性都实现后那也算是一个"现代"的脚本语言了,后续我也会继续更新学习和实现过程中的有趣内容。
源码地址: https://github.com/crossoverJie/gscript。