使用 ANTLR4 处理字符串

2022-09-03 03:51:42

我正在尝试将语法从v3转换为v4,并且在找到所有正确的部分时遇到了一些麻烦。

在 v3 中处理字符串时,我使用了:

public static DataExtractor create(String dataspec) {
    CharStream stream = new ANTLRStringStream(dataspec);
    DataSpecificationLexer lexer = new DataSpecificationLexer(stream);
    CommonTokenStream tokens = new CommonTokenStream(lexer);
    DataSpecificationParser parser = new DataSpecificationParser(tokens);

    return parser.dataspec();
}

如何将其更改为在 v4 中工作?


答案 1

对于 ANTLR 4.7,API 发生了一些变化(ANTLRInputStream 已弃用):

InputStream stream = new ByteArrayInputStream(input.getBytes(StandardCharsets.UTF_8));
lexer.setInputStream(CharStreams.fromStream(stream, StandardCharsets.UTF_8));
parser.setInputStream(new CommonTokenStream(lexer));

提示:如果要重用解析器+词法分析器实例,请在设置其输入流后调用其'reset()'方法。


答案 2

所做的更改包括:

  • ANTLRStringStream已被替换为构造函数,因为它需要ANTLRInputStreamString
  • 解析器规则现在返回一个上下文对象,该对象具有根据规则子句命名的公共字段。returns

因此,如果规则显示“”,则 v4 方法变为:dataspecreturns [DataExtractor extractor]

public static DataExtractor create(String dataspec) {
    CharStream stream = new ANTLRInputStream(dataspec);
    DataSpecificationLexer lexer = new DataSpecificationLexer(stream);
    CommonTokenStream tokens = new CommonTokenStream(lexer);
    DataSpecificationParser parser = new DataSpecificationParser(tokens);

    return parser.dataspec().extractor;
}