Я пытаюсь проанализировать сложное логическое выражение, подобное приведенному ниже:
x > 7 AND x < 8 OR x = 4
и получить синтаксическую строку как двоичное дерево. Для вышеуказанного выражения ожидаемое синтаксическое выражение должно выглядеть как
[['x', '>', 7], 'AND', [['x', '<', 8], 'OR', ['x', '=', 4]]]
"OR" логический оператор имеет более высокий приоритет, чем оператор "И". Скобки могут отменять приоритет по умолчанию. Чтобы быть более общим, выражение parsed должно выглядеть следующим образом:
<left_expr> <logical_operator> <right_expr>
Другим примером может быть
input_string = x > 7 AND x < 8 AND x = 4
parsed_expr = [[['x', '>', 7], 'AND', ['x', ',', 8]], 'AND', ['x', '=', 4]]
До сих пор я придумал это простое решение, которое, к сожалению, не может генерировать анализируемое выражение в двоичном древовидном стиле. operatorPrecedence, похоже, не помогает мне здесь, где есть тот же логический оператор, что и в предыдущем примере.
import pyparsing as pp
complex_expr = pp.Forward()
operator = pp.Regex(">=|<=|!=|>|<|=").setName("operator")
logical = (pp.Keyword("AND") | pp.Keyword("OR")).setName("logical")
vars = pp.Word(pp.alphas, pp.alphanums + "_") | pp.Regex(r"[+-]?\d+(:?\.\d*)?(:?[eE][+-]?\d+)?")
condition = (vars + operator + vars)
clause = pp.Group(condition ^ (pp.Suppress("(") + complex_expr + pp.Suppress(")") ))
expr = pp.operatorPrecedence(clause,[
("OR", 2, pp.opAssoc.LEFT, ),
("AND", 2, pp.opAssoc.LEFT, ),])
complex_expr << expr
print complex_expr.parseString("x > 7 AND x < 8 AND x = 4")
Любые предложения или рекомендации хорошо оценены.
BNF
для выражения (без скобок) может быть
<expr> -> <expr> | <expr> <logical> <expr>
<expr> -> <opnd> <relational> <opnd>
<opnd> -> <variable> | <numeric>
<relational> -> <'>'> | <'='> | <'>='> | <'<='> | <'!='>