对问题1的答复
要回答第一个问题,可以使用:
(?xm) # ignore comments and whitespace, ^ matches beginning of line
^ # beginning of line
(?:
. # any character except \n
(?= # lookahead
.*+\n # go to next line
( \1?+ . ) # add a character to the 1st capturing group
.*+\n # next line
( \2?+ . ) # add a character to the 2nd capturing group
)
)*? # repeat as few times as needed
X .*+\n # X on the first line and advance to next line
\1?+ # if 1st capturing group is defined, use it, consuming exactly the same number of characters as on the first line
X .*+\n # X on the 2nd line and advance to next line
\2?+ # if 2st capturing group is defined, use it, consuming exactly the same number of characters as on the first line
X # X on the 3rd line
Online demo
此表达式适用于 Perl、PCRE、Java,并且应该在 .NET 中工作。
该表达式使用具有自引用捕获组的 lookaheads 为每次重复的 lookahead 添加一个字符(这用于“计数”)。
\1?+
意味着如果匹配项(或已定义)消耗它,并且不要将其返回(不要回溯)。在本例中,它等效于 。这意味着定义了匹配 if。\1
(?(1) \1 )
\1
\1
polygenelubricants在他的回答中很好地解释了这种带有反向引用的前瞻 我们如何将a^n b^n与Java正则表达式相匹配?。(他还写了关于Java正则表达式的其他令人印象深刻的技巧,涉及反向引用和查找。
对问题2的答复
普通匹配
当仅使用匹配并要求匹配次数中的答案(计数)时,问题2的答案将是:
它不能在具有有限外观的正则表达式类型中直接解决。而Java和.NET等其他风格可以(例如在m.buettner的.NET解决方案中)。
因此,在这种情况下,Perl和PCRE(PHP等)中的普通正则表达式匹配不能直接回答这个问题。
(半?证明
假定没有可用的可变长度查找后缀。
您必须以某种方式计算一行中在 .
做到这一点的唯一方法是匹配它们,并且由于没有可用的可变长度查找后缀,因此您必须(至少)在行的开头开始匹配。
如果您在一行的开头开始比赛,则每行最多只能获得一场比赛。X
由于每行可以有多个匹配项,因此这不会将它们全部计算在内,也不会给出正确的答案。
长度/间接解决方案
另一方面,如果我们接受答案作为匹配或替换结果的长度,那么第二个问题可以用PCRE和Perl(以及其他风格)来回答。
该解决方案基于/灵感来自m.buettner的“部分PCRE解决方案”。
可以简单地将以下表达式的所有匹配项替换为 ,得到问题二(兴趣模式的数量)的答案作为结果字符串的长度。$3
^
(?:
(?: # match .+? characters
.
(?= # counting the same number on the following two lines
.*+\n
( \1?+ . )
.*+\n
( \2?+ . )
)
)+?
(?<= X ) # till the above consumes an X
(?= # that matches the following conditions
.*+\n
\1?+
(?<= X )
.*+\n
\2?+
(?<= X )
)
(?= # count the number of matches
.*+\n
( \3?+ . ) # the number of matches = length of $3
)
)* # repeat as long as there are matches on this line
.*\n? # remove the rest of the line
在Perl中可以写成:
$in =~ s/regex/$3/gmx;
$count = length $in;
Online demo
此表达式类似于上面问题 1 的解决方案,但进行了一些修改,以包含在第一个前瞻中匹配的字符中,用量词包装并计算量词的匹配次数。X
除了直接匹配之外,这是尽可能接近的(除了正则表达式之外,额外的代码明智),并且可能是问题2的可接受答案。
测试用例
上述解决方案的一些测试用例和结果。结果显示数字答案(结果字符串的长度)和替换后的结果字符串在括号中。
Test #0:
--------------------
X
X
X
result: 1 (X)
Test #1:
--------------------
..X....
..X....
..X....
result: 1 (.)
Test #2:
--------------------
..X.X..
..X.X..
....X..
result: 1 (.)
Test #3:
--------------------
..X....
..X....
...X...
result: 0 ()
Test #4:
--------------------
..X....
...X...
..X....
result: 0 ()
Test #5:
--------------------
....X..
.X..X..
.X.....
result: 0 ()
Test #6:
--------------------
.X..X..
.X.X...
.X.X...
result: 1 (.)
Test #7:
--------------------
.X..X..
.X..X..
.X..X..
result: 2 (.X)
Test #8:
--------------------
XXX
XXX
XXX
result: 3 (XXX)
Test #9:
--------------------
X.X.X
XXXXX
XXXXX
.X.X.
result: 5 (XXXXX)
Test #10:
--------------------
1....X.......
2..X..X...X....
3X.X...X..X.....
4X....XXXXXX.....
5X..XXX...........
6.....X..........
7.........X....X
8..X......X....X....
9..X......X....X....X...
A....X.....
B.X..X..
C.....
XXX
XXX
XXX
.
result: 8 (3458.XXX)