如何使正则表达式变得不贪婪?

我正在使用jQuery。我有一个带有特殊字符块(开头和结尾)的字符串。我想从该特殊字符块中获取文本。我使用正则表达式对象进行字符串内查找。但是,当具有两个或更多特殊字符时,我如何告诉jQuery查找多个结果?

我的 HTML:

<div id="container">
    <div id="textcontainer">
     Cuộc chiến pháp lý giữa [|cơ thử|nghiệm|] thị trường [|test2|đây là test lần 2|] chứng khoán [|Mỹ|day la nuoc my|] và ngân hàng đầu tư quyền lực nhất Phố Wall mới chỉ bắt đầu.
    </div>
</div>

和我的 JavaScript 代码:

$(document).ready(function() {
  var takedata = $("#textcontainer").text();
  var test = 'abcd adddb';
  var filterdata = takedata.match(/(\[.+\])/);

  alert(filterdata); 

  //end write js 
});

我的结果是: [|cơ thử|nghiệm|] thị trường [|test2|đây là test lần 2|] chứng khoán [|Mỹ|day la nuoc my|].但这不是我想要:(的结果。如何获取时间 1 的 [文本] 和时间 2 的 [演示]?


我刚刚在互联网^^上搜索信息后完成了我的工作。我像这样编写代码:

var filterdata = takedata.match(/(\[.*?\])/g);
  • 我的结果是:[|cơ thử|nghiệm|],[|test2|đây là test lần 2|]这是对的!但我真的不明白这一点。你能回答我为什么吗?

答案 1

非贪婪的正则表达式修饰符就像它们贪婪的对应部分,但紧随其后的是:?

*  - zero or more
*? - zero or more (non-greedy)
+  - one or more
+? - one or more (non-greedy)
?  - zero or one
?? - zero or one (non-greedy)

答案 2

你是对的,贪婪是一个问题:

--A--Z--A--Z--
  ^^^^^^^^^^
     A.*Z

如果你想匹配两者,你必须使用(使“不情愿”或懒惰)。A--ZA.*?Z?*

但是,有时有更好的方法来做到这一点,例如

A[^Z]*+Z

这使用否定字符类和所有格量词来减少回溯,并且可能更有效。

在您的例子中,正则表达式将是:

/(\[[^\]]++\])/

不幸Javascript 正则表达式不支持所有格量词,所以你只需要与:

/(\[[^\]]+\])/

另请参见


快速摘要

*   Zero or more, greedy
*?  Zero or more, reluctant
*+  Zero or more, possessive

+   One or more, greedy
+?  One or more, reluctant
++  One or more, possessive

?   Zero or one, greedy
??  Zero or one, reluctant
?+  Zero or one, possessive

请注意,不情愿量词和所有格量词也适用于有限重复构造。{n,m}

Java 中的示例:

System.out.println("aAoZbAoZc".replaceAll("A.*Z", "!"));  // prints "a!c"
System.out.println("aAoZbAoZc".replaceAll("A.*?Z", "!")); // prints "a!b!c"

System.out.println("xxxxxx".replaceAll("x{3,5}", "Y"));  // prints "Yx"
System.out.println("xxxxxx".replaceAll("x{3,5}?", "Y")); // prints "YY"