PROSAGA码农传奇-SAS-Perl Regex负面背后不正确匹配（SAS）

<div class =“post-text”itemprop =“text”>
  
    这是你的正则表达式匹配的方式
     <code>
 no and little risk
 </code>
    ：
  
  
    正则表达式中的一个分支是
     <code>
 ...|(?<!\bno)(?<!low).+risk
 </code>
    。
  
  
    正则表达式引擎首先在目标字符串中的每个位置尝试匹配，从头开始：
  
   <pre class="lang-none prettyprint-override">
 <code>
 no and little risk
^

</code>
 </pre>
  
    第一个约束是当前位置不能在单词边界后跟“no”（由于
     <code>
 (?<!\bno)
 </code>
    ）。满足此条件：目标字符串的开头前面没有任何内容。
  
  
    第二个限制是当前位置不能在“低”之前（由于
     <code>
 (?<!low)
 </code>
    ）。这种情况也得到满足（见上文）。
  
  
    然后我们匹配一个或多个非换行符，但尽可能多地匹配它们（这是
     <code>
 .+
 </code>
     部分）。这里我们最初使用整个字符串：
  
   <pre class="lang-none prettyprint-override">
 <code>
 no and little risk
------------------^

</code>
 </pre>
  
    但是正则表达式需要匹配
     <code>
 risk
 </code>
    ，失败（目标字符串中没有剩余字符）。这导致
     <code>
 .+
 </code>
     在发生这种情况之前，要回溯并消耗越来越少的字符：
  
   <pre class="lang-none prettyprint-override">
 <code>
 no and little risk
--------------^

</code>
 </pre>
  
    在此刻，
     <code>
 risk
 </code>
     成功匹配，正则表达式完成。
  
  
    基本问题是你想要做的就是
     <code>
 (?<!\bno.+)(?<!low.+)risk
 </code>
    ，但你写的是
     <code>
 (?<!\bno)(?<!low).+risk
 </code>
    。这是两个非常不同的东西！
  
  
    前者意味着“匹配'风险'，但只有在字符串中的任何地方都没有'否'或'低'之前（在'风险'之前最多1个字符）”。后者意味着“匹配任何非空子字符串后跟'风险'，只要它没有'不'或'低'之前”。这使得正则表达式引擎可以自由地查找字符串中的任何匹配位置，只要它不是紧跟在“no”或“low”之后，并且在某处后面跟着“。+ risk”。
  
  
    不幸
     <code>
 (?<!\bno.+)
 </code>
     不是有效的正则表达式，因为后置断言必须具有固定长度。
  
  
    一种可能的解决方法是执行以下操作：
  
   <pre class="lang-none prettyprint-override">
 <code>
 ^(?!.*(?:\bno|low).+risk).*risk

</code>
 </pre>
  
    这说：从字符串的开头开始，首先确保在任何地方都没有“no”或“low”，然后是“risk”，然后在字符串中的任何位置匹配“risk”。
  
  
    这与（假设的）可变宽度后视版本并不完全相同，因为那个版本会匹配
  
   <pre class="lang-none prettyprint-override">
 <code>
 risk no risk
^^^^

</code>
 </pre>
  
    由于存在“风险”而前面没有“否”，而这种解决方法首先发现
  
   <pre class="lang-none prettyprint-override">
 <code>
 risk no risk
 ^^^^^^^

</code>
 </pre>
  
    并立即拒绝整个字符串。
  
</DIV>