我正在尝试用PDI KETTLE中的“替换字符串”步骤清理字符串。
输入字符串如下所示:
< p class =“MsoNormal”style =“FONT-SIZE:11pt; mso-ansi-language:ES”> AAA< p>& …
问题是你的 (.*) 是贪婪的,因此它会捕捉到最后的一切 > 。
(.*)
>
为了使它变得懒惰你可以:
(<(.*?)>)
(<([^>]*)>)
两者都应该作为输出工作和生产
AAA BBB CCC.