我找到 html2text 从给出HTML中提取文本 的 同 强> 降价语法中的链接和图像。
html2text
所以不要使用, html2text.html2text(htmltext) , 您可以使用管理一些选项
html2text.html2text(htmltext)
h = html2text.HTML2Text() h.ignore_links = True h.ignore_images = True h.handle (htmltext)