删除基本网址

作者: v-star*위위
发布时间: 2025-02-07 07:46:35 (6天前)
转自：

3 条回复

0#
回复此人
没身份别烦我 | 2019-08-31 10-32

<div class =“post-text”itemprop =“text”> <P> 如果我理解正确，您可以尝试以下方法： </p> <pre> <code> l = [] for link in soup.findAll('a'): print link.get('href') l.append(link.get('href')) l = [x for x in l if "www" not in x] #or 'https' </code> </pre> </DIV>

编辑
1#
回复此人
不易青年。 | 2019-08-31 10-32

<div class =“post-text”itemprop =“text”> <P> 您可以使用 <code> parse_url </code> 来自 <code> requests </code> 模块。 </p> <pre> <code> import requests url = 'https://www.facebook.com/KTeqSolutions/' requests.urllib3.util.parse_url(url) </code> </pre> <P> 给你 </p> <pre> <code> Url(scheme='https', auth=None, host='www.facebook.com', port=None, path='/KTeqSolutions/', query=None, fragment=None) </code> </pre> </DIV>

编辑

登录后才能参与评论