使用selenium返回日期和作者
from selenium import webdriver from selenium.webdriver.common.by import By from selenium.webdriver.support.ui import WebDriverWait from selenium.webdriver.support import expected_conditions as EC url = 'https://vk.com/photo-68872445_422126739' driver = webdriver.Chrome() driver.get(url) item = WebDriverWait(driver,10).until(EC.presence_of_element_located((By.CSS_SELECTOR, ".group_link"))).text item2 = driver.find_element_by_css_selector('.rel_date').text print(item, item2) driver.quit()
我不确定它会对你有什么帮助,因为我看不到你的数据 script 标签。 但是,如果您的最终目的是获取日期和作者,请参阅以下代码:
script
from bs4 import BeautifulSoup import requests import lxml import json url = 'https://vk.com/photo-68872445_422126739?rev=1' req = requests.get(url) soup = BeautifulSoup(req.text, 'lxml') dls = soup.find_all("dl",{'class':'si_row'}) for dl in dls: atag = dl.find('a') if atag: author_link = atag.get('href') author_name = atag.get_text() print(author_link) print(author_name) span_date = soup.find('span',{'class':'item_date'}) if span_date: date = span_date.get_text() print(date)
的 编辑: 强>
为了记录,您的错误可能是因为您正在使用 requests 获取页面和您正在搜索的数据在ajax响应中。你可以看看 selenium 如果你想从脚本中获取更多数据
requests
selenium
Selenium文档