当前位置:AIGC资讯 > 数据采集 > 正文

爬虫遇到有拆分单元格的表格(爬虫快速处理网页表格)

import requests
from txdpy import webptablesl

res=requests.get('http://zsb.tiangong.edu.cn/2022/0907/c196a79135/page.htm')
res.encoding = res.apparent_encoding
res=res.text

xpath='//table'
trs=(webptablesl(res,xpath))
for tr in trs:
    print(tr)

更新时间 2023-11-08