你的位置：首页>网站源码>requests使用re爬取腾讯体育新闻

requests使用re爬取腾讯体育新闻

网站源码admin2024-12-1247浏览0评论

简介

爬取新闻标题

1. 安装

pip install request
pip install fake_useragent

2. 演示

进入网址，查看网页源代码
找到标题界面，根据li标签的特征使用re匹配
代码演示

import requests
from fake_useragent import UserAgent # 伪装请求头的库
import re

url = 'http://sports.qq/'   # 腾讯体育新闻网址
headers = {'User-Agent': UserAgent().chrome} 

response = requests.get(url, headers)
pattern = r'<li><a target="_blank" href="(.*?)" class="(.*?)">(.*?)</a></li>'
s = re.findall(pattern=pattern, string=response.text)

for content in s:
    print(content[2])

print('--------完成-------')

结果

与本文相关的文章

利用腾讯云函数(SCF)搭建免费代理池
使用腾讯乐固加固安卓APK
JavaScrpit+Html实现“网页播放视频“效果(应用场景:腾讯PC端视频播放器、以及各视频网站页面开发设计)
【人工智能开发框架】实验1、注册腾讯API，调用某个接口，完成一个人工智能应用
分享手机兼容性测试一个很好的网站，腾讯优测
小熊派移植TencentOS-tiny+EC20+MQTT对接腾讯云
腾讯云对象存储服务的使用
js逆向-腾讯滑块collect参数
最全poi操作word实现分页，腾讯Java开发面试凉凉
报错: USER_AGENT environment variable not set, consider setting it to identify your requests.
万字巨制！阿里、百度、腾讯、字节、蚂蚁等 9 大技术专家同台，“卷”出 AI 编码新未来...
地哥的腾讯面试经历
两次腾讯面试都挂二面了，分享下苦逼面试经历
春招两次腾讯面试都挂二面，分享下我失败+傻傻的面试经历
腾讯视频怎么禁止别人登录我的会员
要闻君说：Synergy Research Group首发云基础设施数据，腾讯云v5一把；京东物流发力5G；厉害！阿里挖走贾扬清...
腾讯云自定义域名DDNS远程访问群晖NAS
第一次使用腾讯云服务器OpenCloudOS 8.6并配置Java11环境
腾讯云Centos7系统nginx、pm2部署node.js项目（从购买服务器到部署项目）
用windows系统下的DOS命令将腾讯视频客户端下载的qlv文件转换成MP4格式（图文详解）

评论列表(0)

暂无评论

科技改变生活-雨落星辰 - 所有的伟大,都源于一个勇敢的开始

简介

爬取新闻标题

1. 安装

2. 演示

与本文相关的文章

评论列表(0)