python爬虫题目

server/2024/10/15 20:09:45/

网站
https://project-iprj6705f17ebcfad66461658c5c-8000.preview.node01.inscode.run/

第一道题爬取api并且保存

python">import requests,re
import json
url = "https://project-iprj6705f17ebcfad66461658c5c-8000.preview.node01.inscode.run/tasks/api/"
headers= {'user-agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/129.0.0.0 Safari/537.36'
}res = requests.get(url,headers=headers).json()
with open('1.json','w') as f:f.write(json.dumps(res,ensure_ascii=False))

第二道爬取所有图片

python">from urllib.parse import urljoin
import requests,re
from urllib.parse import urlparse
import json
url = "https://project-iprj6705f17ebcfad66461658c5c-8000.preview.node01.inscode.run/tasks/api/"
headers= {'user-agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/129.0.0.0 Safari/537.36'
}res = requests.get(url,headers=headers).json()
list1 = res['articles']
list2=[]
for i in list1:list2.append(i['image'])
base_url ="https://"+urlparse(url).netlocfor image in list2:image_url = urljoin(base_url,image)img = requests.get(image_url).contentimg_name = image.split("/")[-1]with open(img_name,'wb') as f:f.write(img)

第三道 爬取题目和摘要

python">import requests,csv
from lxml import etree
with open("data.csv","w",newline='',encoding='gbk') as f:writer = csv.writer(f)writer.writerow(["题目","再要"])
url = "https://project-iprj6705f17ebcfad66461658c5c-8000.preview.node01.inscode.run/tasks/article/list/"
headers= {'user-agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/129.0.0.0 Safari/537.36'
}res = requests.get(url,headers=headers)
html = etree.HTML(res.text)
wen_zhang = html.xpath('//div[@class="lab-block"]//a//@href')
with open("data.csv","w",newline='',encoding='gbk') as f:writer = csv.writer(f)writer.writerow(["ti","zai"])for i in wen_zhang:url_l = "https://project-iprj6705f17ebcfad66461658c5c-8000.preview.node01.inscode.run/"+iresult = requests.get(url_l,headers=headers)select = etree.HTML(result.text)timu = select.xpath('//h2/text()')[0]zaiyao = select.xpath('//p//text()')result = "".join(zaiyao)with open("data.csv", "a", newline='',encoding='utf-8') as f:writer = csv.writer(f)writer.writerow([timu, result])

http://www.ppmy.cn/server/132347.html

相关文章

Redis存储时key的设置

固定值(Static Keys) 固定值的键通常用于存储那些在整个应用程序运行周期内相对不变的信息,或者是那些需要长期保存的数据。这些键通常不会因为不同的请求或用户而改变,而是代表了一种全局或静态的状态。例如: 全局配…

【计算机网络】Tcp/IP五层协议,Udp报文组成,Udp与Tcp的区别

Tcp/IP五层协议 TCP/IP模型是计算机网络的核心协议之一,通常被分为五层,每一层都有其独特的功能和作用。以下是TCP/IP模型的五层协议的简要描述: 物理层:这一层涉及实际的物理连接,定义了硬件传输介质的特性&#xff…

利用Open3D GUI开发一款点云标注工具问题总结(一)

前言 需求:利用Open3D 开发一款用于点云标注的工具,即按照点云类别赋予不同颜色 实现效果如下:通过点击颜色面板的不同颜色可以进行颜色切换,在我们选择两个点后,点击Create Box可以创建一个轴对称框体,从…

web 0基础第二节 列表标签

1.有序列表 <!DOCTYPE html> <html lang"en"> <head> <meta charset"UTF-8"> <meta name"viewport" content"widthdevice-width, initial-scale1.0"> <title>有序列表 比较重要</title>…

windows使用vcpkg安装CGAL

1.1 安装 Vcpkg 第一步是vcpkg从https://github.com/microsoft/vcpkg克隆或下载。 C:\dev> git 克隆 https://github.com/microsoft/vcpkg C:\dev> cd vcpkg C:\dev\vcpkg>.\bootstrap-vcpkg.bat 1.2 使用 Vcpkg 安装 CGAL 默认情况下&#xff0c;vcpkg安装 32 位…

【三】【算法】P1007 独木桥,P1012 [NOIP1998 提高组] 拼数,P1019 [NOIP2000 提高组] 单词接龙

P1007 独木桥 独木桥 题目背景 战争已经进入到紧要时间。你是运输小队长&#xff0c;正在率领运输部队向前线运送物资。运输任务像做题一样的无聊。你希望找些刺激&#xff0c;于是命令你的士兵们到前方的一座独木桥上欣赏风景&#xff0c;而你留在桥下欣赏士兵们。士兵们十分愤…

探索Spring Boot在医疗病历B2B交互中的潜力

第2章 设计技术与开发环境 2.1 相关技术介绍 2.1.1 B/S模式分析 C/S模式主要由客户应用程序(Client)、服务器管理程序(Server)和中间件(middleware)三个部件组成。客户应用程序是系统中用户与数据组件交互。服务器程序负责系统资源&#xff0c;如管理信息数据库的有效管理&…

云上考场小程序+ssm论文源码调试讲解

2 关键技术简介 2.1 微信小程序 微信小程序&#xff0c;简称小程序&#xff0c;英文名Mini Program&#xff0c;是一种全新的连接用户与服务的方式&#xff0c;可以快速访问、快速传播&#xff0c;并具有良好的使用体验。 小程序的主要开发语言是JavaScript&#xff0c;它与…