python爬虫笔记(一)

ops/2025/3/18 21:27:08/

文章目录

    • html
      • 基础
        • 标签和下划线
        • 无序列表和有序列表
        • 表格
          • 加边框
      • html的属性
        • a标签(网站)
          • target属性
          • 换行线和水平分割线
        • 图片
          • 设置宽高width,height
      • html区块——块元素与行内元素
        • 块元素与行内元素
        • 块元素举例
          • 行内元素举例
      • 表单
        • from标签
          • type属性
          • placeholder属性
          • value属性
          • span标签的应用
          • radio选项
        • label标签
          • for属性
          • checkbox多选
          • submit属性
        • from标签
        • css
        • css三种导入方式
        • 选择器
        • 元素选择器、类选择器、ID选择器、通用选择器
        • 子元素选择器(嵌套),后代选择器
        • 后代选择器示例
        • 伪类选择器
      • css属性

在这里插入图片描述

在这里插入图片描述

python">import requests
response = requests.get( "http://books.toscrape.com/")
if response.ok:print(response.text)
else:print("请求失败")

有User-Agent

python">import requests
headers = {
"User-Agent":"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/116.0.0.0 Safari/537.36 Edg/116.0.1938.62"
}
response = requests.get("https://movie.douban.com/top250",headers=headers)
print(response.status_code)
python">from bs4 import BeautifulSoup
import requests
headers = {"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) Chrome/116.0.0.0"
}
response = requests.get("http://books.toscrape.com/", headers=headers)
content = response.text
soup = BeautifulSoup(content,"html.parser")
all_prices = soup.find_all("p",attrs={"class": "price_color"})
# for price in all_prices:
#     print(price)
for price in all_prices:# print(price.text)# print(price)# print(price.string)print(price.string[2:])
python">from bs4 import BeautifulSoup
import requests
headers = {"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) Chrome/116.0.0.0"
}
for start_num in range(0,250,25):response = requests.get(f"https://movie.douban.com/top250?start={start_num}", headers=headers)html = response.textsoup = BeautifulSoup(html,"html.parser")all_titles = soup.findAll( "span",attrs={"class":"title"})for title in all_titles:title_string=title.stringif "/" not in title_string:print(title_string)

在这里插入图片描述

html

基础

标签和下划线

在这里插入图片描述
在这里插入图片描述

无序列表和有序列表

在这里插入图片描述
在这里插入图片描述

表格

在这里插入图片描述
在这里插入图片描述

加边框

在这里插入图片描述

html的属性

在这里插入图片描述

a标签(网站)

在这里插入图片描述
在这里插入图片描述

target属性

在这里插入图片描述

在这里插入图片描述
1.self链接在当前窗口打开
2.blank链接在新窗口打开
3.parent链接在父窗口打开
4.top链接在顶层窗口打开

换行线和水平分割线

在这里插入图片描述
在这里插入图片描述
换行是br,水平分割线是hr

图片

在这里插入图片描述

设置宽高width,height

html区块——块元素与行内元素

块元素与行内元素

在这里插入图片描述

在这里插入图片描述

块元素举例

用于结构或布局
-------------------------------------------------------------a
在这里插入图片描述
在这里插入图片描述

------------------------------------------------------------------------a

行内元素举例

用于内联样式化文本,给文本的一部分用样式或标记
在这里插入图片描述

在这里插入图片描述

表单

from标签
type属性

input标签,type属性规定了input的类型

在这里插入图片描述

python">w3cschool.cn/html5/html5-input.html

可以在网站输入内容
在这里插入图片描述
在这里插入图片描述

placeholder属性

在这里插入图片描述
在这里插入图片描述

value属性

自动填写“请输入内容”
在这里插入图片描述
在这里插入图片描述

span标签的应用

在这里插入图片描述
在这里插入图片描述

radio选项

在这里插入图片描述
在这里插入图片描述
加入gender只能选一个,不加可以全部勾选
在这里插入图片描述

在这里插入图片描述

label标签
for属性

for一般与id绑定

password属性
在这里插入图片描述
在这里插入图片描述

checkbox多选

在这里插入图片描述
在这里插入图片描述

submit属性

在这里插入图片描述
在这里插入图片描述

python"><!DOCTYPE html>
<html lang="en">
<head><meta charset="UTF-8"><meta name="viewport" content="width=html, initial-scale=1.0"><title>html练习</title>
</head>
<body><form><label>用户名:</label><input type="text" placeholder="请输入用户名"><br><br><label for="pwd">密码:</label><input type="password" id="pwd" placeholder="请输入密码"><br><br><label>性别:</label><input type="radio" name="gender"><input type="radio" name="gender"><input type="radio" name="gender">其他<br><br><label>爱好:</label><input type="checkbox" name="hobby">唱歌<input type="checkbox" name="hobby">跳舞<input type="checkbox" name="hobby">RAP<input type="checkbox" name="hobby">篮球<br><br><input type="submit"></form><form action="#"></form>
</body>
</html>

#需要为服务器,即api

from标签

提交后具体数据存到哪里
就是from中action属性

css

在这里插入图片描述

python"><!DOCTYPE html>
<html>
<head><style>p {color: blue; /* 将所有 price_color 类的文本改为蓝色 */font-size: 16px;}</style>
</head>
<body><p>这是一个应用css样式的文本</p>  
</body>
</html>
css三种导入方式

在这里插入图片描述

python"><!DOCTYPE html>
<html lang="en">
<head><meta charset="UTF-8"><meta name="viewport" content="width=html, initial-scale=1.0"><title>html练习</title><!-- <link rel="stylesheet" href="./style.css"  --><style>p {color: blue; /* 将所有 p 标签的文本改为蓝色 */font-size: 16px;}h2 {color: green;}</style>
</head>
<body><p>这是一个应用css样式的文本</p>  <h1 style="color: red;">这是一个一级标题使用内联样式</h1><h2>这是一个二级标题,应用外部样式</h2><h3>这是一个三级标题,应用外部样式</h3>
</body>
</html>
选择器

在这里插入图片描述
在这里插入图片描述

元素选择器、类选择器、ID选择器、通用选择器
python"><!DOCTYPE html>
<html lang="en">
<head><meta charset="UTF-8"><meta name="viewport" content="width=device-width, initial-scale=1.0"><title>Document</title><style>h2{color:aqua;}  /* 元素选择器 */.highlight{background-color: yellow;}#header{font-size: 55px;}        /* id选择器 */*{font-family:'Franklin Gothic Medium', 'Arial Narrow', Arial, sans-serif;}/* 通用选择器 */</style> 
</head> 
<body><h1>不同类型的css选择器</h1><h2>这是一个元素选择器示例</h2><h3 class="highlight">这是一个类选择器示例</h3> <h3>这是另一个类选择器示例</h3><h4 id="header">这是一个id选择器示例 </h4></body>
</html>

在这里插入图片描述

子元素选择器(嵌套),后代选择器
python"><!DOCTYPE html>
<html lang="en">
<head><meta charset="UTF-8"><meta name="viewport" content="width=device-width, initial-scale=1.0"><title>Document</title><style>.father>.son{color:yellowgreen;}/* 子元素选择器 */</style> 
</head> 
<body>

在这里插入图片描述

后代选择器示例
python"><!DOCTYPE html>
<html lang="en">
<head><meta charset="UTF-8"><meta name="viewport" content="width=device-width, initial-scale=1.0"><title>Document</title><style>#header{font-size: 55px;}        /* id选择器 */.father>.son{color:yellowgreen;}/* 子元素选择器 */</style> 
</head> 
<body><div class="father"><p class="son">这是一个子元素选择器示例</p>
</div>
<div><p class="grandson">这是一个后代选择器示例</p>
</div>
</body>
</html>

在这里插入图片描述

后代包含子代,子代不包含孙子代,之所以后代选择器每变色是英文grandson不是子代

伪类选择器
python"><!DOCTYPE html>
<html lang="en">
<head><meta charset="UTF-8"><meta name="viewport" content="width=device-width, initial-scale=1.0"><title>Document</title><style>#header{font-size: 55px;}        /* id选择器 */#element:hover{background-color: purple;}</style> 
</head> 
<body><h3 id="element">这是一个伪类选择器示例</h3></body>
</html>

在这里插入图片描述
鼠标悬浮背景颜色会变

css属性

background-color
font-size
font-family
font-weight
在这里插入图片描述
菜鸟教程网站

runoob.com/cssref/css-reference.html#font

在这里插入图片描述
在这里插入图片描述


http://www.ppmy.cn/ops/166873.html

相关文章

ImGui 学习笔记(五) —— 字体文件加载问题

ImGui 加载字体文件的函数似乎存在编码问题&#xff0c;这一点可能跟源文件的编码也有关系&#xff0c;我目前源文件编码是 UTF-16。 当参数中包含中文字符时&#xff0c;ImGui 内部将字符转换为宽字符字符集时候&#xff0c;采用的 MultiByteToWideChar API 参数不太对&#…

Java 的 CopyOnWriteArrayList 和 Collections.synchronizedList 有什么区别?分别有什么优缺点?

CopyOnWriteArrayList 问题:什么是 CopyOnWriteArrayList? 解答: CopyOnWriteArrayList 是 Java 并发包 (java.util.concurrent) 提供的一种 线程安全 的 List 实现,它的核心特性是 写时复制(Copy-On-Write)。即,每当执行修改操作(如 add()、set()、remove())时,都…

CSS中z-index使用详情

定位层级 1.定位元素的显示层级比普通元素高,无论什么定位,显示层级都是一样的; 2.如果位置发生重叠,默认情况是:后面的元素,会显示在前面元素之上; 3.可以通过CSS属性z-index调整元素的显示层级; 4.z-index的属性值是数字,没有单位,值越大显示层级越高; 5.只有定位的元素…

上下文微调(Contextual Fine-Tuning, CFT)提高大型语言模型(LLMs)在特定领域的学习和推理能力

大型语言模型(LLMs)在开放领域任务中表现出色,但在快速演变的专业领域(如医学、金融)中面临挑战: 知识更新难题:传统指令微调(Instruction Fine-Tuning, IFT)依赖显式指令,难以适应动态知识。灾难性遗忘:持续预训练(Continued Pretraining, CPT)可能导致模型遗忘已…

WPF未来展望:紧跟技术发展趋势,探索新的可能性

WPF未来展望&#xff1a;紧跟技术发展趋势&#xff0c;探索新的可能性 一、前言二、WPF 与.NET 技术的融合发展2.1 拥抱.NET Core2.2 利用.NET 5 及后续版本的新特性 三、WPF 在新兴技术领域的应用拓展3.1 与云计算的结合3.2 融入物联网生态 四、WPF 在用户体验和设计方面的创新…

密码学研究热点

一、后量子密码学 抗量子算法研究 开发能够抵抗量子计算机攻击的加密算法&#xff0c;如基于格的密码学&#xff08;LWE、NTRU&#xff09;、基于同源的密码学&#xff08;Isogeny&#xff09;和基于编码理论的密码学。 标准化进程 NIST等机构正推动后量子密码算法的标准化…

审批工作流系统xFlow

WorkFlow-审批流程系统 该项目为完全开源免费项目 可用于学习或搭建初始化审批流程系统 希望有用的小伙伴记得点个免费的star gitee仓库地址 仿钉钉飞书工作审批流系统 介绍 前端技术栈: vue3 ts vite arcodesign eslint 后端技术栈:springbootspring mvc mybatis mavenmysq…

android.widget包介绍

android.widget 是 Android 开发中用于构建用户界面&#xff08;UI&#xff09;的核心包之一。它包含了大量的 UI 控件&#xff08;如按钮、文本框、列表等&#xff09;&#xff0c;这些控件通常被称为“小部件”&#xff08;Widget&#xff09;。android.widget 包中的类大多继…