Python识别屏幕题目并模拟做题

news/2024/11/27 23:44:53/

前言 

马上就要过年了,有许多小伙伴们本本还没拿到,还在苦苦刷题,一直及格不了,现在,我们用Python模拟做题,看看效果。

c574d5a937014c7692cb3cda53d652a1.gif

 

环境使用

  • python 3.9
  • pycharm

模块使用

  • requests
  • re
  • selenium
  • 谷歌驱动
import reimport requestsfrom selenium import webdriver

模块介绍

  •  requests

requests简介:使用requests可以模拟浏览器的请求,比起之前用的urllib,requests模块的api更加便捷(本质就是封装了urllib3)

  • re

re又名正则表达式,是一种小型语言,其作用范围为字符串,内嵌在python中,通过调用re模块实现,其底层通过C语言编写的匹配法则进行匹配

作用目的:通过编写的匹配规则对字符串进行模糊匹配,比字符串内置方法更为强大,字符串内置方法只能进行精准匹配

  • selenium

之前,我们爬虫是模拟浏览器,但始终不是用的浏览器,但今天我们要说的是另一种爬虫方式,这次不是模拟浏览器,而是用程序去控制浏览器进行一些列操作,也就是selenium。selenium是python的一个第三方库,对外提供的接口可以操控浏览器,比如说输入、点击,跳转,下拉等动作。

  在使用selenium模块之前要做两件事,一是安装selenium模块,可以用终端用pip,也可以在pycharm里的setting安装;二是我们需要下载一款浏览器驱动程序,下载的驱动程序要和浏览器的版本一致。

  • 谷歌驱动

1.下载网址

CNPM Binaries Mirror

2.文件安装(放置)位置
可以把这个文件理解成一个脚本入口。说它是安装,其实就是把下载的 chromedriver.exe 文件复制到相应的位置。

将文件复制到两个位置:1...\python\Scripts复制一份到安装Python的文件夹中的Scripts文件夹中;2.如果用的是Pycharm,再复制一份到..\python\site-packages\selenium\webdriver\chrome文件中。这个地址可以将鼠标放在Pycharm里面安装库的地方的相应库上就能看到。

代码实现

我们打开在线驾驶员考试科目一考试的网址。代码如下:

driver = webdriver.Chrome()driver.get('https://www.jsyks.com/kmy-mnks')

运行效果如下:

3079e65458874de492c4bca25ec41e28.png

 

 我们发现每道题目后面都有查看本题分析,点击进去之后,我们就可以看到这题答案,通过对比 分析发现,答案网址有一定的规律,只是后缀不一样,我们称之为该题的编号或者是答案id。后来我们又发现考试页面就有我们所需要的答案id。

 1e1f0f342ffb48eface503e2568ffb2c.png 

下面我们提取答案id。

# 获取答案idlis = driver.find_elements(By.CSS_SELECTOR, 'div.Exam ul.Content li')

 for循环遍历,获取li标签的c属性 get_attribute

for li in lis:answer_id = li.get_attribute('c')

接下来,我们开始拼接答案的网址。

answer_url = f'https://tiba.jsyks.com/Post/{answer_id}.htm'

我们获得网址之后,发起请求,获取数据,解析数据,获得我们想要的数据,使用正则表达式去匹配答案的内容。

html_data = requests.get(answer_url).textanswer = re.findall('<br/>答案:<u>(.*?)</u></h1><p>', html_data)[0]

我们请求之后,发现答案和我们题目的选项有细微的差别,对和正确,错和错误,我们是只是什么意思,但是机器不知道什么意思,所以需要我们转换数据。

    if answer == '错':answer = '错误'elif answer == '对':answer = '正确'

做完这些,就需要将选项和答案进行比较,首先是选项匹配:

bs = li.find_elements(By.CSS_SELECTOR, 'b')        

答案和选项比较:

for b in bs:choose = b.textif len(choose) > 2:choose = choose[0]if answer == choose:b.click()

到这里我们所有的题目就做完了,接下来是交卷。

driver.find_element(By.CSS_SELECTOR, '.btnJJ').click()

运行完代码,我们会发现我们获得了满分。

e5f44c443eca4aad9460c4363b39d923.png

玩归玩,闹归闹,还是要好好做题。

6adf31c8c5dd4e6a83314f4805b30bc1.jpg

 

 

 


http://www.ppmy.cn/news/10896.html

相关文章

Leetcode - 19 - 删除链表的倒数第 N 个结点

19. 删除链表的倒数第 N 个结点 题目描述 给你一个链表&#xff0c;删除链表的倒数第 n 个结点&#xff0c;并且返回链表的头结点。 示例1&#xff1a; 输入&#xff1a;head [1,2,3,4,5], n 2 输出&#xff1a;[1,2,3,5]示例 2&#xff1a; 输入&#xff1a;head [1],…

Django(14):分页查询

使用Django框架内置模块django.core.paginator中封装的Paginator类Page类进行分页功能实现。其中Paginator是分页器&#xff0c;从分页器中可以得到Page&#xff0c;即分页对象。源码如下&#xff1a; import collections.abc import inspect import warnings from math impor…

接口测试——postman和Jemter

接口测试——postman和Jemterpostmanpostman工作原理postman入门postman的基础用法postman的高级用法使用postman管理测试用例批量执行测试用例postman断言环境变量和全局变量postman关联postman请求前置脚本postman参数化及生成测试报告参数化与数据驱动postman生成测试报告je…

JDK并发编程Actomic和AQS详解

JDK并发编程Actomic和AQS详解1 Atomic系列优化加锁并发性能1.0 i和ActomicInteger之间的差别分析1.1 AtomicInteger中的CAS无锁化原理1.2 AtomicInteger源码剖析&#xff1a;仅限JDK内部使用的Unsafe类1.3 AtomicInteger源码剖析&#xff1a;无线重复循环以及CAS操作1.4 Atomic…

Kubernetes(k8s) 笔记总结(二)

提示&#xff1a;针对kubernetes的工作均衡学习。 文章目录1. Kubernetes 创建资源方式2. Kubernetes 操作NameSpace3. Kubernetes的 Pod应用3.1 Pod的 解释3.2 通过命令行来创建一个pod3.3 配置文件方式创建一个Pod3.4 dashboard 可视化操作Pod3.5 针对Pod的一些细节操作3.6 P…

基于 js 制作一个贪吃蛇小游戏

目录前言&#xff1a;项目效果展示&#xff1a;代码实现思路&#xff1a;使用方法&#xff1a;实现代码&#xff1a;总结&#xff1a;前言&#xff1a; 在工作学习之余玩一会游戏既能带来快乐&#xff0c;还能缓解生活压力&#xff0c;跟随此文一起制作一个小游戏吧。 描述&…

Java日期时间类

Java日期时间类Datenew Date()**获取当前系统时间**通过**指定毫秒数得到时间**format**指定日期格式**SimpleDateFormat的模式字母&#xff1a;parse()可以把**格式化的String转成对应Date**Calendar&#xff08;日历&#xff09;创建日期类对象获取日历对象的某个日历字段第三…

IPO合肥马郢计划:构筑美丽田园综合体上市

合肥市长丰县马郢社区曾经是省级贫困村&#xff0c;为了让这个原本相对落后美丽田园 上市拥有崭新的面貌。2017年至今实施美丽田园综合体、旅游扶贫等项目。马郢社区共有13个村民组、408户、1778人&#xff0c;全村建档立卡贫困户年人均收入仅2000多元。2015年&#xff0c;由杨…