学习进度报告【第二周】

news/2024/11/16 5:47:03/

总体而言这周没有荒废,学习了很多新东西。  

这周主要做的有:

机器学习博客地址:

  • [Python机器学习]鸢尾花分类 机器学习应用
  • [Python机器学习]机器学习概述
  • [Python]PyCharm中%matplotlib inline报错
  • [Python]scatter_matrix报错 module 'pandas' has no attribute 'scatter_matrix'

kettle学习博客地址:

  • [大数据技术]datax的安装以及使用
  • [大数据技术]Kettle初次连接MySQL数据库 报错问题 错误连接数据库 Error occured while trying to connect to the database Exception while loading class org.gjt.mm.mysql.Driver
  • [大数据技术]Kettle从CSV文件读取清洗后到MySQL中文乱码问题
  • [大数据技术]Kettle报OPTION SQL_SELECT_LIMIT=DEFAULT错误的解决办法
  • [大数据技术]Kettle对 前程无忧软件相关职位 进行数据清洗

网络爬虫博客地址:

  • [Python] 前程无忧招聘网爬取软件工程职位 网络爬虫 https://www.51job.com
  • [Python]爬取 游民星空网站 每周精选壁纸(1080高清壁纸) 网络爬虫

http://www.ppmy.cn/news/796666.html

相关文章

送书 | 《Python3爬虫实战——数据清洗、数据分析与可视化》

又到了每周三的送书时刻啦!今天给大家带来的是《Python3爬虫实战——数据清洗、数据分析与可视化》 (文末查看送书规则)

Python正则表达式03

1.提取省市全称 import repattern r^(.*?(?:省|自治区|维吾尔族自治区|壮族自治区|回族自治区))(.*?(?:市|州|盟)) file_names ["浙江省舟山市", "云南省西双版纳州", "新疆维吾尔族自治区伊犁州", "内蒙古自治区阿拉善盟",&quo…

Python自动化小技巧11——excel文件的文字内容筛选

上一期讲述了怎么讲多个excel多sheet表进行批量合并,本次案例就是来讲讲合并之后对数据进行清洗整理的过程,筛掉无用的数据。 这个案例中博主是处理文本,主要是各大平台上的新闻的文字。筛选就是把那些无用的主题的新闻给去掉,我…

写个python,爬行【游明星空】的壁纸(5)

前文摘要/本文内容: 好的,我们已经把爬虫的脚本写出来了,写完之后,我们去执行,发现,实际上,在很多细节上,它并不是很好,正所谓,先实现产品功能,再…

下载游民的壁纸

# -*- coding: utf-8 -*-""" http://www.gamersky.com/news/201309/297991.shtml """import urllib2 import urllib import re import string""" param url:壁纸首页 param begin:壁纸起始页 param end:壁纸终止页 ""&…

我调用第三方接口遇到的13大坑

前言 在实际工作中,我们经常需要在项目中调用第三方API接口,获取数据,或者上报数据,进行数据交换和通信。 那么,调用第三方API接口会遇到哪些问题?如何解决这些问题呢? 这篇文章就跟大家一起…

培训报名小程序报名列表页开发

目录 1 创建页面2 组件搭建3 设置URL参数4 设置筛选条件5 首页跳转6 最终的效果总结 这节我们来开发报名列表功能,先看原型 1 创建页面 功能要在页面上呈现,需要先创建页面。打开我们的培训报名小程序,在页面区,点击创建页面的…

以太网未识别的网络win10_Win10以太网未识别的网络怎么办

以络”解决方法Windows”按钮,从其运行”项以打开“运行”窗口(直接按WindowsR快捷打开)。从打开的“运行”窗口中,输入“cmd”并按回车即可进入MSDOS界面,如图所示:待打开“命令提示符”窗口后,输入命令“ping路由器内…