1.爬虫解析字符串2.提取文档内容

embedded/2024/11/28 4:38:27/
package day02;
import org.apache.commons.io.FileUtils;
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.junit.Test;
import java.io.File;
import java.io.IOException;
public class jianxizfc {//    <!--jsoup解析工具所需依赖-->
//        <dependency>
//            <groupId>org.jsoup</groupId>
//            <artifactId>jsoup</artifactId>
//            <version>1.10.3</version>
//        </dependency>
//
//        <dependency>
//            <groupId>junit</groupId>
//            <artifactId>junit</artifactId>
//            <version>4.12</version>
//            <scope>test</scope>
//        </dependency>
//
//        <dependency>
//            <groupId>commons-io</groupId>
//            <artifactId>commons-io</artifactId>
//            <version>2.6</version>
//        </dependency>
//
//        <dependency>
//            <groupId>org.apache.commons</groupId>
//            <artifactId>commons-lang3</artifactId>
//            <version>3.7</version>
//        </dependency>
//@Testpublic void qidong() throws IOException {//使用工具类读取文件,获取字符串String s = FileUtils.readFileToString(new File("C:\\Users\\LX\\Desktop\\新建文本文档.txt"), "utf-8");//解析字符串Document doc = Jsoup.parse(s);//按照标签筛选需要的内容String title = doc.getElementsByTag("title").first().text();System.out.println(title);
}@Testpublic void qidong1() throws IOException {//按照文件解析文件字符Document parse = Jsoup.parse(new File("C:\\Users\\LX\\Desktop\\新建文本文档.txt"), "utf-8");//解析字符串String title = parse.getElementsByTag( "title").first().text();//按照标签筛选需要的内容System.out.println(title);}
}

http://www.ppmy.cn/embedded/5257.html

相关文章

基于Python的招聘信息爬虫系统的设计与实现

基于Python的招聘信息爬虫系统的设计与实现 Design and Implementation of a Python-based Recruitment Information Crawler System 完整下载链接:基于Python的招聘信息爬虫系统的设计与实现 文章目录 基于Python的招聘信息爬虫系统的设计与实现摘要第一章 绪论1.1 研究背景…

使用MATLAB进行ARIMA模型预测的基本示例

ARIMA模型是一种常用的时间序列预测模型&#xff0c;全称为自回归积分滑动平均模型&#xff08;Autoregressive Integrated Moving Average model&#xff09;。下面是一个使用MATLAB进行ARIMA模型预测的基本示例。请注意&#xff0c;这是一个基础示例&#xff0c;实际应用中可…

强化游戏产业发展 新疆文化和旅游厅代表赴粤交流考察

易采游戏网4月17日消息&#xff0c;近日为深化游戏游艺设备市场准入、内容监管、技术创新等方面的工作经验交流&#xff0c;促进游戏游艺产业健康发展&#xff0c;近日&#xff0c;新疆维吾尔自治区文化和旅游厅代表一行到访广州番禺当地游戏游艺企业考察交流。广东省文化和旅游…

【面试八股文之C/C++】

1.define和const的区别&#xff1f; &#xff08;1&#xff09;define 是预处理指令&#xff0c;用于创建符号常量。const 是 C 和 C 的关键字&#xff0c;用于创建具有常量值的变量&#xff0c;本质是只读变量。 &#xff08;2&#xff09;define 在预处理阶段执行。const 在…

GRAF: Generative Radiance Fields for 3D-Aware Image Synthesis

GRAF: Generative Radiance Fieldsfor 3D-Aware Image Synthesis&#xff08;基于产生辐射场的三维图像合成&#xff09; 思维导图&#xff1a;https://blog.csdn.net/weixin_53765004/article/details/137944206?csdn_share_tail%7B%22type%22%3A%22blog%22%2C%22rType%22%3…

Appium的使用:混合APP切换上下文

网上别的文章说要把移动端的webview设置成调试模式,才能看到下图信息。 但我这里是直接在Android Studio新建了一个空白活动,然后放的webview控件,写的webview代码,直接部署到模拟器上,在确定adb可以连接到模拟器后,在桌面浏览器输入chrome://inspect/#devices后就可以看…

机器学习和深度学习--李宏毅(笔记与个人理解)Day17

Day 17Convolutional Neyral Network (CNN) 卷积神经网络一般都用在image 上面比较多一些&#xff0c;所以课程的例子大多数也都是image Image Classification the same size how about for pc? 这里对于tensor 张量这个概念&#xff0c;我还是比较奇怪&#xff0c;在我认为一…

在React类组件中引用在其他文件中创建的zustand状态store

如果想在React类组件中引用在其他文件中创建的zustand状态store&#xff0c;您可以将创建的store导出并在类组件中引入使用。您可以在其他文件中创建zustand store&#xff0c;并将其导出&#xff0c;然后在类组件中引入并使用该store。 以下是一个示例&#xff0c;展示了如何…