使用Winista.Text.HtmlParser采集南京价格信息网

news/2024/11/24 6:05:13/

数据库:MySQL

平台:.net framework 2.0 (C#)

组建:Winista.Text.HtmlParser

演示页面:2013年3月7日南京市各区县农贸市场主副食品价格对比表  http://www.njprice.com/col71/col464/articleinfo.php?infoid=44181

2013年2月28日南京市各区县农贸市场主副食品价格对比表   http://www.njprice.com/col71/col464/articleinfo.php?infoid=44079

以及所有其他日期发布的《南京市各区县农贸市场主副食品价格对比表》

using System;
using System.Collections.Generic;
using System.Text;
using nanjing_price.WebUtility;
using Winista.Text.HtmlParser;
using Winista.Text.HtmlParser.Lex;
using Winista.Text.HtmlParser.Util;
using Winista.Text.HtmlParser.Tags;
using Winista.Text.HtmlParser.Filters;
using org.nutlab;namespace nanjing_price.Fuction
{class NanjingMain{string content;string urlStr;public NanjingMain(string url){this.urlStr = url;getContent();inputDB();}void getContent(){webUtility web = new webUtility();content = Tools.filterScript(web.getContent(urlStr));}void inputDB(){DateTime publishTime = new DateTime();good_price price = new good_price();Parser parser = Parser.CreateParser(Tools.filterTableAttribute(content.Replace(System.Environment.NewLine, "")), "gb2312");NodeFilter table = new TagNameFilter("table");INode Table = parser.Parse(table)[2].Children[3];parser = Parser.CreateParser(Table.ToHtml(), "gb2312");Table = parser.Parse(table)[3];parser = Parser.CreateParser(Table.ToHtml(), "gb2312");Table = parser.Parse(table)[2];Console.WriteLine(Table.ToHtml());INode tempTag = Table;TableTag tableTag = (TableTag)tempTag;//上面判断如果得到的第一个为table Winista.Text.HtmlParser.Tags.TableRow[] tr = tableTag.Rows;//得到该table所有的trTableColumn[] tc = tr[2].Columns;publishTime = Convert.ToDateTime(tc[0].ToPlainTextString().Trim().Substring(3));Console.WriteLine(publishTime);for (int i = 6; i < tr.Length; i++){tc = tr[i].Columns;for (int j = 3; j < tc.Length; j++){price.name = tc[0].ToPlainTextString().Trim();price.standard = tc[1].ToPlainTextString().Trim();price.unit = tc[2].ToPlainTextString().Trim();price.district_name = tr[4].Columns[j].ToPlainTextString().Trim();price.market_name = tr[5].Columns[j].ToPlainTextString().Trim();price.amount = tc[j].ToPlainTextString().Trim();price.publish_time = publishTime;price.get_time = System.DateTime.Now;price.get_url = urlStr;price.Add();}}}}
}

源代码下载: 点击下载

SVN: Google Code


http://www.ppmy.cn/news/430022.html

相关文章

南京财经大学管理系统中计算机应用实践考试,2021年南京财经大学自考管理系统中计算机应用实践试卷.doc...

文档介绍&#xff1a; 《管理系统中计算机应用》实践课 上机考试操作手册 Windows XP Visual FoxPro6.0环境 在D盘根目录下建立一个考生文件夹&#xff0c;考生文件夹名字为为准考证号考生姓名。比如某考生准考证号为&#xff0c;名字为王军&#xff0c;则该考生文件夹名字为“…

南京python的培训价格

Python编程语言的简单易学&#xff0c;就业方向多样性的特点吸引了大批新手程序员的选择。那么对于这些新手或者是零基础的人来说&#xff0c;怎么才能更快掌握python编程语言呢&#xff1f;选择培训是一种不错的方式。南京python培训班哪家好&#xff1f;怎么选择培训机构&…

南京软件测试女薪资2019,2019年第一扎!南京最新平均工资最新出炉,看完不敢过年!...

原标题&#xff1a;2019年第一扎&#xff01;南京最新平均工资最新出炉&#xff0c;看完不敢过年&#xff01; 今天&#xff0c;南妹要跟大家聊一个 非常伤感的话题 可以说是2019年第一扎心了 ▼ 2018年冬季求职平均工资出炉了 南京排在全国第六名&#xff0c;8048元 比上一季度…

南京出租车涨价了

本文于2006年7月1日发表在搜狐博客 南京出租车起步从8块涨到9块&#xff0c;但是记程器还是8块&#xff0c;司机自己收&#xff0c;感觉不太好。上海出租车调价的时候是分批进行的&#xff0c;谁调了表&#xff0c;谁涨价&#xff0c;不一刀切&#xff0c;就比较好。 个人感觉上…

南京最牛的互联网基本都在这了!

对于程序员来说&#xff0c;想要在南京留下也不是件很容易的事情&#xff0c;因为南京程序员的工作机会只能算一般吧&#xff0c;薪资水平这两年许多大公司选择在南京设立分部后带起来一些。 Part1工作机会 提一下哈&#xff0c;这里说的校招薪资都是常规招聘计划的薪资&#x…

苏州向左,南京向右

https://www.toutiao.com/a6703797696555123212/ 2019-06-18 17:18:52 2019 不忘初心 砥砺前行 如果一个时代&#xff0c;让你觉得不适、焦虑和充满危机&#xff0c;惶惶不可终日&#xff0c;这说明它是一个正在激变的大时代。正如吴晓波在跨年演讲上所说的&#xff1a;这个…

python数据分析培训南京_基于Python的南京二手房数据可视化分析

1 内容简介 首先通过爬虫采集链家网上所有南京二手房的房源数据,并对采集到的数据进行清洗;然后,对清洗后的数据进行可视化分析,探索隐藏在大量数据背后的规律;最后,采用一个聚类算法对所有二手房数据进行聚类分析,并根据聚类分析的结果,将这些房源大致分类,以对所有…

南京美食推荐

南京美食&#xff08;适合学生党&#xff09; 在南京呆了三年的学生党整理出了一些价格良心&#xff0c;东西又好吃的店跟大家分享 喵的锅日式小火锅 人均八十八元 在美团或者大众点评上搜一下就可以出来了 两个人点两个九十九元套餐的套餐完全够吃而且套餐里面的东西都是可…