javascript提取联通个人信息和通话记录的代码

news/2024/11/28 3:46:03/

由于一些巨大的困难,一些后端爬虫改成了前端爬虫。

 

前端爬虫是只有js语言,后端爬虫有python java nodejs php这些语言。

 

前端爬虫有window.document对象,在浏览器端的爬虫即使是二次发送ajax,也不需要学后端爬虫来构造一堆请求头,特别是困难的cookie token。最为重要的还是天然的突破了ip限制。

 

提取个人信息,直接使用页面渲染后的结构:

/*** Created by xy49476 on 2018/1/9.*//*
* http://iservice.10010.com/e4/index_server.html
* 提取个人信息
* */function  extractPersonalInfomation() {var loginName = document.querySelector('#personalInfo td').innerText;var  userLevel = document.querySelector('#font').innerText;var userName = document.querySelector('div.data_basic_c.ly_gr_zl > dl:nth-child(1) > dd').innerText;var sex = document.querySelector('div.data_basic_c.ly_gr_zl > dl:nth-child(3) > dd').innerText;var idNo = document.querySelector('div.data_basic_c.ly_gr_zl > dl:nth-child(5) > dd').innerText;var contactPhone = document.querySelector('div.data_basic_c.ly_gr_zl > dl:nth-child(9) > dd').innerText;var contactAddress =  document.querySelector('div.data_basic_c.ly_gr_zl > dl:nth-child(11) > dd').innerText;var package = document.querySelector('#packageInfocontext > div.add_main > div > dl:nth-child(1) > dd').innerText;var chargeType = document.querySelector('#packageInfocontext > div.add_main > div > dl:nth-child(3) > dd').innerText;var currentStatus = document.querySelector('#numberContext > div.data_basic_c2 > div.data_basic_c2_l > dl:nth-child(1) > dd').innerText;var netInDate = document.querySelector('#numberContext > div.data_basic_c2 > div.data_basic_c2_r > dl:nth-child(1) > dd').innerText;var billingAccount = document.querySelector('#numberContext > div.data_basic_c2 > div.data_basic_c2_l > dl:nth-child(3) > dd').innerText;var brand = document.querySelector('#numberContext > div.data_basic_c2 > div.data_basic_c2_r > dl:nth-child(2) > dd').innerText;var communicatelevel = document.querySelector('#numberContext > div.data_basic_c2 > div.data_basic_c2_l > dl:nth-child(4) > dd').innerText;var pukCode = document.querySelector('#numberContext > div.data_basic_c2 > div.data_basic_c2_r > dl:nth-child(3) > dd').innerText;var contractName = document.querySelector('#contractPeriod > div.ly_gr_l2 > dl:nth-child(1) > dd').innerText;var effectiveTime =  document.querySelector('#contractPeriod > div.ly_gr_l2 > dl:nth-child(3) > dd').innerText;var uneffectiveTime =  document.querySelector('#contractPeriod > div.ly_gr_l2 > dl:nth-child(5) > dd').innerText;personalObj = {loginName:loginName,userLevel:userLevel,userName:userName,sex:sex,idNo:idNo,contactPhone:contactPhone,contactAddress:contactAddress,package:package,chargeType:chargeType,currentStatus:currentStatus,netInDate:netInDate,billingAccount:billingAccount,brand:brand,communicatelevel:communicatelevel,pukCode:pukCode,contractName:contractName,effectiveTime:effectiveTime,uneffectiveTime:uneffectiveTime};return '{"personalInfo":' + JSON.stringify(personalObj) + '}';}//extractPersonalInfomation();

 

 

提取通话记录,这里和上面不同,发送了ajax来获取json,按月份按分页获取通话记录:

/*** Created by xy49476 on 2018/1/10.*/
/*http://iservice.10010.com/e4/query/bill/call_dan-iframe.html?menuCode=000100030001
提取通话记录
*
* */function  extractCallRecordsOuter() {function getNear6Montgh(){var near6MonthArray = [];for (var i=0;i<6;i++){var d = new Date();d.setMonth(d.getMonth() - i);var yy1 = d.getFullYear();var mm1 = d.getMonth() + 1;//因为getMonth()返回值是 0(一月) 到 11(十二月) 之间的一个整数。所以要给其加1var dd1 = d.getDate();// if (mm1 < 10) {//     mm1 = '0' + mm1;// }if (dd1 < 10) {dd1 = '0' + dd1;}console.info(yy1 + '-' + mm1 + '-' + dd1);near6MonthArray.push([yy1,mm1]);}return near6MonthArray;}//按照年月,获取一个月有多少天 mGetDate(2004,2)function mGetDate(year, month){var d = new Date(year, month, 0);return d.getDate();}var callRecordsArray = [];function  extractCallRecords() {//历史账单var near6MonthArray = getNear6Montgh();for (i of near6MonthArray) {var dates = mGetDate(i[0], i[1]);var mm1 = i[1];if (mm1 < 10) {mm1 = '0' + mm1;}var yearMonth = i[0] + '' + mm1;var callRecordsObj = {};callRecordsObj.pagelist = [];callRecordsObj.yearMonth = yearMonth;function extractCallRecordByPage(page) {var page = page || 1;var url = 'http://iservice.10010.com/e3/static/query/callDetail?_=1515561593328&accessURL=http://iservice.10010.com/e4/query/bill/call_dan-iframe.html?menuCode=000100030001&menuid=000100030001';var data = {pageNo: page,pageSize: 200,beginDate: yearMonth + '01',endDate: yearMonth + dates};console.debug(data);var htmlObj = $.ajax({type: 'POST',url: url,data: data,async: false    //一定要设置这个,否则异步的还没得到返回结果就执行到下面去了,代码 一定会报错});var htmlStr = htmlObj.responseText;console.debug('htmlStr:',htmlStr);var callRecordsRawObj = JSON.parse(htmlStr);callRecordsObj.pagelist = callRecordsObj.pagelist.concat(callRecordsRawObj.pagelist);var totalpage = callRecordsRawObj.totalpage;if (page < totalpage) {extractCallRecordByPage(page + 1);    //回调自己}}extractCallRecordByPage();callRecordsArray.push(callRecordsObj);}callRecordsInfoObj = {callRecordsInfo:callRecordsArray};return JSON.stringify(callRecordsInfoObj);}return extractCallRecords();
}
//extractCallRecordsOuter();

  

为了一个脚本一个函数,在最外层套了一个函数。

有没有很像js闭包,但这不是闭包。

最后三行是

    return extractCallRecords();
}
extractCallRecordsOuter();

如果改成下面,
 return extractCallRecords;
}
extractCallRecordsOuter()();

这样就是js之闭包了。

 

 

 

前端爬虫时候,使用jqury选择器或者document的queryselector方法就能使用css3选择器的语法了。比getElementByxx能更精确的提取某些元素。

使用jquery时候,如果被爬页面没有引入jquery库,需要先在document注入jquery地址或者完整的执行一遍jquery代码。


http://www.ppmy.cn/news/853822.html

相关文章

android通话记录手机号码归属地,mui 获取手机通话记录

export default { onLoad() { this.log(); // this.msg(); // this.concat(); }, methods: { log() { // 获取通话记录 plus.android.requestPermissions( [android.permission.READ_CALL_LOG, android.permission.WRITE_CALL_LOG, android.permission.READ_SMS], function(e) …

怎么看手机计算机的记录表,教您如何查看6个月前的通话记录,包括中国联通手机!...

如何查询6个月前的呼叫历史是Internet上的常见问题,因为无论是移动,联通还是电信,您都只能查询最近6个月的呼叫历史以及呼叫顺序6个月前的查询方法?答案是肯定的,因为无论是Apple手机还是Android手机,所有通话记录都保存在手机的文件中. 通过将其导出到计算机,我们可以直…

小程序主包超1.5MB分包处理流程优化方案

"subPackages": [// 分包1 {"root": "src, // 根目录"pages": [{"path": "views/business/index", // 页面路径"name": "business_index","aliasPath": "/business/index",&…

lotus lotus-miner version 1.23.2 boostd version 1.7.4

boost Web UI settings Libp2p Peer ID 查看ID 设置 Peer ID lotus-miner actor set-peer-id <Peer ID>发布矿工 lotus-miner actor set-addrs /ip4/公网IP/tcp/端口lotus 查询报价报错 lotus client query-ask <矿工> ERROR: bls signature failed to verify…

一个简单的网页制作期末作业,学生个人html静态网页制作成品代码

&#x1f389;精彩专栏推荐 &#x1f4ad;文末获取联系 ✍️ 作者简介: 一个热爱把逻辑思维转变为代码的技术博主 &#x1f482; 作者主页: 【主页——&#x1f680;获取更多优质源码】 &#x1f393; web前端期末大作业&#xff1a; 【&#x1f4da;毕设项目精品实战案例 (10…

再夺AI专业全球冠军!清华力压CMU夺得CSRankings高校AI领域第一

新智元报道 来源&#xff1a;CSRankings 每次CSRankings更新&#xff0c;都会引发舆论大哗。 今年这个让大家关注的排名终于又更新了&#xff01;全球院校计算机科学领域实力排名开源项目CSRankings&#xff0c;更新了2020-2021年的最新数据。 最新排名显示&#xff1a; AI&am…

夕夕博士的视频观后笔记集合~

b站有一位浙大的博士叫罗夕夕。男神拍的视频都特别的好&#xff0c;下面我就来做一下男神罗西西博士视频的笔记专辑。 【干货】焦虑不如改变&#xff0c;研究生如何逐步自律&#xff0c;浙大博士谈经验 这期视频主要是针对想要在科研方面提高自制力的&#xff0c;如果你有其他…

原来我们看到的世界地图竟这样震撼!多年的地理白学了...

▲ 点击查看 几乎每个家庭都会有两张地图&#xff1a;一张世界地图&#xff0c;一张中国地图。 薄薄的两张纸&#xff0c;蕴藏着让每个人学会“看世界”的磅礴力量。 哈佛上一任校长&#xff0c;也是300多年来唯一一位女校长德鲁吉尔平福斯特&#xff08;Drew Gilpin Faust&…