按键精灵抓取窗口后台数据（伪装成浏览器采集网页数据）

好好愛伱 2023-07-24 17:29:54

收藏赞

大家好，我是公众号3分钟学堂的郭立员~

这两天群友接了一单定制脚本的活，采集500网的开奖数据，具体细节我没问，通过问我的问题，我猜猜采集的数据可能是这个：

按键精灵抓取窗口后台数据（伪装成浏览器采集网页数据）(1)

采集的目标网址：https://kaijiang.500.com/shtml/ssq/03001.shtml

遇到的问题是啥呢？

使用按键直接获取网页源码得到的结果是这样的：

TracePrint url.get("https://kaijiang.500.com/shtml/ssq/03001.shtml")

当前脚本第1行：<html> <head><title>301 Moved Permanently</title></head> <body bgcolor="white"> <center><h1>301 Moved Permanently</h1></center> <hr><center>nginx</center> </body> </html>

返回的结果是301重定向（并不是报错），无法获取到网页的html源码，我用浏览器自带的抓包调试工具看了一下，也没有跳转到别的网址，猜测是网页为了限制爬虫采集，做了一个假的跳转。

因为浏览器可以正常访问页面，所以想到的方法就是伪装成浏览器获取网页源码。

说是伪装，其实就是在http请求头里面加上User-Agent参数，很多做过抓包协议的人都懂的。

这个文章就这么一个知识点，直接上源码：

Import "shanhai.lua" Dim uri = "https://kaijiang.500.com/shtml/ssq/03001.shtml" Dim hader = "Mozilla/5.0 (Windows NT 6.1; Win64; x64) Apple WebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.77 Safari/537.36" Dim date1 = {"url":uri,"code":"gb2312", "cookie":"", "header":{"User-Agent":hader}} Dim login = Url.HttpPost(date1) TracePrint login Dim arr=shanhai.RegexFind(login,"<li class=""ball_.-"">(.-)</li>") For Each k In arr TracePrint k Next Dim haoma=shanhai.RegexFind(login,"出球顺序：.-<td>(.-)<") TracePrint haoma(0)

还有一点需要注意的，网站编码是GB2312，所以HttpPost命令的code需要修改一下，否则网页中汉字部分会出现乱码。

=正文完=

免责声明：本文仅代表文章作者的个人观点，与本站无关。其原创性、真实性以及文中陈述文字和内容未经本站证实，对本文以及其中全部或者部分内容文字的真实性、完整性和原创性本站不作任何保证或承诺，请读者仅作参考，并自行核实相关内容。

猜您喜欢

手机网络连接不上wifi怎么办（这几个技巧完美解决）

有时候明明WIFI有信号却连不上，是不是很无奈呢，有WIFI却不能连接比没有WIFI更让人痛苦。下面小编教大家如何解决这...

一阳指 2023-07-24 17:19:58
macbookpro重装电脑系统步骤（Macbook系统重装）

一、重启Mac 在重启Mac 后，按下键盘option command R ，如下图：直到等显示器上...

蓜芣仩濺亽 2023-07-24 17:18:28
win7打印机没有驱动怎么办（Win7系统打印机驱动为什么组合在一起了）

有同学反映打印组合在一起了，这种选择打印机不行，该怎么办了？接下来小编就告诉你！造成的原因: 你添加的驱动在同一一...

想我吱声丄 2023-07-24 17:03:19
怎样看淡一切与自己和解（震撼内心的）

芬兰导演6分钟视频《最后的编织》入选拉丁美洲最大动画节阿尼玛曼迪动画节，通过一个编织者的故事，寓意着生活中为各种欲望所操...

你妈对我笑 2023-07-24 17:57:28
第五人格基础人物技能玩法介绍（关于现行版本的修机位推荐）

第五人格：不忘初心方得密码机，庄园新晋修机好手也是不可多得的猥琐修机流的代言人，我本人。能修机绝不遛屠，能遛屠绝不救...

累了么 2023-07-24 17:02:41
剑侠世界3武当攻略超级详细（剑侠世界3全新门派丐帮技能首曝）

降龙惊天破，伏虎踏尘嚣。西山居剑侠情缘系列手游《剑侠世界3》年度资料片“丐世豪侠”11月23日上线，今日新门派丐帮技能视...

我愿你爱我 2023-07-24 17:15:08
为什么手机会卡顿的解决方法（手机卡顿的原因何在）

对于现在的智能手机，用久了经常会出现手机卡顿、运行速度缓慢、有时没反应等情况。手机为何会越用越卡?那么到底什么原因呢?这...

梅花情逝 2023-07-24 17:35:21

秒懂生活

按键精灵抓取窗口后台数据（伪装成浏览器采集网页数据）

猜您喜欢

手机网络连接不上wifi怎么办（这几个技巧完美解决）

macbookpro重装电脑系统步骤（Macbook系统重装）

win7打印机没有驱动怎么办（Win7系统打印机驱动为什么组合在一起了）

怎样看淡一切与自己和解（震撼内心的）

第五人格基础人物技能玩法介绍（关于现行版本的修机位推荐）

剑侠世界3武当攻略超级详细（剑侠世界3全新门派丐帮技能首曝）

为什么手机会卡顿的解决方法（手机卡顿的原因何在）

热门推荐

排行榜