在线
客服

发布
需求

天盟
APP

天盟APP下载

关注
微信

微信扫一扫访问
顶部

[微信开发] Python从某信某公众号内的数据查询程序中爬取查询结果

YWvw***发布 已通过手机认证
任务编号:5190789 悬赏任务3000元 悬赏任务 : 按雇主需求进行任务后提交稿件,被采纳后即获得佣金。

Python从某信某公众号内的数据查询程序中爬取查询结果

距截止: 任务已圆满完成 雇主已托管赏金:3000
雇主发布需求 雇主托管佣金 服务商投稿 雇主开始选稿 任务完成

任务大厅共需1个合格投稿 | 每稿将获得3000| 每人交稿次数不限 可多次任务

投诉举报 联系Ta 我来承接 已有1 个投稿 | 已采纳1 稿 | 拒绝0 稿 | 目前中标名额已满

任务需求:
概要描述:从某信某公众号内的数据查询程序中,爬取查询结果,并将结果存储在本地的文件中。
详细需求:
通过访问固定的网络地址,使用合法的账号密码登录,通过验证后进入查询系统。
查询系统中的功能非常简单,通过在本地Excel文件中读取一条32位字符串,录入到查询框中,点击查询按钮,获开查询结果。查询结果有三种,第一种为获得4行14个字符串的数据,第二种为获得12行14个字符串的数据,第三种为查询错误。本地Excel文件中有多行数据,需要爬虫程序不断的循环查询,直到Excel文件中最后一行数据为止。
将正确的查询结果放置在新生成的excel文件中,分为两列存放,一列为32位字符串,第二列为查询后得到的14个字符串;将错误的结果放置在txt文件中,只需将32位字符串记录在此即可。
项目情况:
1、该公众号所连接的数据查询网站属于上游供应链厂家系统,不存在爬取数据违规处罚的情况。
2、数据查询网站使用.net开发,可通过定义浏览器header,脱离某信运行。
3、数据查询网站中有302跳转和doPostBack方法,如开发者对该方式爬取数据没有经验,不建议接单。
4、查询数据时需要间隔2秒,否则会出现频繁查询的情况。

使用道具 举报

全部参与1

已采纳

使用道具 举报

发新帖
国内首家创新型IT技术需求众包服务平台,软件需求就上天盟网! 立即登录 立即注册