• 软件功能:此工具可以从网页、本地文件(可以批量提取文本文件、excel文件、word文件、pdf文件以及各种网页文件)、文本中提取邮箱、手机号码、电话号码、身份证号码、IP地址、网址等信息,可以一键提取三级页面,对于只有三级页面的网站,只需输入首页就可在线提取整个网站的手机号等信息。软件只能提取网页上公开的邮箱,网页上没有的邮箱提取不到,软件支持网站登录提取。
  • 下载地址:邮箱一键提取工具下载(winxp,win7,win8使用此版)   邮箱一键提取工具下载(win10使用此版)
  • 使用说明:
  • 软件下载后需要用解压缩软件把采集软件解压缩到你的硬盘,解压缩之后会生成9个文件和一个文件夹截图如下。文件:bdslcjonline.exe 是软件的可执行文件,双击此文件开始采集工作,文件用于从发采集到的数据,采集结束后可以打开此文件夹查询采集到的信息
  • 软件解压
  • 会员登陆:
  • 打开软件显示会员登录页面,如果您有搜收录网会员可以直接登录采集,如果您没有注册搜收录网会员,您可以先注册成为搜收录网会员然后登陆采集,普通会员使用采集功能会受到很多限制,升级VIP会员后采集没有任何限制,你可以选择升级VIP会员然后登陆采集。如果您采集的网站限制采集,您可以使用拨号换IP的功能,自动更换IP采集,如果使用此功能您需要输入拨号名称、拨号账户、拨号密码,点击测试拨号信息,如果拨号成功点击保存拨号信息,如果拨号失败,您可以点击断开拨号连接,重新测试拨号。
  • 会员登录
  • 网页批量采集:
  • 网页批量采集功能可以一次从一批网址从提取你需要的信息,首先复制或者从文本文件中导入你要采集的网址,选择你要采集的信息类型,网址、电话、手机、邮箱、身份证、邮箱等,可以一次选择多个,采集后会在outputfile文件夹中生成不同的文件,打开这些文件就可以查看采集到的信息了。
  • 采集范围可以选择采集站内信息或采集外链信息或者全部采集,如果选择了采集站内信息网站上的外部链接就不再抓取,如果选择了采集外链就不会继续抓取站内链接,如果选择全部采集则站内站外链接都会被抓取。
  • 采集网页深度可以选择一级二级或三级,选择采集一级则只抓取你输入网址上的信息,选择采集二级,除了抓取你输入网址的信息之外还会继续抓取你输入网址信息里链接的内容,采集三级就是在采集一级二级的基础上继续抓取二级页面上的链接内容。
  • 选择只采集网址,软件只会采集输出网页上的网址,选择采集网址和标题则会同时采集网页上的链接网址和链接标题。
  • 如果您需要对采集的网页进行过滤,可以设置采集网址包含、采集网址不包含、链接标题包含、链接标题不包含,采集网址包含就是说软件至抓取链接中包含此内容的网址,采集网址不包含就是说软件至抓取链接中不包含此内容的网址,链接标题包含就是说软件只抓取链接标题包含此内容的网址,链接标题不包含就是说软件只抓取链接标题不包含此内容的网址。
  • 采集间隔时间是软件抓取网页的频率,就是抓取之后等待一段时候后再去抓取下一个网页,间隔时间单位是毫秒,默认设置是100毫秒等于0.1秒,如果网站限制了采集则间隔时间需要设置的大一些,可以设置3000或5000毫秒,具体根据不同的网站设置,如果网站不限制采集,此数据就不用修改。账号密码登陆的网站采集一定不能太频繁,如果采集太频繁可能导致账号被封。
  • 超时时长设置是对于一个网站,如果超过了规定时间没有采集到任何有用的信息,则舍弃该网站采集下一个网站,默认设置是5分钟,这个时间不宜设置的太短。
  • 自动拨号换IP是针对于有些网站限制同IP访问频率,如果同一个IP访问次数太多有些网站就会返回出错网页或验证。拨号换IP需要在登陆页面填写拨号名称,拨号账号及拨号密码,如果您的电脑是拨号上网的可以直接填写如果您的电脑不能拨号上网,则需要购买拨号VPS服务器,把软件传到服务器上拨号换IP采集。
  • 输出来源网址用于您需要知道采集的信息来源的情况,如果不选择则只会输出采集到的信息,如果选择了除了输出信息之外还会输出信息所在的网页网址。
  • 如果您需要采集网站的信息需要登录才能查看而且您也有登录账号,您可以选择登录采集,步骤是点击登录采集切换到网页登陆页面,输入网站登录页面地址点击打开网页,在下面打开的网站登录页面中输入账号密码登陆,登陆成功后等待5秒钟点击登录完成继续采集按钮回到采集页面继续采集,这样就可以采集需要登录才能查看的网页信息了。
  • 网页批量一键提取
  • 网页分页采集:
  • 网页分页采集可以设置采集区域也就是设置采集网页中的一部分区域,具体方法是打开网页源码,找到需要采集部分的开始和结束标记分别粘贴到采集区域开始标记和采集区域结束标记,注意开始和结束标记必须是网页源码中唯一的标记,如果你对HTML网页源码不熟悉,可以不用填写,不会影响采集的结果。网址模板用于批量生成分页网址,例如要采集一个列表页,总共有100页,你可以把要采集的一个列表页复制到网址模板,把其中的页数用{page}替换,设置采集1页至100页,然后点击生成网址,就可以自动生成100个列表页网址了,扩展字段用于采集一些其他信息,比如姓名,性别地址等,扩展字段的采集需要用正则表达式,这个需要一定的专业知识才行。分页采集其他部分的设置和网页批量采集类似。
  • 网页分页提取
  • 按关键词提取:
  • 此功能主要用于按关键词在互联网搜索相关信息,并采集相关信息中的手机、电话等您需要的资源。采集到的数据多少跟您导入的关键词数量与质量有关,导入的词越多采集到的信息就越多。
  • 按关键词提取
  • 本地文件提取:
  • 采集本地文件功能用于采集电脑文件里的信息,可以采集文本文件、excel文件、word文件、pfd文件以及各种网页文件,点击选择采集文件可以一次导入多个需要采集的文件,提取信息包含和提取信息不包含选项用于过滤提取到的信息,采集完成后点击查看采集结果,可以查询采集到的信息。
  • 本地文件提取
  • 文本信息提取:
  • 文本内容采集用于采集一段文本中的信息,把您需要采集的文本复制到左侧的文本框点击一键提取即可提取您需要的信息。
  • 文本信息提取
  • 网站登录提取:
  • 如果您需要采集网站的信息需要登录才能查看而且您也有登录账号,您可以选择登录采集,步骤是点击登录采集切换到网页登陆页面,输入网站登录页面地址点击打开网页,在下面打开的网站登录页面中输入账号密码登陆,登陆成功后等待5秒钟点击登录完成继续采集按钮回到采集页面继续采集,这样就可以采集需要登录才能查看的网页信息了。
  • 登录提取设置
  • 如需一键提取网页上的邮箱等信息请下载此软件,如有问题请联系QQ:743851322