如何学习pythonn菜鸟怎么爬天眼查类型的企业信息

11 条评论分享收藏感谢收起抬头望天,脚踏实地
Python爬虫---爬取天眼查数据(下)tkinter和exe打包
  接上篇。
  爬虫程序的核心,爬虫天眼查的公司信息类TianYanCha已经完成了,并且验证可以工作,但是给不是专业方面的人用的话,还要安装Python解释器,还没有界面是挺麻烦的,于是就想写一个简单的界面,然后打包成可执行程序给女票用。
tkinter界面
  由于我的界面要求很简单,只是输入两个文件路径,一个实时输出信息的文本框,于是没有选择其他的Python界面扩展,只是选择Python的事实界面库—tkinter。
  界面如下:
class Application(tk.Frame):
def __init__(self, master=None):
tk.Frame.__init__(self, master)
self.pack()
self.createWidgets()
def __del__(self):
print('del tianyanche')
root.destroy
def createWidgets(self):
self.labelDest = tk.Label(self)
self.labelDest["text"] = '来源路径:'
self.labelDest.grid(row=0, column=0)
self.contentDest = tk.StringVar()
self.contentDest.set('./work/all.txt')
self.entryDest = tk.Entry(self)
self.entryDest["textvariable"] = self.contentDest
self.entryDest.grid(row=0, column=1)
self.labelSuc = tk.Label(self)
self.labelSuc["text"] = '成功路径:'
self.labelSuc.grid(row=1, column=0)
self.contentSuc = tk.StringVar()
self.contentSuc.set('./work/suc.txt')
self.entrySuc = tk.Entry(self)
self.entrySuc["textvariable"] = self.contentSuc
self.entrySuc.grid(row=1, column=1)
self.labelFail = tk.Label(self)
self.labelFail["text"] = '失败路径:'
self.labelFail.grid(row=2, column=0)
self.contentFail = tk.StringVar()
self.contentFail.set('./work/fail.txt')
self.entryFail = tk.Entry(self)
self.entryFail["textvariable"] = self.contentFail
self.entryFail.grid(row=2, column=1)
self.buttonStart = tk.Button(self, text = '开始')
self.buttonStart['command'] = self.start
self.buttonStart['fg'] = 'green'
self.buttonStart.grid(row=3, column=0)
self.quit = tk.Button(self, text="停止", fg="red",
command=self.quit)
self.quit.grid(row=3, column=1)
self.text = ScrolledText(self)
self.text.grid(row=4, columnspan=2)
def start(self):
self.running = True
self.text.insert('end', '来源:' + self.contentDest.get() + "\r\n")
self.text.insert('end', '成功:' + self.contentSuc.get() + "\r\n")
self.text.insert('end', '失败:' + self.contentFail.get() + "\r\n")
self.tianyancha = TianYanCha.TianYanCha(self.contentSuc.get(), self.contentFail.get())
self.tianyancha.setOutput(self.text)
self.td = threading.Thread(target=self.startThread)
self.td.setDaemon(True)
self.td.start()
def quit(self):
self.running = False
del self.tianyancha
print('quit')
def startThread(self):
self.text.delete(0.0, 'end')
file = open(self.contentDest.get())
for line in file.readlines():
if self.running == True:
self.tianyancha.getCompanyByName(line.strip('\n'))
print('停止')
以上就是界面部分,效果如下图所示:
  Python的常用exe打包有:PyInstaller、py2exe等。我直接选择了PyInstaller。
PyInstaller安装:pip install PyInstaller。目前的最新版本3.2。
PyInstaller打包命令:pyinstaller -F -i snail.ico Application.py。
命令释义:
指定打包后只生成一个exe格式的文件
–onedir 创建一个目录,包含exe文件,但会依赖很多文件(默认选项)
–console, –nowindowed 使用控制台,无界面(默认)
–windowed, –noconsole 使用窗口,无控制台
添加搜索路径,让其找到对应的库
改变生成程序的icon图标
以上,此爬虫程序终于完成了,可以上交领导啦^~^
没想到竟然有同学需要完整的程序,我只好上传到github了,传送门:
2018我破解了天眼查和企查查和工商企业大数据爬虫系统
记录一次利用python调用chrome爬取天眼查网址工商信息的过程
(python)GUI简单的tkinter小应用
破解爬虫天眼查+几千万的数据大数据架构+破解100页数据限制 爬虫实战经验分享
使用tkinter和pyinstaller开发一个GUI爬虫程序
没有更多推荐了,有没有大佬知道爬取天眼查网站的utm该怎么破【python吧】_百度贴吧
&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&签到排名:今日本吧第个签到,本吧因你更精彩,明天继续来努力!
本吧签到人数:0成为超级会员,使用一键签到本月漏签0次!成为超级会员,赠送8张补签卡连续签到:天&&累计签到:天超级会员单次开通12个月以上,赠送连续签到卡3张
关注:191,598贴子:
有没有大佬知道爬取天眼查网站的utm该怎么破收藏
有没有大佬知道爬取天眼查网站的utm该怎么破
登录百度帐号53分享收藏文章被以下专栏收录&>&爬虫从入门到精通,内含如何应对反爬的独家经验.知乎,拉勾,天眼查
爬虫从入门到精通,内含如何应对反爬的独家经验.知乎,拉勾,天眼查
上传大小:36B
scrapy+selenium+tor+privoxy ,python3.完美获取知乎,拉勾,天眼查整站内容,包含我对天眼查爬取过程中的一些经验和想法
综合评分:1
{%username%}回复{%com_username%}{%time%}\
/*点击出现回复框*/
$(".respond_btn").on("click", function (e) {
$(this).parents(".rightLi").children(".respond_box").show();
e.stopPropagation();
$(".cancel_res").on("click", function (e) {
$(this).parents(".res_b").siblings(".res_area").val("");
$(this).parents(".respond_box").hide();
e.stopPropagation();
/*删除评论*/
$(".del_comment_c").on("click", function (e) {
var id = $(e.target).attr("id");
$.getJSON('/index.php/comment/do_invalid/' + id,
function (data) {
if (data.succ == 1) {
$(e.target).parents(".conLi").remove();
alert(data.msg);
$(".res_btn").click(function (e) {
var parentWrap = $(this).parents(".respond_box"),
q = parentWrap.find(".form1").serializeArray(),
resStr = $.trim(parentWrap.find(".res_area_r").val());
console.log(q);
//var res_area_r = $.trim($(".res_area_r").val());
if (resStr == '') {
$(".res_text").css({color: "red"});
$.post("/index.php/comment/do_comment_reply/", q,
function (data) {
if (data.succ == 1) {
var $target,
evt = e || window.
$target = $(evt.target || evt.srcElement);
var $dd = $target.parents('dd');
var $wrapReply = $dd.find('.respond_box');
console.log($wrapReply);
//var mess = $(".res_area_r").val();
var mess = resS
var str = str.replace(/{%header%}/g, data.header)
.replace(/{%href%}/g, 'http://' + window.location.host + '/user/' + data.username)
.replace(/{%username%}/g, data.username)
.replace(/{%com_username%}/g, data.com_username)
.replace(/{%time%}/g, data.time)
.replace(/{%id%}/g, data.id)
.replace(/{%mess%}/g, mess);
$dd.after(str);
$(".respond_box").hide();
$(".res_area_r").val("");
$(".res_area").val("");
$wrapReply.hide();
alert(data.msg);
}, "json");
/*删除回复*/
$(".rightLi").on("click", '.del_comment_r', function (e) {
var id = $(e.target).attr("id");
$.getJSON('/index.php/comment/do_comment_del/' + id,
function (data) {
if (data.succ == 1) {
$(e.target).parent().parent().parent().parent().parent().remove();
$(e.target).parents('.res_list').remove()
alert(data.msg);
//填充回复
function KeyP(v) {
var parentWrap = $(v).parents(".respond_box");
parentWrap.find(".res_area_r").val($.trim(parentWrap.find(".res_area").val()));
评论共有1条
就给了一个github网址,拉勾还没有
zjsnowman回复github_
兄弟,你要啥啊,代码都给你了啊.具体说明博客中也写的很详细.
综合评分:
积分/C币:5
VIP会员动态
热门资源标签
CSDN下载频道资源及相关规则调整公告V11.10
下载频道用户反馈专区
下载频道积分规则调整V1710.18
spring mvc+mybatis+mysql+maven+bootstrap 整合实现增删查改简单实例.zip
资源所需积分/C币
当前拥有积分
当前拥有C币
输入下载码
为了良好体验,不建议使用迅雷下载
爬虫从入门到精通,内含如何应对反爬的独家经验.知乎,拉勾,天眼查
会员到期时间:
剩余下载个数:
剩余积分:0
为了良好体验,不建议使用迅雷下载
积分不足!
资源所需积分/C币
当前拥有积分
您可以选择
程序员的必选
绿色安全资源
资源所需积分/C币
当前拥有积分
当前拥有C币
为了良好体验,不建议使用迅雷下载
资源所需积分/C币
当前拥有积分
当前拥有C币
为了良好体验,不建议使用迅雷下载
资源所需积分/C币
当前拥有积分
当前拥有C币
您的积分不足,将扣除 10 C币
为了良好体验,不建议使用迅雷下载
无法举报自己的资源
你当前的下载分为234。
你还不是VIP会员
开通VIP会员权限,免积分下载
你下载资源过于频繁,请输入验证码
您因违反CSDN下载频道规则而被锁定帐户,如有疑问,请联络:!
若举报审核通过,可返还被扣除的积分
被举报人:
请选择类型
资源无法下载 ( 404页面、下载失败、资源本身问题)
资源无法使用 (文件损坏、内容缺失、题文不符)
侵犯版权资源 (侵犯公司或个人版权)
虚假资源 (恶意欺诈、刷分资源)
含色情、危害国家安全内容
含广告、木马病毒资源
*投诉人姓名:
*投诉人联系方式:
*版权证明:
*详细原因:
爬虫从入门到精通,内含如何应对反爬的独家经验.知乎,拉勾,天眼查

我要回帖

更多关于 如何学习python 的文章

 

随机推荐