一区二区三区在线-一区二区三区亚洲视频-一区二区三区亚洲-一区二区三区午夜-一区二区三区四区在线视频-一区二区三区四区在线免费观看

腳本之家,腳本語言編程技術(shù)及教程分享平臺(tái)!
分類導(dǎo)航

Python|VBS|Ruby|Lua|perl|VBA|Golang|PowerShell|Erlang|autoit|Dos|bat|

服務(wù)器之家 - 腳本之家 - Python - Python自動(dòng)化爬取天眼查數(shù)據(jù)的實(shí)現(xiàn)

Python自動(dòng)化爬取天眼查數(shù)據(jù)的實(shí)現(xiàn)

2021-11-30 10:29end for time Python

本文將結(jié)合實(shí)例代碼,介紹Python自動(dòng)化爬取天眼查數(shù)據(jù)的實(shí)現(xiàn),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧

首先要注冊一個(gè)賬號(hào)密碼,通過賬號(hào)密碼登錄,并且滑塊驗(yàn)證,自動(dòng)輸入搜索關(guān)鍵詞,進(jìn)行跳轉(zhuǎn)翻頁爬取數(shù)據(jù),并保存到Excel文件中。

代碼運(yùn)行時(shí),滑塊驗(yàn)證經(jīng)常不通過,被吃掉,但是發(fā)現(xiàn)打包成exe運(yùn)行沒有這個(gè)問題,100%成功登錄。如果大家知道這個(gè)問題麻煩請與我分享,謝謝!

Python自動(dòng)化爬取天眼查數(shù)據(jù)的實(shí)現(xiàn)

廢話不多說直接上代碼

?
        1
        2
        3
        4
        5
        6
        7
        8
        9
        10
        11
        12
        13
        14
        15
        16
        17
        18
        19
        20
        21
        22
        23
        24
        25
        26
        27
        28
        29
        30
        31
        32
        33
        34
        35
        36
        37
        38
        39
        40
        41
        42
        43
        44
        45
        46
        47
        48
        49
        50
        51
        52
        53
        54
        55
        56
        57
        58
        59
        60
        61
        62
        63
        64
        65
        66
        67
        68
        69
        70
        71
        72
        73
        74
        75
        76
        77
        78
        79
        80
        81
        82
        83
        84
        85
        86
        87
        88
        89
        90
        91
        92
        93
        94
        95
        96
        97
        98
        99
        100
        101
        102
        103
        104
        105
        106
        107
        108
        109
        110
        111
        112
        113
        114
        115
        116
        117
        118
        119
        120
        121
        122
        123
        124
        125
        126
        127
        128
        129
        130
        131
        132
        133
        134
        135
        136
        137
        138
        139
        140
        141
        142
        143
        144
        145
        146
        147
        148
        149
        150
        151
        152
        153
        154
        155
        156
        157
        158
        159
        160
        161
        162
        163
        164
        165
        166
        167
        168
        169
        170
        171
        172
        173
        174
        175
        176
        177
        178
        179
        180
        181
        182
        183
        184
        185
        186
        187
        188
        189
        190
        191
        192
        193
        194
        195
        196
        197
        198
        199
        200
        201
        202
        203
        204
        205
        206
        207
        208
        209
        210
        211
        212
        213
        214
        215
        216
        217
        218
        219
        220
        221
        222
        223
        224
        225
        226
        227
        228
        229
        230
        231
        232
        233
        234
        235
        236
        237
        238
        239
        240
        241
        242
        243
        244
        245
        246
        247
        248
        249
        250
        251
        252
        253
        254
        255
        256
        257
        258
        259
        260
        261
        262
        263
        264
        265
        266
        267
        268
        269
        270
        # coding=utf-8
        from selenium import webdriver
        import time
        from PIL import Image, ImageGrab
        from io import BytesIO
        from selenium.webdriver.common.action_chains import ActionChains
        import os
        import sys
        import re
        import xlwt
        import urllib
        import datetime
         
        '''
        用于天眼查自動(dòng)登錄,解決滑塊驗(yàn)證問題
        '''
         
        # 獲取項(xiàng)目根目錄
        def app_path():
            if hasattr(sys, 'frozen'):
                return os.path.dirname(os.path.dirname(os.path.dirname(sys.executable))) #使用pyinstaller打包后的exe目錄
            return os.path.dirname(__file__)
         
        app_path = app_path()
         
        ready_list = []
         
        #設(shè)置表格樣式
        def set_style(name,height,bold=False):
            style = xlwt.XFStyle()
            font = xlwt.Font()
            font.name = name
            # font.bold = bold
            font.color_index = 4
            font.height = height
            style.font = font
            return style
         
        # 寫excel
        f = xlwt.Workbook()
        sheet1 = f.add_sheet('企查查數(shù)據(jù)',cell_overwrite_ok=True)
        row0 = ["企業(yè)名稱","法定代表人","注冊資本","成立日期","電話","郵箱","地址"]
        for i in range(0, len(row0)):
            sheet1.write(0, i, row0[i], set_style('Times New Roman', 220, True))
         
        # 寫列
        def write_col(data, row, col):
            for i in range(0,len(data)):
                sheet1.write(row,col,data[i],set_style('Times New Roman',220,True))
                row = row + 1
         
        def parse_save_data(all_list):
            row = 1
            for data in all_list:
                # 公司名稱
                name_list = re.findall(r'<div class="info">(.*?)</div>',data)
                print(name_list)
         
                # 標(biāo)簽
                tag_list = re.findall(r'<div class="tag-list">(.*)</div><div class="info row text-ellipsis">', data)
                tags = []
                for list in tag_list:
                    tag = re.findall(r'<div class="tag-common -primary -new">(.*?)</div>', list)
                    tags.append(tag)
                # print(tags)
         
                # 法定代表人
                legal_list = re.findall(r'<a id="codetool">

        打包成exe(注意site-packages要換成自己python包的目錄)

        ?
        1
        pyinstaller main.py -p D:\Anaconda3\Lib\site-packages

        最終運(yùn)行dist目錄下的exe

        Python自動(dòng)化爬取天眼查數(shù)據(jù)的實(shí)現(xiàn)

        注意事項(xiàng)

        由于天眼查沒有開會(huì)員只能查看到4頁內(nèi)容,所以需要開會(huì)員,這個(gè)想要繞過就需要另外去研究,畢竟是要充錢付費(fèi),破解也沒那么簡單

        到此這篇關(guān)于Python自動(dòng)化爬取天眼查數(shù)據(jù)的文章就介紹到這了,更多相關(guān)Python自動(dòng)化爬取天眼查數(shù)據(jù)內(nèi)容請搜索服務(wù)器之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持服務(wù)器之家!

        原文鏈接:https://blog.csdn.net/qq_36767214/article/details/117843296

        延伸 · 閱讀

        精彩推薦
        主站蜘蛛池模板: 牛人国产偷窥女洗浴在线观看 | 日本海鸣馆 | 国产白白视频在线观看2 | yellow在线| 黄网在线观看免费网站台湾swag | 日韩免费视频一区 | 欧美日韩一区二区三区在线观看 | les在宿舍吃她奶 | 天天综合天天色 | 亚洲热在线视频 | 暗卫调教女主肉高h | 日本理论片中文在线观看2828 | 欧美极品摘花过程 | 热99这里有精品综合久久 | 欧美成人香蕉在线观看 | 四虎在线观看 | 蜜桃久久久亚洲精品成人 | 好吊操这里有精品 | 二次元美女脱裤子让男人桶爽 | 乌克兰肥熟 | 久草在在线免视频在线观看 | 麻豆自拍| 香蕉eeww99国产精选播放 | 美女的让男生桶 | 亚洲国产精品日韩高清秒播 | 美女福利视频网站 | 日本久本草精品 | 鬼吹灯之天星术免费观看 | 亚洲男人的天堂成人 | 国产在线观看精品香蕉v区 国产在线观看a | 亚洲成色爱我久久 | 亚欧毛片基地国产毛片基地 | 五月最新商场女厕所高跟嘘嘘 | 免费标准高清看机机桶机机 | 亚洲国产精品无码中文字幕 | 黑人巨茎大战欧美白妇 | 亚洲成人视屏 | 2020年最新国产精品视频免费 | youjizzxxx69日本| 国产精品久久久久毛片 | 新影音先锋男人色资源网 |
        • <table id="aaemq"></table>
          <abbr id="aaemq"></abbr>
              <table id="aaemq"><center id="aaemq"></center></table>
            • <samp id="aaemq"><button id="aaemq"></button></samp>