天美果冻传媒,夜夜操天天,麻豆国内精品久久久久久

字符

. ——匹配任意字符 e.g: abc. 結果: abcd,abcx,abc9;
[] ——匹配括號中任意一個字符 e.g: [abc]d 結果：ad,cd,1d；
- ——[-]中表示范圍 e.g: [A-Za-z0-9]；
^ ——[^]中表示除括號中的任意字符 e.g：[^xy]a 結果：aa,da,不能為xa,ya；

數量限定

？ ——前面單元匹配0或1次；
+ ——前面單元匹配1或多次；
* ——前面單元匹配0或多次；
{,} ——顯示個數上下線；e.g ： ip地址——[0-9]{1,3}.[0-9]{1,3}.[0-9]{1,3}.[0-9]{1,3}；

其他

\ ——轉義字符;
| ——條件或;
() ——組成單元如果字符串本身有括號"[(] aaa. [)]" ;

方法

				?

									//參數正則字符串，返回值*Regexp

									str := regexp.MustCompile(string) 

									//參數要查找的數據，查找次數-1為全局，返回值二維數組，查找出的字符串+正則字符串

									var result [][]string = str.FindAllStringSubmatch(data, -1)

爬蟲

爬取博客園所有文章閱讀量，評論，推薦；

				?

									package main

									import (

									 "fmt"

									 "io"

									 "net/http"

									 "regexp"

									 "strconv"

									)

									var readCount int = 0

									var commentCount int = 0

									var diggCount int = 0

									//http讀取網頁數據寫入result返回

									func HttpGet(url string) (result string, err error) {

									 resp, err1 := http.Get(url)

									 if err1 != nil {

									  err = err1

									  return

									 }

									 defer resp.Body.Close()

									 buf := make([]byte, 4096)

									 for {

									  n, err2 := resp.Body.Read(buf)

									  //fmt.Println(url)

									  if n == 0 {

									   break

									  }

									  if err2 != nil && err2 != io.EOF {

									   err = err2

									   return

									  }

									  result += string(buf[:n])

									 }

									 return result, err

									}

									//橫向縱向爬取文章標題數據，并累計數值

									func SpiderPageDB(index int, page chan int) {

									 url := "https://www.cnblogs.com/littleperilla/default.html?page=" + strconv.Itoa(index)

									 result, err := HttpGet(url)

									 if err != nil {

									  fmt.Println("HttpGet err:", err)

									  return

									 }

									 str := regexp.MustCompile("post-view-count\">閱讀[(](?s:(.*?))[)]</span>")

									 alls := str.FindAllStringSubmatch(result, -1)

									 for _, j := range alls {

									  temp, err := strconv.Atoi(j[1])

									  if err != nil {

									   fmt.Println("string2int err:", err)

									  }

									  readCount += temp

									 }

									 str = regexp.MustCompile("post-comment-count\">評論[(](?s:(.*?))[)]</span>")

									 alls = str.FindAllStringSubmatch(result, -1)

									 for _, j := range alls {

									  temp, err := strconv.Atoi(j[1])

									  if err != nil {

									   fmt.Println("string2int err:", err)

									  }

									  commentCount += temp

									 }

									 str = regexp.MustCompile("post-digg-count\">推薦[(](?s:(.*?))[)]</span>")

									 alls = str.FindAllStringSubmatch(result, -1)

									 for _, j := range alls {

									  temp, err := strconv.Atoi(j[1])

									  if err != nil {

									   fmt.Println("string2int err:", err)

									  }

									  diggCount += temp

									 }

									 page <- index

									}

									//主要工作方法

									func working(start, end int) {

									 fmt.Printf("正在從%d到%d爬取中...\n", start, end)

									 //channel通知主線程是否所有go都結束

									 page := make(chan int)

									 //多線程go程同時爬取

									 for i := start; i <= end; i++ {

									  go SpiderPageDB(i, page)

									 }

									 for i := start; i <= end; i++ {

									  fmt.Printf("拉取到%d頁\n", <-page)

									 }

									}

									//入口函數

									func main() {

									 //輸入爬取的起始頁

									 var start, end int

									 fmt.Print("startPos:")

									 fmt.Scan(&start)

									 fmt.Print("endPos:")

									 fmt.Scan(&end)

									 working(start, end)

									 fmt.Println("閱讀:", readCount)

									 fmt.Println("評論:", commentCount)

									 fmt.Println("推薦:", diggCount)

									}

Golang爬蟲及正則表達式的實現示例

補充：正則表達式加golang爬蟲爬取經典案例豆瓣top250

100

101

102

103

									package main

									import (

									    "fmt"

									    "io"

									    "net/http"

									    "os"

									    "regexp"

									    "strconv"

									)

									func savToFile(index int, filmName, filmScore [][]string) {

									    f, err := os.Create("第" + strconv.Itoa(index) + "頁.txt")

									    if err != nil {

									        fmt.Println("os create err", err)

									        return

									    }

									    defer f.Close()

									    // 查出有多少條

									    n := len(filmName)

									    // 先寫抬頭 名稱     評分

									    f.WriteString("電影名稱" + "\t\t\t" + "評分" + "\n")

									    for i := 0; i < n; i++ {

									        f.WriteString(filmName[i][1] + "\t\t\t" + filmScore[i][1] + "\n")

									    }

									}

									func main() {

									    var start, end int

									    fmt.Print("請輸入要爬取的起始頁")

									    fmt.Scan(&start)

									    fmt.Print("請輸入要爬取的終止頁")

									    fmt.Scan(&end)

									    working(start, end)

									}

									func working(start int, end int) {

									    fmt.Printf("正在爬取%d到%d頁", start, end)

									    for i := start; i <= end; i++ {

									        SpiderPage(i)

									    }

									}

									// 爬取一個豆瓣頁面數據信息保存到文檔

									func SpiderPage(index int) {

									    // 獲取url

									    url := "https://movie.douban.com/top250?start=" + strconv.Itoa((index-1)*25) + "&filter="

									    // 爬取url對應頁面

									    result, err := HttpGet(url)

									    if err != nil {

									        fmt.Println("httpget err", err)

									        return

									    }

									    //fmt.Println("result=", result)

									    // 解析，編譯正則表達式  ---電影名稱

									    ret := regexp.MustCompile(`<img width="100" id="codetool">



	到此這篇關于Golang爬蟲及正則表達式的實現示例的文章就介紹到這了,更多相關Golang爬蟲及正則表達式 內容請搜索服務器之家以前的文章或繼續瀏覽下面的相關文章希望大家以后多多支持服務器之家！

	原文鏈接：https://www.cnblogs.com/littleperilla/p/15721635.html

			
					    
			
			
			
				
			
		
		
			
				 
				爬蟲
				
				正則表達式
				
				golang
				
			
			
				
			
		
		
			
				延伸 · 閱讀
			
			
				2022-03-11Python爬蟲實戰之爬取某寶男裝信息
2022-03-10Python全棧之正則表達式
2022-03-07Python 超簡潔且詳細爬取西瓜視頻案例
2022-03-06CentOS中的正則表達式
2022-03-06詳解Android過濾emoji表情正則表達式
2022-03-05linux系統用戶管理與grep正則表達式示例教程

			
		
		
		
		
			
				
			
		
		
			
				精彩推薦
			
		
		
			
				
					
				
				Golang
				
					Golang中Bit數組的實現方式
					
						這篇文章主要介紹了Golang中Bit數組的實現方式，具有很好的參考價值，希望對大家有所幫助。一起跟隨小編過來看看吧...
					
					
						天易獨尊11682021-06-09
					
				
				
Golang
				
					go語言制作端口掃描器
					
						本文給大家分享的是使用go語言編寫的TCP端口掃描器，可以選擇IP范圍，掃描的端口，以及多線程，有需要的小伙伴可以參考下。
...
					
					
						腳本之家3642020-04-25
					
				
				
Golang
				
					go日志系統logrus顯示文件和行號的操作
					
						這篇文章主要介紹了go日志系統logrus顯示文件和行號的操作，具有很好的參考價值，希望對大家有所幫助。一起跟隨小編過來看看吧...
					
					
						SmallQinYan12302021-02-02
					
				
				
Golang
				
					golang json.Marshal 特殊html字符被轉義的解決方法
					
						今天小編就為大家分享一篇golang json.Marshal 特殊html字符被轉義的解決方法，具有很好的參考價值，希望對大家有所幫助。一起跟隨小編過來看看吧
...
					
					
						李浩的life12792020-05-27
					
				
				
Golang
				
					golang的httpserver優雅重啟方法詳解
					
						這篇文章主要給大家介紹了關于golang的httpserver優雅重啟的相關資料，文中通過示例代碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值，...
					
					
						helight2992020-05-14
					
				
				
Golang
				
					golang如何使用struct的tag屬性的詳細介紹
					
						這篇文章主要介紹了golang如何使用struct的tag屬性的詳細介紹，從例子說起，小編覺得挺不錯的，現在分享給大家，也給大家做個參考。一起跟隨小編過來看...
					
					
						Go語言中文網11352020-05-21
					
				
				
Golang
				
					Golang通脈之數據類型詳情
					
						這篇文章主要介紹了Golang通脈之數據類型，在編程語言中標識符就是定義的具有某種意義的詞，比如變量名、常量名、函數名等等，Go語言中標識符允許由...
					
					
						羌4272021-11-24
					
				
				
Golang
				
					golang 通過ssh代理連接mysql的操作
					
						這篇文章主要介紹了golang 通過ssh代理連接mysql的操作，具有很好的參考價值，希望對大家有所幫助。一起跟隨小編過來看看吧...
					
					
						a165861639710342021-03-08
					
				
				

			
		
	
	
最近更新
聊聊一個用 Go 實現的有限狀態機
Go語言錯誤處理異常捕獲+異常拋出
Go語言單元測試超詳細解析
Go語言線程安全之互斥鎖與讀寫鎖
Go語言中的通道channel詳情
編輯推薦
Golang HTTP 服務平滑重啟及升級的思路
 2圖文詳解go語言反射實現原理
2020-06-04
 3go語言開發環境安裝及第一個go程序(推薦)
2020-06-03
4在Visual Studio Code中配置GO開發環境的詳細教程
2020-05-05
5Win7環境下搭建Go開發環境(基于VSCode編輯器)
2020-05-05
6Go語言使用HTTP包創建WEB服務器的方法
2020-04-30
7Go語言eclipse環境搭建圖文教程
2020-04-30
8Go語言實現簡單的一個靜態WEB服務器
2020-04-10
9Go語言實現的一個簡單Web服務器
2020-04-09
10Golang 內存模型詳解（一）
2019-11-28
閱讀排行
1 Goland激活碼破解永久版及安裝詳細教程(親測
2 在 Golang 中如何快速判斷字符串是否在一個數
3 Golang是什么意思？Golang有什么用？
 4 使用go語言解析xml的實現方法(必看篇)
5 Go語言string，int，int64 ,float之間類型轉換方法
6 Go語言獲取數組長度的方法
7 詳解Golang開啟http服務的三種方式
8 goland2020.2.x永久激活碼破解詳細教程親測可用
9 go浮點數轉字符串保留小數點后N位的完美解決
10 GO接收GET/POST參數及發送GET/POST請求的實例詳解
熱門標簽
 gosublime 　  指針類型 　  new() 　  make() 　  并發模型 　  切片 　  靜態WEB服務器 　  端口掃描器 　  Go語言入門教程 　  基礎語 　  Slices 　  Maps 　  Golang編程 　  panic 　  接受者類型 　  嵌入類型 　  Slice 　  Golang教程 　  Golang項目 　  內存模型 　  開發環境搭建 　  大小端判斷 　  代碼組織結構 　  復合類型 　  GOPATH 　  工作目錄 　  實例 　  struct類型 　  并發技術 　  buffered 　 




© 2019-2023 腳本之家 | 服務器之家(www.ythuaji.com.cn)旗下站點 版權所有關于我們聯系我們版權申明網站地圖


	







感谢您访问我们的网站，您可能还对以下资源感兴趣：
一区二区三区在线|一区二区三区亚洲视频|一区二区三区亚洲|一区二区三区午夜|一区二区三区四区在线视频|一区二区三区四区在线免费观看









主站蜘蛛池模板：
国产欧美日韩图片一区二区
|
jizz农村野外jizz农民
|
艾秋麻豆果冻剧传媒在线播放
|
国产果冻传媒
|
草莓在线|
日本一片免费观看高清完整
|
日本日日黄
|
xvideoscom极品肌肉警察
|
亚洲gogo人体大胆西西安徽
|
日本精品久久久久久久久免费
|
男人捅女人动漫
|
free性丰满hd性欧美厨房
|
国语精彩对白2021
|
蜜桃麻豆
|
亚洲系列在线
|
女人狂吮男人命根gif视频
|
俺去俺去啦最新官网在线
|
农夫成人网|
成成人看片在线
|
欧美一区二区三区在线观看免费
|
污污在线免费观看
|
国产良心大作白丝精厕
|
亚洲第一天堂无码专区
|
国产免费丝袜调教视频
|
国产免费一区不卡在线
|
亚洲精品国产精麻豆久久99
|
午夜勾魂曲
|
高跟丝袜麻麻求我调教
|
视频网站入口在线看
|
国产精品视频免费视频
|
四虎网站
|
超h高h肉h文武侠
|
成人免费影院
|
天堂色|
91精品综合久久久久久五月天
|
gogort99人体专业网站
|
免费一级特黄特色大片
|
农村妇女野战bbxxx
|
亚洲AV无码专区国产乱码网站
|
国产区小视频
|
丫鬟粗大狠狠贯穿h
|

<pre id="6646u"></pre>