如下所示:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
|
/** * 得到網頁中圖片的地址 * @param sets html字符串 */ public Set< String > getImgStr(String htmlStr) { Set< String > pics = new HashSet< String >(); String img = ""; Pattern p_image; Matcher m_image; String regEx_img = "< img. *src\\s*=\\s*(.*?)[^>]*?>"; p_image = Pattern.compile(regEx_img, Pattern.CASE_INSENSITIVE); m_image = p_image.matcher(htmlStr); while (m_image.find()) { // 得到< img />數據 img = m_image.group(); // 匹配< img >中的src數據 Matcher m = Pattern.compile("src\\s*=\\s*\"?(.*?)(\"|>|\\s+)").matcher(img); while (m.find()) { pics.add(m.group(1)); } } return pics; } |
以上這篇Java 獲取Html文本中的img標簽下src中的內容方法就是小編分享給大家的全部內容了,希望能給大家一個參考,也希望大家多多支持服務器之家。
原文鏈接:https://blog.csdn.net/xyajia/article/details/77648413