一区二区三区在线-一区二区三区亚洲视频-一区二区三区亚洲-一区二区三区午夜-一区二区三区四区在线视频-一区二区三区四区在线免费观看

服務(wù)器之家:專注于服務(wù)器技術(shù)及軟件下載分享
分類導(dǎo)航

PHP教程|ASP.NET教程|Java教程|ASP教程|編程技術(shù)|正則表達(dá)式|C/C++|IOS|C#|Swift|Android|VB|R語言|JavaScript|易語言|vb.net|

服務(wù)器之家 - 編程語言 - Java教程 - Lucene實(shí)現(xiàn)多種高級(jí)搜索形式

Lucene實(shí)現(xiàn)多種高級(jí)搜索形式

2020-09-09 13:37Java之家 Java教程

這篇文章主要介紹了Lucene實(shí)現(xiàn)多種高級(jí)搜索形式的相關(guān)資料,需要的朋友可以參考下

布爾操作符

大多數(shù)的搜索引擎都會(huì)提供布爾操作符讓用戶可以組合查詢,典型的布爾操作符有 AND, OR, NOT。Lucene 支持 5種布爾操作符,分別是 AND, OR, NOT, 加(+), 減(-)。接下來我會(huì)講述每個(gè)操作符的用法。

OR: 如果你要搜索含有字符 A 或者 B 的文檔,那么就需要使用 OR操作符。需要記住的是,如果你只是簡(jiǎn)單的用空格將兩個(gè)關(guān)鍵詞分割開,其實(shí)在搜索的時(shí)候搜索引擎會(huì)自動(dòng)在兩個(gè)關(guān)鍵詞之間加上 OR操作符。例如,“Java OR Lucene” 和 “Java Lucene” 都是搜索含有 Java 或者含有 Lucene的文檔。

AND: 如果你需要搜索包含一個(gè)以上關(guān)鍵詞的文檔,那么就需要使用 AND 操作符。例如,“Java AND Lucene”返回所有既包含 Java 又包含 Lucene 的文檔。

NOT: Not 操作符使得包含緊跟在 NOT 后面的關(guān)鍵詞的文檔不會(huì)被返回。例如,如果你想搜索所有含有 Java 但不含有Lucene 的文檔,你可以使用查詢語句 “Java NOT Lucene”。但是你不能只對(duì)一個(gè)搜索詞使用這個(gè)操作符,比如,查詢語句“NOT Java” 不會(huì)返回任何結(jié)果。

加號(hào)(+): 這個(gè)操作符的作用和 AND 差不多,但它只對(duì)緊跟著它的一個(gè)搜索詞起作用。例如,如果你想搜索一定包含Java,但不一定包含 Lucene 的文檔,就可以使用查詢語句“+Java Lucene”。

減號(hào)(-): 這個(gè)操作符的功能和 NOT 一樣,查詢語句 “Java -Lucene” 返回所有包含 Java 但不包含Lucene 的文檔。

接下來我們看一下如何利用 Lucene 提供的 API 來實(shí)現(xiàn)布爾查詢。清單1 顯示了如果利用布爾操作符進(jìn)行查詢的過程。

清單1:使用布爾操作符

?
1
2
3
4
5
6
7
8
9
10
11
12
13
//Test boolean operator
public void testOperator(String indexDirectory) throwsException{
Directory dir =FSDirectory.getDirectory(indexDirectory,false);
IndexSearcher indexSearcher = new IndexSearcher(dir);
String[] searchWords = {"Java AND Lucene", "Java NOT Lucene", "JavaOR Lucene",
"+Java +Lucene", "+Java -Lucene"};
Analyzer language = new StandardAnalyzer();
Query query;
for(int i = 0; i < searchWords.length; i++){
query = QueryParser.parse(searchWords[i], "title", language);
Hits results = indexSearcher.search(query);
System.out.println(results.length() + "search results for query " +searchWords[i]);}<p></p>
<p></p>

域搜索(Field Search)

Lucene 支持域搜索,你可以指定一次查詢是在哪些域(Field)上進(jìn)行。例如,如果索引的文檔包含兩個(gè)域,Title 和Content,你就可以使用查詢 “Title: Lucene AND Content: Java” 來返回所有在 Title域上包含 Lucene 并且在 Content 域上包含 Java 的文檔。清單 2 顯示了如何利用 Lucene 的 API來實(shí)現(xiàn)域搜索。

清單2:實(shí)現(xiàn)域搜索

?
1
2
3
4
5
6
7
8
9
10
<p>//Test field search
public void testFieldSearch(String indexDirectory) throwsException{
Directory dir =FSDirectory.getDirectory(indexDirectory,false);
IndexSearcher indexSearcher = new IndexSearcher(dir);
String searchWords = "title:Lucene AND content:Java";
Analyzer language = new StandardAnalyzer();
Query query = QueryParser.parse(searchWords, "title",language);
Hits results = indexSearcher.search(query);
System.out.println(results.length() + "search results for query " +searchWords);</p>
<p></p>

通配符搜索(Wildcard Search)

Lucene支持兩種通配符:?jiǎn)柼?hào)(?)和星號(hào)(*)。你可以使用問號(hào)(?)來進(jìn)行單字符的通配符查詢,或者利用星號(hào)(*)進(jìn)行多字符的通配符查詢。例如,如果你想搜索tiny 或者 tony,你就可以使用查詢語句 “t?ny”;如果你想查詢 Teach, Teacher 和Teaching,你就可以使用查詢語句 “Teach*”。清單3 顯示了通配符查詢的過程。

清單3:進(jìn)行通配符查詢

?
1
2
3
4
5
6
7
8
9
10
11
<p>//Test wildcard search
public void testWildcardSearch(String indexDirectory)throwsException{
Directory dir =FSDirectory.getDirectory(indexDirectory,false);
IndexSearcher indexSearcher = new IndexSearcher(dir);
String[] searchWords = {"tex*", "tex?", "?ex*"};
Query query;
for(int i = 0; i < searchWords.length; i++){
query = new WildcardQuery(new Term("title",searchWords[i]));
Hits results = indexSearcher.search(query);
System.out.println(results.length() + "search results for query " +searchWords[i]);}</p>
<p></p>

模糊查詢

Lucene 提供的模糊查詢基于編輯距離算法(Edit distance algorithm)。你可以在搜索詞的尾部加上字符 ~來進(jìn)行模糊查詢。例如,查詢語句 “think~” 返回所有包含和 think 類似的關(guān)鍵詞的文檔。清單 4 顯示了如果利用Lucene 的 API 進(jìn)行模糊查詢的代碼。

清單4:實(shí)現(xiàn)模糊查詢

?
1
2
3
4
5
6
7
8
9
10
11
<p>//Test fuzzy search
public void testFuzzySearch(String indexDirectory)throwsException{
Directory dir =FSDirectory.getDirectory(indexDirectory,false);
IndexSearcher indexSearcher = new IndexSearcher(dir);
String[] searchWords = {"text", "funny"};
Query query;
for(int i = 0; i < searchWords.length; i++){
query = new FuzzyQuery(new Term("title",searchWords[i]));
Hits results = indexSearcher.search(query);
System.out.println(results.length() + "search results for query " +searchWords[i]);}</p>
<p></p>

范圍搜索(Range Search)

范圍搜索匹配某個(gè)域上的值在一定范圍的文檔。例如,查詢 “age:[18 TO 35]” 返回所有 age 域上的值在 18 到35 之間的文檔。清單5顯示了利用 Lucene 的 API 進(jìn)行返回搜索的過程。

清單5:測(cè)試范圍搜索

?
1
2
3
4
5
6
7
8
9
10
<p>//Test range search
public void testRangeSearch(String indexDirectory)throwsException{
Directory dir =FSDirectory.getDirectory(indexDirectory,false);
IndexSearcher indexSearcher = new IndexSearcher(dir);
Term begin = new Term("birthDay","20000101");
Term end = newTerm("birthDay","20060606");
Query query = new RangeQuery(begin,end,true);
Hits results = indexSearcher.search(query);
System.out.println(results.length() + "search results isreturned");
}</p>

以上所述是小編給大家介紹的Lucene實(shí)現(xiàn)多種高級(jí)搜索形式,希望對(duì)大家有所幫助,如果大家有任何疑問請(qǐng)給我留言,小編會(huì)及時(shí)回復(fù)大家的。在此也非常感謝大家對(duì)服務(wù)器之家網(wǎng)站的支持!

延伸 · 閱讀

精彩推薦
主站蜘蛛池模板: 午夜福利理论片高清在线 | 99精品国产综合久久久久 | 美女把小内内脱个精光打屁屁 | 亚洲男人的天堂在线 | 欧美特级特黄a大片免费 | 欧美午夜寂寞影院安卓列表 | 亚洲激情婷婷 | 精品国产免费 | 喜欢老头吃我奶躁我的动图 | 欧美久草在线 | 9l国产精品久久久久麻豆 | 9久re在线观看视频精品 | 亚洲第一免费播放区 | 亚洲成人网导航 | 国产香蕉国产精品偷在线观看 | 亚洲精品一区在线观看 | 午夜福利理论片在线播放 | 精品国产三级av在线 | 男女性潮高片无遮挡禁18 | 99精彩视频| 欧美一级艳片视频免费观看 | 国产免费久久精品44 | 欧美人在线一区二区三区 | 波多野结衣在线观看视频 | 贤妻良母电影日本 | 天若有情1992国语版完整版 | 午夜AV亚洲一码二中文字幕青青 | 好男人社区www影院在线观看 | 香蕉精品高清在线观看视频 | 国产rpg迷雾之风冷狐破解 | 欧美洲大黑香蕉在线视频 | 久久视频这只精品99re6 | 亚洲国产中文字幕在线视频综合 | 俄罗斯激情性孕妇孕交大全 | 国产自产2023最新麻豆 | 四虎成人网 | 免费aⅴ在线 | 国产精品nv在线观看 | 国产大乳美女挤奶视频 | 小女生RAPPER入口 | 91在线亚洲综合在线 |