日韩欧美亚洲国产,91在线视频免费,一级福利片

Java程序員如何通過 ElasticSearch 構建極致的搜索體驗？

搜索引擎在任何人的日常生活和工作中都承擔著很重要的角色，說到搜索大家想到的最多可能就是百度，谷歌，必應等搜索引擎。

這些確實是 PC 互聯網時代的搜索先鋒，但是現在移動互聯網時代搜索已經很普及了，各大應用基本上都支持搜索，像抖音，微信，知乎等等應用程序，都會內置搜索引擎來實現自家內容的搜索。

Elasticsearch 是一個實時的分布式搜索分析引擎，它的搜索速度和規模，堪稱前所未有。我們只需要把數據按照規定的索引格式去存儲，后續就可以進行極致的搜索，因此 Elasticsearch 被廣泛的應用于各大互聯網公司。

根據 Elasticsearch 的官方介紹，Wikipedia，Github，Stack Overflow 等大廠都在使用。

Wikipedia 使用 Elasticsearch 提供帶有高亮片段的全文搜索，還有 search-as-you-type 和 did-you-mean 的建議。

衛報使用 Elasticsearch 將網絡社交數據結合到訪客日志中，為它的編輯們提供公眾對于新文章的實時反饋。

Stack Overflow 將地理位置查詢融入全文檢索中去，并且使用 more-like-this 接口去查找相關的問題和回答。

GitHub 使用 Elasticsearch 對1300億行代碼進行查詢。

安裝使用

Elasticsearch 提供了開箱即用的功能，我們通過在官網 https://www.elastic.co/downloads/elasticsearch 下載最新的符合自己電腦系統的穩定版本，然后解壓后執行./bin/elasticsearch

Java程序員如何通過 ElasticSearch 構建極致的搜索體驗？

顯示 successfully 表示啟動成功，再通過執行命令curl 'http://localhost:9200/?pretty' 可以看到如下輸出，表示 Elasticsearch 本地啟動成功。

Java程序員如何通過 ElasticSearch 構建極致的搜索體驗？

在使用 Elasticsearch 之前，我們先簡單介紹一個 Elasticsearch 的存儲結構，便于我們后面進行學習。

首先我們要知道一個事情那就是 Elasticsearch 是面向文檔的，所謂文檔就是一個 document，如果用過 MongoDB的話，小伙伴對文檔應該比較熟悉，是一個 NoSQL 的形式，可以理解為一個JSON 形式的結構，跟我們常用的 MySQL 關系型的結構不一樣，目前基本上任何一門語言的對象都可以直接轉化成 JSON 形式，這極大方便了我們的使用。

文檔的形式

文檔的組成由文檔數據和元數據組成，其中元數據包括_index，_type，_id 三個特別重要的元數據，其中 _index 表示文檔在哪存放，_type 表示文檔的對象類別，_id文檔唯一標識。

雖然 Elasticsearch 是以文檔形式存儲的，但這里我們可以用關系型數據庫作類比，比如這里的_index 可以類似于 MySQL 的 database，_type 類似有 MySQL 的 table，其中_id 類似于 ID 字段。

與 Elasticsearch 進行交互

通過官方文檔我們可以知道一個 Elasticsearch 請求和任何 HTTP 請求一樣由若干相同的部件組成：curl -X ' ://: / ?' -d ''

被 < > 標記的部分表示含義如下：

標記	含義
`VERB`	適當的 HTTP 方法或謂詞 : `GET`、 `POST`、 `PUT`、 `HEAD` 或者`DELETE`。
`PROTOCOL`	`http` 或者 `https`（如果你在 Elasticsearch 前面有一個 `https` 代理）
`HOST`	Elasticsearch 集群中任意節點的主機名，或者用 `localhost` 代表本地機器上的節點。
`PORT`	運行 Elasticsearch HTTP 服務的端口號，默認是 `9200` 。
`PATH`	API 的終端路徑（例如 `_count` 將返回集群中文檔數量）。Path 可能包含多個組件，例如：`_cluster/stats` 和 `_nodes/stats/jvm` 。
`QUERY_STRING`	任意可選的查詢字符串參數 (例如 `?pretty` 將格式化地輸出 JSON 返回值，使其更容易閱讀)
`BODY`	一個 JSON 格式的請求體 (如果請求需要的話)