久久精品人人爽,华人av在线,亚洲性视频网站,欧美专区一二三

solr是什么

158次閱讀
沒有評論

共計 2185 個字符,預計需要花費 6 分鐘才能閱讀完成。

這篇文章主要講解了“solr 是什么”,文中的講解內容簡單清晰,易于學習與理解,下面請大家跟著丸趣 TV 小編的思路慢慢深入,一起來研究和學習“solr 是什么”吧!

##Solr Features## Solr 是一個提供類似 REST 的 API 的獨立的企業級檢索服務器。你可以通過 XML、JSON、CVS 或者 HTTP 的二進制來存儲文檔(或者稱為索引)。你可以通過 HTTP GET 方法查詢并且接受 XML、JSON、CVS 或者二進制數據。

先進的全文檢索功能

為高吞量的網略流量進行優化

基于開放接口標準 -XML、JSON 和 HTTP

全面的 HTML 管理接口

服務器統計信息暴露,可以通過 JMX 來監控

線性可擴展,自動索引復制,自動故障轉移和恢復

近乎實時索引

基于 XML 配置的靈活性和適應性

可擴展的插件架構

###Solr 使用 Lucene 檢索庫并擴展它 ###

一個真實的數據模式,包括數字類型、動態字段、唯一鍵

對 Lucene 查詢語言強大的擴展功能

方面檢索和過濾

支持每個文檔中多點和地理多邊形的地理空間檢索

先進的,可配置的文本分析器

高度可配置性和用戶可擴展緩存

性能優化

基于 XML 的可擴展配置

基于 AJAX 的管理接口

可監視的日志

快速接近實時的增量索引和索引復制

基于跨多個主機的索引分片的高度可擴展的分布式檢索

JSON、XML、CVS/delimited-text, 和二進制更新格式

簡單的方式拉取數據,從數據庫、本地磁盤上的 XML 文件,或者 HTTP 資源

使用 Apache Tika 來解析和索引富文本(PDF、Word、HTML 等)

基于 Apache UIMA 集成配置的元數據提取

多檢索索引

####Schema####

定義文檔字段并指定字段類型

可以驅動更智能的處理

申明 lucene 分詞器

動態字段是能夠即時的添加新的字段

字段復制功能允許索引單個字段多種方式,或多個字段合并成一個單一的搜索領域

顯式類型,排序了猜測字段類型的必要

基于擴展(外部文件)文件的配置停用詞列表、同義詞列表、保護詞列表

許多額外的文本分析組件,包括單詞分割,正則表達式和 sounds-like 過濾器

每個字段都有可插拔的類似模型

####Query####

HTTP 接口提供可配置的響應格式(XML/XSLT、JSON、Python、Ruby、PHP、Velocity、CSV、二進制)

可通過任意數量的字段或者對于任意數量字段的復雜函數來排序

高級的 DisMax 查詢分析器從用戶輸入的查詢中獲得高度相關的結果

高亮上下文片段

基于唯一字段值、明確的查詢、日期范圍、數字范圍或者點的方面檢索

通過標簽或者可選擇的執行過濾來實現多方面檢索

對用戶查詢進行拼寫建議

給定文檔的相似性建議

函數查詢 - 影響用戶指定復雜的數值字段或查詢相關度分值函數的得分

通過函數查詢對結果范圍進行過濾

Range filter over Function Query results

Date Math – specify dates relative to NOW in queries and updates

通過 carrot2 進行動態檢索結果聚類

數字字段統計,如最小值,最大值,平均值,標準偏差

Combine queries derived from different syntaxes

自動建議功能完成用戶查詢

允許配置一個查詢的最優先的結果,這些結果可以覆蓋正常的得分和排序

簡單連接兩個文檔類型功能

性能優化

####Core####

動態的創建或者刪除文檔集合而不用重啟服務

可插拔的查詢處理器和可擴展的 XML 數據格式

可插拔的用戶函數供函數查詢

可定制的基于組建的請求處理器并且支持分布式檢索

基于 unique key 字段的文檔唯一性加強

重復文件檢測,包括 fuzzy near duplicates

可定制的索引處理鏈,允許索引前對文檔處理

User configurable commands triggered on index changes

Ability to control where docs with the sort field missing will be placed

Luke request handler for corpus information

####SolrCloud####

基于 Apache ZooKeeper 的集中式的配置

自動分布式索引 / 分片,發送文檔到任意節點并且文檔會被轉發到正確的分片

基于立即推模型(同時也支持緩慢拉模型復制)復制的近實時索引

事務日志確保即使更新文檔沒有索引到磁盤也不會丟失

如果失敗時的自動索引故障轉移、索引 leader 選舉和故障恢復

無單點故障

####Admin Interface####

對于緩存利用、更新和查詢的綜合統計

包括索引統計的交互模式瀏覽

復制監控

圖形化集群節點狀態的 SolrCloud 儀表盤

全日志控制

文本分析調試,顯示一個分析器每個階段的分析結果

Web 查詢接口,w/ 調式輸出

解析的查詢輸出

基于 Lecene explain()的文檔得分詳細設計

Explain score for documents outside of the requested range to debug why a given document wasn t ranked highe

感謝各位的閱讀,以上就是“solr 是什么”的內容了,經過本文的學習后,相信大家對 solr 是什么這一問題有了更深刻的體會,具體使用情況還需要大家實踐驗證。這里是丸趣 TV,丸趣 TV 小編將為大家推送更多相關知識點的文章,歡迎關注!

正文完
 
丸趣
版權聲明:本站原創文章,由 丸趣 2023-08-16發表,共計2185字。
轉載說明:除特殊說明外本站除技術相關以外文章皆由網絡搜集發布,轉載請注明出處。
評論(沒有評論)
主站蜘蛛池模板: 乌拉特中旗| 晴隆县| 镇雄县| 长乐市| 鞍山市| 麻江县| 商丘市| 杭锦后旗| 和静县| 曲麻莱县| 潜山县| 广元市| 大丰市| 新竹市| 桓台县| 青浦区| 磴口县| 黄山市| 平昌县| 郴州市| 阳春市| 芦山县| 射阳县| 加查县| 乐至县| 伊宁县| 伊春市| 香港| 玉林市| 大埔区| 黄梅县| 浮山县| 新竹市| 剑河县| 漠河县| 耒阳市| 肥乡县| 女性| 太湖县| 洮南市| 渝中区|