Splunk是什么

206次閱讀

共計 2214 個字符，預計需要花費 6 分鐘才能閱讀完成。

這篇“Splunk 是什么”文章的知識點大部分人都不太理解，所以丸趣 TV 小編給大家總結了以下內容，內容詳細，步驟清晰，具有一定的借鑒價值，希望大家閱讀完這篇文章能有所收獲，下面我們一起來看看這篇“Splunk 是什么”文章吧。

Splunk 是啥？

Splunk 是日志 / 流式數據領域中做的最好的商業軟件實現，它的核心能力只有一個：

像 Google 那樣搜索企業內部所有產生的日志

這個的威力非常大，現在的企業不缺數據，缺的是有效挖掘數據的能力。而顯然大部分企業沒有 Google 的能力去做搜索，于是 Splunk 提供這樣的能力。與之相競爭的開源實現有 Logstash。

Splunk ≈ Logstash
Logstash = Redis(傳輸) + ElasticSearch(搜索) + Kibana(展現)
ElasticSearch = Lucene + Search

那么，哪里可以買到呢？##

Splunk 官網上有，我就不替他們做廣告了，總之，很貴，一萬美元能買 1G 的流量每天。言歸正傳，我還是分析一下這個玩意兒的一些功能特性吧。

首先，Splunk 有一個很炫酷的界面

可以看到，Splunk 的主要使用方式就是那個搜索框，在里面輸入一種叫做 SPL 的搜索語言，就能獲取到你想要的各種信息了。Splunk 能在后臺對數據進行過濾、聚合、統計，最后得到各種報表、圖像

SPL 是一種向 SQL 致 (chao) 敬(xi)的語言，語法非常的類似，不同的是，SPL 搜索的不是關系數據庫，而是輸入到 Splunk 系統中所有的日志數據，以下是幾個具體的案例：

可以看到，對于一行 SPL 搜索語句

sourcetype = syslog ERROR | top user | fields - precent

Splunk 是這么干的，

首先從硬盤上搜索字段 sourcetype（來源類型）為 syslog 的日志，同時，在日志中含有 ERROR 這個關鍵字的。

通過管道符，把上面的搜索結果根據 user 字段做聚合，取出其中出現次數最多的前 10 個

再通過管道符，去掉百分比字段，最后得出結果

最后看到，這個搜索干了什么事情呢？它一下子就把日志中出錯最多的前十個用戶給統計出來了，這樣后續程序員就能跟蹤這些錯誤為什么產生，然后著手去解決。

| where distance/time   100

使用 where，對日志中兩個字段進行相除后比較。

前因后果架構圖

Splunk 主要做了 3 件事

解析原始日志格式，分解成有意義的字段，有的 log 收集方案在第一階段就解析日志只發送關心的字段，以節省帶寬。

根據時間戳，request ID，session ID，user ID 等關聯日志條目，以盡量清晰當時各個子系統的狀態；

根據分析的目的做過濾、聚合、統計等等，最后整一份漂亮的報表出來。

Splunk 出彩的特性是……

WEB 的 UI 很出色，插件式的，把這個做成了一個平臺，允許很多第三方的公司在上面發布應用。

搜索語法強大，例如查找 HTTP 503 錯誤近期的出現頻率，例如某一個地區用戶訪問最多的商品列表，例如頁面訪問量排名。基本上，你能想到的可以由 SQL 完成的搜索，SPL 都能夠做出來。

自動猜測一些日志的字段，同時可以在 Web 上手動調整怎么解析源頭日志。

以上所有操作，都能由掌握 SPL 語言的非程序員來完成，也就是說 Splunk 可以由產品經理或者運營團隊來操控。而且還能把數據可視化做出來。

流式搜索，實時過濾日志然后報警，這個對運維團隊很有用。

以上幾點，就決定了 Splunk 的市場非常的大，這家公司的概念是流式數據領域的數據倉庫，2012 在納斯達克上市，不過這兩年被人做空，股票大跌。因為很多云計算廠商都能提供這種服務，例如阿里云 1MB/ S 都是免費的。

競品分析 —— Logstash, Kafka##

###Splunk vs Logstash###

Logstash 是個開源的日志搜索工具，也是一體化的開箱即用的產品。基本上，能實現 Splunk 六成的功力。Web 沒有那么強，也沒有 SPL 這樣簡單的語言，ElasticSearch 需要通過 Json 來查詢，Kibana 的搜索語句能力有限。目前可以說 Logstash 這個項目還在成熟期。需要后續很多的工作才能做好。

###Splunk vs Kafka ###

這么比較其實不是很公平。

Kafka 只解決了日志的統一搜集、傳輸、序列化存儲問題。Splunk 做的更多些，還做了數據索引的深加工。

同時，Kafka 需要在源頭使用 schema 來定義數據格式，嚴格，有利于后期的消費程序使用。

Splunk 卻對源頭數據要求沒有那么高，對現有系統改動小，因為是個企業軟件，需要追求兼容性。

從高可用方面來看，Splunk 目前還沒有一天搜集幾個 T 的數據的案例，Kafka 在這方面的能力絕對沒有問題。

Kafka 是個比較好的車身框架，但還缺一個強大的發動機和不少內飾；Splunk 是一輛功能完善的車子，就是價格很貴，而且沒有在 150 碼以上開過的案例。

所以，對于 Kafka，可能的總體解決方案有：

Kafka + YARN + Hadoop = Samza(Linkin) 
Kafka + Strom + MySQL
Kafka + ElasticSearch + Kibana

以上就是關于“Splunk 是什么”這篇文章的內容，相信大家都有了一定的了解，希望丸趣 TV 小編分享的內容對大家有幫助，若想了解更多相關的知識內容，請關注丸趣 TV 行業資訊頻道。

正文完

發表至：計算機運維

2023-08-04

轉載說明：除特殊說明外本站除技術相關以外文章皆由網絡搜集發布，轉載請注明出處。

docker集群產品形態的需求是什么

久久精品人人爽,华人av在线,亚洲性视频网站,欧美专区一二三

Splunk是什么