每日最新頭條.有趣資訊

騰訊開源智能運維項目,機器學習減少失誤

本文轉載自AI新媒體量子位

(ID:QbitAI)

騰訊又開源了。

開源800萬中文詞的NLP數據集之後,騰訊又開源了一個智能運維學件平台Metis,主要面向運維工程師。

根據官方介紹,Metis是一系列AIOps領域的應用實踐集合,主張通過算法從海量運維數據中學習摸索規則,逐步降低對人指定規則的依賴,進而減少人為失誤。

當前版本開源的是時間序列異常檢測學件,從機器學習的角度,來解決運維中時序數據的異常檢測問題。

實現思路與代碼架構

根據官方介紹,時間序列異常檢測學件的實現基於統計判決、無監督和有監督學習對時序數據進行聯合檢測。具體來說是:

通過統計判決、無監督算法進行首層判決,輸出疑似異常,其次進行有監督模型判決,得到最終檢測結果。檢測模型是經大量樣本訓練生成,可根據樣本持續訓練更新。

代碼架構如下圖所示:

GitHub相關文檔中,對代碼架構進行了詳細的解釋:

數據層(DB):存儲檢測異常資訊、樣本資訊、任務資訊等。

服務層(server): 服務層劃分為四大模塊,分別是:數據驅動模塊DAO、特徵計算模塊feature、算法模塊feature以及業務模塊business。

接口層(API): 提供API能力,時間序列異常檢測接口和WEB管理的操作接口。

WEB層(web): 系統提供的WEB服務,通過服務界面,用戶可以進行異常查詢、打標標注、樣本庫管理、模型訓練等操作。

應用場景與功能特性

官方文檔顯示,時間序列異常檢測學件的應用場景有兩個,分別是應用數據場景和應用案例場景。

其中應用數據場景包括作業系統數據、應用程式數據和KPI指標數據。應用案例場景包括監控告警、關聯分析和影響評估。

功能特性有六個,分別為異常檢測、特徵提取、異常查詢、標注打標、樣本管理、模型管理。

前瞻未來 峰會等你

獲得更多的PTT最新消息
按讚加入粉絲團