本文轉載自AI新媒體量子位
(ID:QbitAI)
騰訊又開源了。
繼開源800萬中文詞的NLP數據集之後,騰訊又開源了一個智能運維學件平台Metis,主要面向運維工程師。
根據官方介紹,Metis是一系列AIOps領域的應用實踐集合,主張通過算法從海量運維數據中學習摸索規則,逐步降低對人指定規則的依賴,進而減少人為失誤。
當前版本開源的是時間序列異常檢測學件,從機器學習的角度,來解決運維中時序數據的異常檢測問題。
實現思路與代碼架構
根據官方介紹,時間序列異常檢測學件的實現基於統計判決、無監督和有監督學習對時序數據進行聯合檢測。具體來說是:
通過統計判決、無監督算法進行首層判決,輸出疑似異常,其次進行有監督模型判決,得到最終檢測結果。檢測模型是經大量樣本訓練生成,可根據樣本持續訓練更新。
代碼架構如下圖所示:
GitHub相關文檔中,對代碼架構進行了詳細的解釋:
數據層(DB):存儲檢測異常資訊、樣本資訊、任務資訊等。
服務層(server): 服務層劃分為四大模塊,分別是:數據驅動模塊DAO、特徵計算模塊feature、算法模塊feature以及業務模塊business。
接口層(API): 提供API能力,時間序列異常檢測接口和WEB管理的操作接口。
WEB層(web): 系統提供的WEB服務,通過服務界面,用戶可以進行異常查詢、打標標注、樣本庫管理、模型訓練等操作。
應用場景與功能特性
官方文檔顯示,時間序列異常檢測學件的應用場景有兩個,分別是應用數據場景和應用案例場景。
其中應用數據場景包括作業系統數據、應用程式數據和KPI指標數據。應用案例場景包括監控告警、關聯分析和影響評估。
功能特性有六個,分別為異常檢測、特徵提取、異常查詢、標注打標、樣本管理、模型管理。
前瞻未來 峰會等你