

2023年12月16日,由中國計算機學會(CCF)✦、清華大學、中國建設銀行股份有限公司、南開大學聯合主辦;CCF互聯網專委會🏊🏼、清華大學計算機科學與技術系、中國建設銀行股份有限公司運營數據中心、南開大學軟件沐鸣、北京必示科技有限公司承辦的2023 CCF國際AIOps挑戰賽決賽暨“大模型時代的AIOps”研討會於北京西郊賓館隆重召開。本次大會采用線下參會+線上全程直播形式🚵🏻♂️🤏🏼,現場有超300人線下參會🐻❄️,同時有近5萬人次觀看線上直播。我院徐波副教授受邀參加並作論文分享。
在“運維大模型論文閃電分享”環節,帶來了ESEC/FSE 2023🫐、ICLR 2023、NeurIPS 2023、IWQoS 2023👩🏻🦯👨🏿🎓、ICSE 2024等多場國際會議的優質論文,從大模型應用、指標大模型、日誌大模型三個方向分享基於大語言模型的智能運維最新的研究成果和觀點。現場南開大學軟件沐鸣副教授張聖林🏃🏻➡️、微軟主管研究員馬明華、清華大學計算機系周煊赫、香港中文大學(深圳)助理教授賀品嘉、莫納什大學金明、清華大學軟件沐鸣吳海旭🤹♀️、我院副教授徐波、華為技術專家陶仕敏👮🏼,分別帶來《評估和總結:使用大語言模型提高對故障的理解》、《基於大語言模型的雲故障根因分析》、《基於大語言模型的數據庫異常診斷系統》🧅、《基於上下文學習的自動化日誌語句生成研究》🏰、《Time-LLM: 通過重編程大型語言模型進行時間序列預測》🥰📢、《TimesNet: 任務通用的時間序列分析骨幹網絡》、《SimMTM: 時間序列掩碼預訓練框架》🥪、《KnowLog:基於知識增強的日誌預訓練語言模型》、《BigLog: 面向統一日誌表示的無監督大規模預訓練方法》、《LogPrompt:面向零樣本和可解釋性日誌分析的提示工程》等頂會論文分享。
報告簡介:本報告聚焦智能運維領域中的日誌理解任務🧎🏻♀️➡️。在預訓練語言模型在自然語言處理領域取得巨大成功的背景下,本研究發現直接將通用預訓練語言模型應用到日誌理解任務上效果不佳✉️,存在三個主要缺陷。首先💲,難以理解日誌中特定術語的含義。其次,難以理解整條日誌的含義。第三,難以理解不同廠商對同一日誌的不同表達👩🏼🏫⛪️。為了解決這些挑戰🧗🏿,我們提出了KnowLog,一個基於領域知識增強的日誌預訓練模型,從公開手冊中獲得日誌的相關領域知識並設計相應的自監督預訓練任務以增強模型對於日誌的理解🏛。最後我們在六個不同的日誌理解任務上進行了實驗分析,結果表明KnowLog顯著提高了日誌理解的能力🫏,並且在與沒有領域知識增強的預訓練語言模型相比,取得了最先進的結果🫔🧝🏻。該成果發表在CCF A類軟工會議ICSE 2024上。