国产精品久久,青青草原亚洲,日韩免费高清大片在线,《年轻的女教师》7,未满十八18禁止免费无码网站

提高軟件開發、軟件維護的效率和質量的利器

 二維碼
發表時間:2021-04-30 09:15

提高軟件開發、軟件維護的效率和質量的利器

SnowGraph可將知識圖譜融入機器對無結構文本的處理過程之中,進而為復用者提供準確、有效的智能問答服務,從而提高軟件復用過程的效率與質量。

北京大學的鄒艷珍副教授所在團隊提出了基于大數據的軟件項目知識圖譜構造及問答方法,設計并實現了相應的軟件項目知識圖譜構造及智能問答平臺SnowGraph,并在Apache開源社區以及國內著名軟件企業成功展開應用實踐。該技術成果具有很好的通用性與可擴展性,能夠對未來可能出現的新的知識需求、知識來源,以及知識抽取、關聯、提煉方法進行適應與支持,有效提高了軟件項目理解和軟件復用的效率。該研究以“基于大數據的軟件項目知識圖譜構造及問答方法”為題發表在《大數據》2021年第1期。

01 為什么要構建軟件知識圖譜?

軟件項目在其整個生命周期中形成并積累了大量的數據,如源代碼、郵件列表、缺陷報告和問答文檔等。這些數據中蘊含了規模龐大、結構復雜、語義關聯豐富的軟件知識,能夠幫助軟件開發人員理解軟件功能,進行軟件復用。然而,組織、利用這些知識面臨著以下挑戰:(1)軟件規模擴大引發的軟件知識爆炸問題;(2)軟件數據中蘊含的信息在多源異構數據中呈碎片化分散的形態;(3)大量信息是以無結構文本的形式表示的,如代碼標識符、代碼注釋、郵件、用戶手冊、缺陷描述。因此,亟需構建一個語義關聯豐富的軟件知識圖譜。

02 取得了哪些重大突破?

針對上述問題,鄒艷珍副教授所在團隊設計并實現了相應的軟件項目知識圖譜構造及智能問答平臺SnowGraph,其系統框架如圖1所示。

圖1 SnowGraph平臺的系統框架

具體的,首先針對傳統軟件項目知識圖譜需要開發人員熟悉并掌握Cypher語法,人工將用戶意圖轉化為Cypher查詢語句,學習成本較高的問題,鄒艷珍副教授所在團隊提出了一種基于自然語言的知識庫/知識圖譜查詢方法。該方法能夠將用戶的自然語言問句自動轉化為Cypher形式化查詢語句,有效支持了面向軟件項目知識圖譜的自然語言問答,降低了開發人員的學習成本。然后提出了融合代碼知識的智能問答方法,借助軟件項目的知識圖譜來計算不同單詞之間的潛在語義相關度,從而對候選文本集合進行篩選與評估,返回更準確的答案。與現有的基于LDA、Word2Vec等統計學習方法的文檔搜索改進策略相比,該方法借助軟件項目源代碼中的代碼實體對自然語言文本的語義進行結構化表示,并利用代碼實體之間的結構依賴關系實現了對文本之間的潛在語義關聯的更直接、更有效的挖掘與利用,顯著提高了文檔搜索的效果。

03 下一步的工作內容是什么?

未來,基于軟件開發過程中的更多數據類型,進一步的工作是進行軟件知識圖譜知識實體的擴充,以及建立更多的語義關聯,并提供更精準的交互式智能問答服務


推薦閱讀
服務熱線:400-969-3199
手機:18985543289  (周一至周日:9:00-18:00)
地址:貴州省貴陽市南明區新華路194號花樣年華2601    電話:400-969-3199    18985543289   15185072128