基于多特征權重分配的源代碼搜索優化
大小:0.95 MB 人氣: 2018-04-17 需要積分:1
標簽:權重(7537)
在軟件開發過程中,代碼復用是提高軟件開發效率的重要手段。目前,互聯網中積累了大量的開源代碼,如知名開源庫GitHub、OSChina、CodePlex等。在編制程序時,程序員可以對這些開源代碼進行復用,從而降低開發成本。代碼搜索是對其復用的前提。如何從開源軟件中準確地提取高質量的代碼資源并復用到軟件產品中,是提高軟件開發效率需要解決的重要問題。
針對代碼搜索算法輸入的不同形式,當前已經出現了基于關鍵字、接口、輸入輸出等形式的開源代碼搜索引擎。不同于其他輸入形式的搜索方法,由于方法簽名是開發者通過一些能表達方法功能的詞語根據駝峰命名法則命名的,所以基于關鍵字的搜索在匹配方法簽名時往往更能體現方法功能的匹配;但針對面向對象語言開發的開源軟件,當前基于關鍵字的搜索沒有考慮其源代碼具有多種代碼特征,或者只考慮了用戶查詢語句與方法簽名的單一匹配而忽視了源代碼的其他重要特征如注釋、類名等。比如源代碼注釋是對代碼功能的描述,其中含有能體現方法功能的大量信息,這些信息對搜索特定功能的源代碼是有幫助的。同理,類名中也含有少量體現代碼功能的信息,而且源代碼中各特征之間會有一定的聯系。匹配時不能僅僅匹配單一方法名或者將多個代碼特征轉化成純文本進行搜索而不考慮各代碼特征的重要度,因此,將方法簽名、源代碼注釋、方法體等代碼特征結合起來應用于代碼搜索中。
?
非常好我支持^.^
(0) 0%
不好我反對
(0) 0%