在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

KiloGram是一種用于管理文件中的大型n-gram的新算法

倩倩 ? 來源:互聯(lián)網分析沙龍 ? 2020-04-03 14:55 ? 次閱讀

最近,一組研究人員在KiloGram上發(fā)表了他們的論文,KiloGram是一種用于管理文件中的大型n-gram的新算法,可以改善機器學習對惡意軟件的檢測能力。新算法比以前的方法快60倍,并且可以處理n = 1024或更高的n-gram。n的大值具有可解釋的惡意軟件分析和簽名生成的其他應用程序。

在KDD 2019網絡安全學習和采礦研討會上發(fā)表的論文中,來自馬里蘭大學和網絡安全公司Endgame的研究人員描述了他們的算法,用于在大型文件數據集中查找最頻繁的n-gram。以前的方法在增加n的大小時會在內存和運行時中遇到“指數成本”,而在分析具有數十萬個文件的數據集時,它們的n值將小于8。相比之下,KiloGram算法能夠從數百萬個文件中的5TB數據中提取n-gram,而僅使用9GB的RAM,并且“運行時間不會隨n的增加而增加”。這允許算法為較大的n值提取n-gram,以測試這些n-gram是否為機器學習算法提供了更好的準確性。

一個n-gram是n個項的唯一序列,并且該思想被用于許多機器學習任務中,尤其是自然語言處理(NLP)。在檢測到惡意軟件的情況下,n-gram是來自文件的字節(jié)序列,該文件將被分類為惡意軟件或良性文件。惡意軟件檢測的早期工作表明,較大的n-gram(例如n = 15或20)對于訓練檢測系統(tǒng)是理想的,但是現(xiàn)代數據集的大小使得使用大于6的n值太昂貴。由于KiloGram算法可以處理那些較大的值,因此研究團隊能夠測試較大值更好的想法。

該團隊使用可執(zhí)行文件和Adobe PDF文檔的多個數據集,訓練了Elastic-Net正則化邏輯回歸分類器來檢測惡意軟件;為了進行回歸,輸入特征是使用KiloGram算法提取的n元語法。與文獻中的建議相反,研究人員發(fā)現(xiàn)“預測精度不會增加到n = 8以上”。較大的n-gram會產生精度降低的模型;但是,它們具有可解釋性的優(yōu)點。較小的n-gram產生“黑匣子”模型,而較大的n-gram特征集包含可能對分析人員有意義的字節(jié)序列。例如,它們可能代表代碼片段或文本字符串。

研究人員認為,較大的n-gram在回歸模型中使用時不那么精確,因為它們更特定于特定的惡意軟件攻擊。實際上,它們會導致過度擬合。但是,當在諸如Yara之類的簽名模型中使用時,它們的優(yōu)點是它們的假陽性率低。也就是說,盡管Yara模型可能會錯誤地將更多文件標記為良性文件,但如果它確實表明文件為惡意軟件,則很少有錯。這使得KiloGram算法可用于構建結合了機器學習模型和基于簽名的模型的分層系統(tǒng)。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 算法
    +關注

    關注

    23

    文章

    4625

    瀏覽量

    93128
  • 網絡安全
    +關注

    關注

    10

    文章

    3181

    瀏覽量

    60002
  • 機器學習
    +關注

    關注

    66

    文章

    8429

    瀏覽量

    132854
收藏 人收藏

    評論

    相關推薦

    AT6N135、AT6N136 是一種用于單通道的高速光耦合器

    AT6N135、AT6N136 是一種用于單通道的高速光耦合器, 由個 850nm 的 AlGaAs LED 光學耦合到
    發(fā)表于 01-13 09:54 ?0次下載

    探討移動設備的緩存文件管理

    ? 本文發(fā)表于FAST 2022。 探討 緩存文件管理方法。本文 通過個輕量級的基于機器學習的分類引擎來篩選和個性化管理緩存文件 ,實驗
    的頭像 發(fā)表于 11-28 11:50 ?564次閱讀
    探討移動設備<b class='flag-5'>中</b>的緩存<b class='flag-5'>文件</b><b class='flag-5'>管理</b>

    IBIS文件的Series Model簡介及設計仿真實例

    Model是指一種用于描述電路串聯(lián)元件(如電阻、電感、電容等)的模型。這些串聯(lián)元件通常用于模擬信號路徑的寄生效應,例如信號線上的電阻、
    的頭像 發(fā)表于 11-25 11:29 ?381次閱讀

    華納云:Chord算法如何管理節(jié)點間的聯(lián)系?

    Chord算法一種分布式哈希表(DHT)協(xié)議,它通過構建個環(huán)狀結構來管理節(jié)點間的聯(lián)系。以下是Chord算法如何
    發(fā)表于 11-08 16:03

    一種基于深度學習的二維拉曼光譜算法

    近日,天津大學精密儀器與光電子工程學院的光子芯片實驗室提出了一種基于深度學習的二維拉曼光譜算法,成果以“Rapid and accurate bacteria identification
    的頭像 發(fā)表于 11-07 09:08 ?267次閱讀
    <b class='flag-5'>一種</b>基于深度學習的二維拉曼光譜<b class='flag-5'>算法</b>

    TPM在光伏電站安全生產管理的應用

    在可再生能源日益成為全球能源戰(zhàn)略重心的當下,大型光伏電站以其高效、清潔的特性受到廣泛關注。然而,如何確保這些龐大系統(tǒng)安全、穩(wěn)定運行,成為業(yè)界亟待解決的問題。TPM(全面生產維護)作為一種先進的管理
    的頭像 發(fā)表于 07-18 10:15 ?383次閱讀

    邊緣計算網關在智能能源管理系統(tǒng)的應用

    隨著物聯(lián)網技術的飛速發(fā)展,數據生成和處理的需求呈現(xiàn)爆炸式增長。在大型工業(yè)園區(qū),能源管理是確保生產效率和環(huán)境可持續(xù)性的關鍵因素。邊緣計算網關作為一種位于物聯(lián)網設備和云端之間的智能設備,
    的頭像 發(fā)表于 07-09 15:52 ?350次閱讀
    邊緣計算網關在智能能源<b class='flag-5'>管理</b>系統(tǒng)<b class='flag-5'>中</b>的應用

    振弦采集儀在大型工程安全監(jiān)測的應用探索

    振弦采集儀在大型工程安全監(jiān)測的應用探索 振弦采集儀是一種用于監(jiān)測結構振動和變形的設備,它通過采集振弦信號來分析結構的動態(tài)特性。在大型工程安
    的頭像 發(fā)表于 06-28 14:22 ?237次閱讀
    振弦采集儀在<b class='flag-5'>大型</b>工程安全監(jiān)測<b class='flag-5'>中</b>的應用探索

    鴻蒙開發(fā)文件管理:【@ohos.fileio (文件管理)】

    該模塊提供文件存儲管理能力,包括文件基本管理文件目錄管理
    的頭像 發(fā)表于 06-12 18:12 ?1321次閱讀
    鴻蒙開發(fā)<b class='flag-5'>文件</b><b class='flag-5'>管理</b>:【@ohos.fileio (<b class='flag-5'>文件</b><b class='flag-5'>管理</b>)】

    DSP教學實驗箱_DSP算法實驗_嵌入式教程:4-3 有限沖激響應濾波器(FIR)算法(CCS顯示)

    限長的,其系統(tǒng)函數可記為: 其中,N-1為FIR的濾波器的階數。 帶有常系數的FIR濾波器是一種LTI(線性時不變)數字濾波器。沖激響應是有限的意味著在濾波器沒有發(fā)反饋。長度為N
    發(fā)表于 05-16 09:30

    文速覽鐵威馬TOS 6全新“文件管理

    TOS 6 Beta已經上線段時間了,各位鐵粉用著怎么樣呢?今天就和大家分享,TOS 6全新文件管理。 為了向用戶提供更流暢、更便捷的文件管理
    的頭像 發(fā)表于 04-16 12:11 ?350次閱讀
    <b class='flag-5'>一</b>文速覽鐵威馬TOS 6全新“<b class='flag-5'>文件</b><b class='flag-5'>管理</b>”

    分布式運維管理平臺助力大型電商系統(tǒng)穩(wěn)定運行的案例分析

    、引言 隨著電子商務的快速發(fā)展,大型電商系統(tǒng)面臨著前所未有的挑戰(zhàn)。如何確保系統(tǒng)的穩(wěn)定運行、提高用戶體驗、降低運維成本,成為電商企業(yè)亟待解決的問題。分布式運維管理平臺作為一種新型的運維
    的頭像 發(fā)表于 03-26 16:32 ?508次閱讀

    一種用于微液滴單細胞無標記分析的液滴篩選(LSDS)方法

    基于液滴的單細胞分析是一種非常強大的工具,可用于以單細胞分辨率研究表型和基因組異質性,從而解決各種生物問題。
    的頭像 發(fā)表于 03-26 11:17 ?597次閱讀
    <b class='flag-5'>一種</b><b class='flag-5'>用于</b>微液滴<b class='flag-5'>中</b>單細胞無標記分析的液滴篩選(LSDS)方法

    分享一種大型SOC設計功能ECO加速的解決方案

    大型SOC項目的綜合非常耗時間,常常花費好幾天。當需要做功能ECO時,代碼的改動限定在某些子模塊里,設計人員并不想重跑次完整的綜合,這種方法縮短了輪ECO的時間,保證了項目進度。
    的頭像 發(fā)表于 03-11 10:41 ?508次閱讀
    分享<b class='flag-5'>一種</b><b class='flag-5'>大型</b>SOC設計<b class='flag-5'>中</b>功能ECO加速的解決方案

    淺談工業(yè)能源管理系統(tǒng)在大型機場的應用

    淺談工業(yè)能源管理系統(tǒng)在大型機場的應用 張穎姣 江蘇安科瑞電器制造有限公司 江蘇江陰 214405 摘要:近年來,隨著我國機場建設腳步的加快,機場建設對能耗
    的頭像 發(fā)表于 02-27 14:57 ?436次閱讀
    淺談工業(yè)能源<b class='flag-5'>管理</b>系統(tǒng)在<b class='flag-5'>大型</b>機場<b class='flag-5'>中</b>的應用
    主站蜘蛛池模板: 四虎精品影院永久在线播放| 性free3d| 草逼网址| 34pao强力打造免费永久视频| 91大神免费视频| 亚洲网站在线观看| 狠狠色噜噜狠狠狠97影音先锋| 娇妻被黑人蹂躏| 亚洲a人片在线观看网址| 四虎成人免费影院网址| 日韩欧美亚洲综合一区二区| 免费的黄色大片| 成人a毛片手机免费播放| 新版天堂中文资源8在线| 色综合色综合色综合| 国产午夜精品理论片久久影视| 欧美1819| 综合久久2o19| 色噜噜狠狠狠狠色综合久| 女人特黄大aaaaaa大片| 国产区一区二区三区| 午夜精品在线视频| 国产国产成人人免费影院| 一区中文字幕| 亚洲 欧美 精品| 女人张开腿 让男人桶个爽 免费观看| 国产在线高清精品二区色五郎| 五月天天色| 五月激情网站| 这里只有精品视频| 欧美午夜性刺激在线观看免费| 国产精品不卡片视频免费观看| 天天色天天色天天色| 日韩性插| 亚洲成人三级| 精品在线视频一区| 天天操天天看| 一区二区高清在线| 特级中国aaa毛片| 国产国语videosex另类| 久久看片网|