在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

您好,歡迎來電子發燒友網! ,新用戶?[免費注冊]

您的位置:電子發燒友網>源碼下載>數值算法/人工智能>

一種新聞關鍵信息的提取算法

大小:0.87 MB 人氣: 2017-12-13 需要積分:0

  針對網頁正文提取算法缺乏通用性,以及對新聞網頁的提取缺乏標題、時間、來源信息的問題,提出一種新聞關鍵信息的提取算法newsExtractor。該算法首先通過預處理將網頁轉換成行號和文本的集合,然后根據字數最長的一句話出現在新聞正文的概率極高的特點,從正文中間開始向兩端尋找正文的起點和終點提取新聞正文,根據最長公共子串算法提取標題,構造正則表達式并以行號輔助判斷提取時間,根據來源的格式特點并輔以行號提取來源;最后構造了數據集與國外開源軟件newsPaper進行提取準確率的對比實驗。實驗結果表明,newsExtractor在正文、標題、時間、來源的平均提取準確率上均優于newsPaper,具有通用性和魯棒性。

一種新聞關鍵信息的提取算法

非常好我支持^.^

(0) 0%

不好我反對

(0) 0%

      發表評論

      用戶評論
      評價:好評中評差評

      發表評論,獲取積分! 請遵守相關規定!

      ?
      主站蜘蛛池模板: 国内精品视频在线| 亚洲伊人久久在| 网友偷自拍原创区| 免费视频在线看| 爽死你个放荡粗暴小淫视频| 黄色在线观看视频| 三级视频欧美| 亚洲综合色婷婷在线观看| 亚洲美女视频一区二区三区| 同性同男小说肉黄| ak福利午夜在线观看| 色天天综合网| 夜夜爽夜夜| 99色在线| 国产一区二区高清在线| 欧美色影视| 色噜噜狠狠色综合欧洲selulu| 直接在线观看的三级网址| 亚洲一区二区中文字5566| 欧美高清xx| ww在线观看| 国产成人一级片| 好吊色7777sao在线视频观看| 色视频免费在线| 俺要操| 亚洲一级视频在线观看| 直接看的黄色网址| 日本黄色一区| 免费国产在线视频| 免费黄色| 999毛片免费观看| 黄色网址免费在线| 亚洲黄网免费| 高h道具触手play肉男男| 久久精品视频热| 国产日本久久久久久久久婷婷| 香蕉色网| 日本色色图| 免费番茄社区性色大片| 99九九成人免费视频精品| 激情综合五月天丁香婷婷|