首頁(yè) > 學(xué)術(shù)論文

基于用戶行為分析的核能領(lǐng)域垂直檢索系統(tǒng)研究

來(lái)源:論文學(xué)術(shù)網(wǎng)
時(shí)間:2024-08-18 12:23:19
熱度:

基于用戶行為分析的核能領(lǐng)域垂直檢索系統(tǒng)研究【摘要】:中國(guó)核網(wǎng)具有資訊及時(shí)、信息全面的特點(diǎn)。如何從雜亂無(wú)章的龐大數(shù)據(jù)和強(qiáng)干擾的信息中搜索出有價(jià)值的核能信息,這對(duì)人類的智能信息處理能力

【摘要】:中國(guó)核網(wǎng)具有資訊及時(shí)、信息全面的特點(diǎn)。如何從雜亂無(wú)章的龐大數(shù)據(jù)和強(qiáng)干擾的信息中搜索出有價(jià)值的核能信息,這對(duì)人類的智能信息處理能力提出了挑戰(zhàn)。由于網(wǎng)絡(luò)資源的復(fù)雜性,通用搜索引擎已經(jīng)不能滿足用戶信息檢索的準(zhǔn)確性需要。為了更及時(shí)、更精準(zhǔn)地獲取核能信息與核能數(shù)據(jù),為中國(guó)核網(wǎng)高效及時(shí)提供精準(zhǔn)的數(shù)據(jù)素材,保證這一核能領(lǐng)域門戶網(wǎng)站的數(shù)據(jù)及時(shí)性、精確性、全面性。本文針對(duì)核能領(lǐng)域海量數(shù)據(jù)的高效獲取、深度分類和信息檢索開(kāi)展研究。本文首先研究了針對(duì)核能領(lǐng)域?qū)S脭?shù)據(jù)的主題爬蟲,實(shí)現(xiàn)了對(duì)核能主流數(shù)據(jù)的抓取、去噪。其次,基于支持向量機(jī)(Support Vector Machine)技術(shù)和IKAnalyzer分詞技術(shù)對(duì)已爬取的海量數(shù)據(jù)按照中國(guó)核網(wǎng)的頻道進(jìn)行分類。最后,針對(duì)中國(guó)核網(wǎng)用戶來(lái)源、搜索行為具有較為明顯的聚類特性,對(duì)Lucene框架的檢索排序算法進(jìn)行改進(jìn),提出一種基于用戶行為分析的檢索排序算法,該算法很大程度上提高了搜索引擎的查詢效率,為中國(guó)核網(wǎng)提供更有效、更精確的核能信息。相似度評(píng)分算法是全文信息檢索的核心步驟,能夠高效的對(duì)返回結(jié)果進(jìn)行展示。本文對(duì)Lucene內(nèi)部相似度評(píng)分算法進(jìn)行研究之后,針對(duì)Lucene內(nèi)部相似度排序算法僅考慮查詢?cè)~出現(xiàn)頻率而未考慮潛在用戶心理這一問(wèn)題,本文實(shí)現(xiàn)了面向核能領(lǐng)域的垂直檢索系統(tǒng),該系統(tǒng)基于改進(jìn)的相似度評(píng)分算法,并且能夠通過(guò)對(duì)用戶最近一段時(shí)間內(nèi)的檢索與點(diǎn)擊行為進(jìn)行分析,獲取一組用戶偏好關(guān)鍵詞,對(duì)查詢?cè)~與偏好關(guān)鍵詞進(jìn)行組合評(píng)分。論文實(shí)驗(yàn)表明,該系統(tǒng)能夠高效獲取核能領(lǐng)域信息,并在保證正確率的情況下對(duì)信息進(jìn)行分類,有效節(jié)約人力資源。通過(guò)對(duì)爬取的數(shù)據(jù)索引并驗(yàn)證其檢索性能,可知改進(jìn)相似度評(píng)分算法對(duì)檢索時(shí)間延長(zhǎng)30-40ms,卻在在大眾用戶接受時(shí)間內(nèi),但該算法對(duì)搜索結(jié)果質(zhì)量有一定提高。 【關(guān)鍵詞】:用戶行為分析 相似度評(píng)分算法 支持向量機(jī) 信息檢索系統(tǒng)
【學(xué)位授予單位】:合肥工業(yè)大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2015
【分類號(hào)】:TP391.3
【目錄】:
  • 致謝7-8
  • 摘要8-9
  • ABSTRACT9-14
  • 第一章 緒論14-19
  • 1.1 研究背景14-15
  • 1.2 國(guó)內(nèi)外研究現(xiàn)狀15-17
  • 1.3 論文主要研究?jī)?nèi)容17-18
  • 1.4 本文組織結(jié)構(gòu)18-19
  • 第二章 信息檢索系統(tǒng)關(guān)鍵技術(shù)19-29
  • 2.1 信息檢索系統(tǒng)概述19-24
  • 2.1.1 信息檢索模型19-20
  • 2.1.2 倒排索引表20-22
  • 2.1.3 全文檢索22-24
  • 2.2 網(wǎng)絡(luò)爬蟲技術(shù)24
  • 2.3 中文分詞技術(shù)24-25
  • 2.4 文本相似度計(jì)算方法25-26
  • 2.5 系統(tǒng)流程26-27
  • 2.6 本章小結(jié)27-29
  • 第三章 面向中國(guó)核網(wǎng)的數(shù)據(jù)爬取和文本分類29-44
  • 3.1 核能領(lǐng)域數(shù)據(jù)獲取與處理30-31
  • 3.1.1 數(shù)據(jù)獲取30-31
  • 3.1.2 數(shù)據(jù)處理31
  • 3.2 支持向量機(jī)理論31-36
  • 3.2.1 文本分類32
  • 3.2.2 線性可分問(wèn)題32-35
  • 3.2.3 線性不可分問(wèn)題35-36
  • 3.2.4 核方法36
  • 3.3 基于支持向量機(jī)理論的文本分類系統(tǒng)實(shí)現(xiàn)36-43
  • 3.3.1 分類器訓(xùn)練37-42
  • 3.3.2 文本分類42-43
  • 3.4 本章小結(jié)43-44
  • 第四章 基于用戶行為分析的垂直檢索系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)44-55
  • 4.1 基于用戶行為分析的相似度評(píng)分算法45-48
  • 4.1.1 用戶行為定義45-46
  • 4.1.2 用戶行為分析46-48
  • 4.1.3 相似度評(píng)分算法48
  • 4.2 垂直檢索系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)48-51
  • 4.3 系統(tǒng)運(yùn)行結(jié)果與分析51-54
  • 4.3.1 實(shí)驗(yàn)結(jié)果51-52
  • 4.3.2 排序效果測(cè)試52-53
  • 4.3.3 搜索速度比較53-54
  • 4.4 本章小結(jié)54-55
  • 第五章 總結(jié)與展望55-57
  • 5.1 論文工作總結(jié)55-56
  • 5.2 未來(lái)工作展望56-57
  • 參考文獻(xiàn)57-60
  • 攻讀碩士學(xué)位期間的學(xué)術(shù)活動(dòng)及成果情況60-61


您可以在本站搜索以下學(xué)術(shù)論文文獻(xiàn)來(lái)了解更多相關(guān)內(nèi)容

用戶行為分析系統(tǒng)在寬帶網(wǎng)絡(luò)中的應(yīng)用    馬維亮;

基于用戶行為的3G業(yè)務(wù)分析與探討    喬志偉;

基于用戶行為分析的廣告欺詐點(diǎn)擊檢測(cè)    龔尚福;姜曉旭;

基于云計(jì)算的移動(dòng)互聯(lián)網(wǎng)大數(shù)據(jù)用戶行為分析引擎設(shè)計(jì)    陶彩霞;謝曉軍;陳康;郭利榮;劉春;

社會(huì)網(wǎng)絡(luò)服務(wù)及其用戶行為分析    毛承潔;張龍;龐川;陳潔敏;

基于CDMA2000 1x EVDO網(wǎng)絡(luò)的用戶行為分析模型設(shè)計(jì)    雒江濤;胡燕清;徐孝娜;周進(jìn)艷;

有線電視用戶行為分析實(shí)踐    許春玲;范志剛;鄭小盈;李明齊;

一種移動(dòng)互聯(lián)網(wǎng)用戶行為分析系統(tǒng)的頂層設(shè)計(jì)    李朝陽(yáng);謝傳中;

大數(shù)據(jù)時(shí)代的信息用戶行為分析    劉英梅;

寬帶上網(wǎng)用戶行為分析    陸群峰;

移動(dòng)互聯(lián)網(wǎng)用戶行為分析系統(tǒng)技術(shù)架構(gòu)淺析    趙勇;

基于云計(jì)算的可重構(gòu)移動(dòng)互聯(lián)網(wǎng)用戶行為分析系統(tǒng)的設(shè)計(jì)    馮銘;王保進(jìn);蔡建宇;

網(wǎng)絡(luò)搜索引擎用戶行為分析和研究    岑榮偉;劉奕群;張敏;茹立云;馬少平;

轉(zhuǎn)變運(yùn)維模式,迎接移動(dòng)互聯(lián)網(wǎng)新挑戰(zhàn)    趙艷梅;朱曉燕;

用戶行為分析在網(wǎng)絡(luò)信息檢索中的應(yīng)用概述    劉奕群;張敏;馬少平;

基于位置軌跡加權(quán)網(wǎng)絡(luò)圖的用戶行為分析識(shí)別算法    毛翔博;齊觀德;李石堅(jiān);潘綱;

基于用戶行為分析的移動(dòng)終端偏好模型研究    爾古打機(jī);蘇小龍;朱征;

IP網(wǎng)絡(luò)用戶行為分析方法的探討    譚景華楊國(guó)良

建設(shè)用戶行為分析智慧模型    本報(bào)記者 逄丹

重慶電信建成寬帶用戶行為分析系統(tǒng)    李中朝通訊員 黃偉

新媒體系統(tǒng)中用戶行為分析與系統(tǒng)設(shè)計(jì)    王琪

移動(dòng)用戶網(wǎng)絡(luò)行為分析與預(yù)測(cè)方法研究    羅海艷

網(wǎng)絡(luò)用戶行為分析的若干問(wèn)題研究    劉鵬

基于流量監(jiān)測(cè)的網(wǎng)絡(luò)用戶行為分析    延皓

根據(jù)多維特征的網(wǎng)絡(luò)用戶分類研究    竇伊男

基于用戶行為分析的搜索引擎評(píng)價(jià)研究    岑榮偉

基于Web日志的用戶行為分析系統(tǒng)的研究與實(shí)現(xiàn)    江惠彬

基于用戶行為分析的冰箱設(shè)計(jì)研究    李亞飛

基于網(wǎng)絡(luò)用戶行為分析的用戶推薦反饋系統(tǒng)的設(shè)計(jì)    石釗

基于移動(dòng)校園應(yīng)用的用戶行為分析及性能改進(jìn)    李婷蔚

基于Hadoop的用戶行為分析系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)    王穎穎

聚類算法及其在校園網(wǎng)用戶行為分析中的應(yīng)用    馬仕玉

基于用戶行為分析的核能領(lǐng)域垂直檢索系統(tǒng)研究    徐娟

基于興趣分類的用戶行為分析系統(tǒng)的研究與設(shè)計(jì)    周岳

移動(dòng)互聯(lián)網(wǎng)的用戶行為分析系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)    鄭桂鳳

基于移動(dòng)社會(huì)網(wǎng)絡(luò)的用戶行為分析    魏彥鵬