本站
非官方網站,
信息完全免費,僅供參考,不收取任何費用,具體請以官網公布為準!
063819 信息檢索技術 32學時/ 2學分
英文譯名:Web Information Retrieval
適用領域:計算機應用技術、計算機軟件與理論
開課單位:計算機科學與技術學院
教學目的:本課程主要目的在于介紹Web信息搜索方面的一些基本知識和研究進展,將以相關經典論文內容作為課程的主要內容,目的在于深入了解相關問題及其解決方案,了解其基本思想和采用的主要手段,希望達到的主要教學目標如下:(1)了解Web信息搜索的基本理論和主要研究進展;(2)培養學生的研究興趣,以及發現問題和解決問題的能力。完成本課程學習后,能夠理解和掌握現有Web信息搜索方面的主要進展,感興趣的同學在老師的指導下可以開展相關的研究工作。
教學方式及學時分配:課堂授課28學時,研討4學時
學時 |
教學內容 |
教學方式 |
2 |
課程介紹、布爾模型與索引 |
授課 |
2 |
互聯網網頁下載/網絡爬蟲、分詞、詞典與索引 |
授課 |
2 |
詞匯表和倒排記錄表 |
授課 |
2 |
語義網、本體 |
授課 |
2 |
本體學習 |
授課 |
2 |
詞典的數據結構、詞項定位的數據結構 |
授課 |
2 |
詞項定位的數據結構、通配查詢處理、輪排索引、k-gram索引 |
授課 |
2 |
編輯距離、拼寫校正、Soundex |
授課 |
2 |
文檔評分詞項權重 |
授課 |
2 |
向量空間模型 |
授課 |
2 |
搜索系統的評分 |
授課 |
2 |
文檔聚類和分類 |
授課 |
2 |
Web概述及搜索基礎 |
授課 |
2 |
PageRank算法 |
授課 |
2 |
最新研究進展介紹 |
授課 |
2 |
最新研究進展介紹 |
研討 |
教學主要內容及對學生的要求:本課程要求學生應學習過《數據結構》、《算法設計與分析》、《高等數學》、《概率論》、《圖論》等課程。主要內容包括Web信息檢索相關的主要技術,如文本檢索技術、搜索引擎技術、容錯式檢索技術等。
內容摘要:隨著互聯網的快速發展,Web上的信息正在急速增長,如何更加高效的利用這些信息是人們急需解決的問題,信息檢索也因此成為一個重要的研究領域。課程主要內容分為四大部分:
第一部分,主要介紹文本檢索方面的知識。文本檢索是現代搜索引擎的基礎。本部分的主要內容在于介紹文本檢索的基本概念和技術,如布爾模型、分詞、詞典與索引、詞匯表和倒排記錄表等。
第二部分,介紹搜索引擎的相關技術。搜索引擎作為文本檢索理論的實際應用,已經得到快速的發展,成為人們在互聯網上搜索信息的主要工具。本部分將主要介紹搜索引擎相關的內容,如互聯網網頁下載/網絡爬蟲、語義網、本體、搜索系統的評分、PageRank算法等。
第三部分,介紹關于搜索系統中容錯式檢索方面的內容。用戶在使用檢索系統時,有時在檢索中存在拼寫錯誤或不明確檢索結果時,檢索系統如何提供魯棒性處理和通配符查詢,本部分將介紹通配查詢處理、輪排索引、k-gram索引、編輯距離、拼寫校正、Soundex等。
第四部分,以研討的方式介紹當前信息檢索技術的最新研究進展,內容會隨著時間的不同動態變化。
考核方式:考試或報告100%
主要參考書目:
[1] 《信息檢索導論》,王斌(譯),2010,人民郵電出版社。
[2] 《Information Retrieval》,C. J. van Rijsbergen’s,Butterworths, 1979。
http://www.dcs.gla.ac.uk/Keith/Preface.html
[3] 《Information Retrieval: A Survey》,Ed Greengrass. 2000。
http://www.csee.umbc.edu/cadip/readings/IR.report.120600.book.pdf
[4] 《Introduction to Information Retrieval》,C.D. Manning, P. Raghavan, H. Schütze. Cambridge UP, 2007。http://www-csli.stanford.edu/~schuetze/information-retrieval-book.html