本站
非官方網站,
信息完全免費,僅供參考,不收取任何費用,具體請以官網公布為準!
063819 信息檢索技術 32學時/ 2學分
英文譯名:Web Information Retrieval
適用領域:計算機應用技術、計算機軟件與理論
開課單位:計算機科學與技術學院
教學目的:本課程主要目的在于介紹Web信息搜索方面的一些基本知識和研究進展,將以相關經典論文內容作為課程的主要內容,目的在于深入了解相關問題及其解決方案,了解其基本思想和采用的主要手段,希望達到的主要教學目標如下:(1)了解Web信息搜索的基本理論和主要研究進展;(2)培養學生的研究興趣,以及發現問題和解決問題的能力。完成本課程學習后,能夠理解和掌握現有Web信息搜索方面的主要進展,感興趣的同學在老師的指導下可以開展相關的研究工作。
教學方式及學時分配:課堂授課30學時,研討2學時
學時 |
教學內容 |
教學方式 |
2 |
課程介紹、文本檢索、查詢類型 |
授課 |
2 |
文檔索引與詞語加權、相似性函數 |
授課 |
2 |
查詢擴展、檢索的效果、高效的檢索 |
授課 |
2 |
文檔聚類和分類、Web概述、Web爬行器 |
授課 |
2 |
Tag信息和Link信息的使用 |
授課 |
2 |
PageRank算法、HITS算法 |
授課 |
2 |
個性化Web搜索 |
授課 |
2 |
文本過濾 |
授課 |
2 |
數據庫技術在Web搜索方面的應用 |
授課 |
2 |
W3QL、WebSQL、WebSSQL |
授課 |
2 |
搜索引擎評估 |
授課 |
2 |
元搜索引擎 |
授課 |
2 |
數據庫選擇技術 |
授課 |
2 |
文檔選擇技術 |
授課 |
2 |
結果合并技術 |
授課 |
2 |
最新研究進展介紹 |
研討 |
教學主要內容及對學生的要求:本課程要求學生應學習過《數據結構》、《算法設計與分析》、《高等數學》、《概率論》、《圖論》等課程。主要內容包括Web信息檢索相關的主要技術,如文本檢索技術、搜索引擎技術、數據集成技術等。
內容摘要:隨著互聯網的快速發展,Web上的信息正在急速增長,如何更加高效的利用這些信息是人們急需解決的問題,信息檢索也因此成為一個重要的研究領域。課程主要內容分為四大部分:
第一部分,主要介紹文本檢索方面的知識。文本檢索是現代搜索引擎的基礎。本部分的主要內容在于介紹文本檢索的基本概念和技術,如查詢類型、文檔索引和術語加權、相似性函數、檢索的有效性、高效的檢索、文檔聚類、文檔分類等。
第二部分,介紹搜索引擎的相關技術。搜索引擎作為文本檢索理論的實際應用,已經得到快速的發展,成為人們在互聯網上搜索信息的主要工具。本部分將主要介紹搜索引擎相關的內容,如爬行器、標簽信息的使用、鏈接信息的使用、個性化搜索、數據庫方法在Web信息搜索中的應用、搜索引擎的評估等。
第三部分,介紹關于Web數據集成方面的內容。Web數據庫是一種可以基于Web而進行訪問的數據庫,本部分將介紹DBMSE、Web數據庫聚類、Web數據庫搜索接口集成、結果提取和注釋等。
第四部分,以研討的方式介紹當前信息檢索技術的最新研究進展,內容會隨著時間的不同動態變化。
考核方式:作業20%,考試80%
主要參考書目:
[1] 《Information Retrieval》,C. J. van Rijsbergen’s,Butterworths, 1979。
http://www.dcs.gla.ac.uk/Keith/Preface.html
[2] 《Information Retrieval: A Survey》,Ed Greengrass. 2000。
http://www.csee.umbc.edu/cadip/readings/IR.report.120600.book.pdf
[3] 《Introduction to Information Retrieval》,C.D. Manning, P. Raghavan, H. Schütze. Cambridge UP, 2007。http://www-csli.stanford.edu/~schuetze/information-retrieval-book.html