|本期目录/Table of Contents|

Deep Web站点分类研究进展(PDF)

《安徽大学学报(自然科学版)》[ISSN:1000-2162/CN:34-1063/N]

期数:
2010年01期
页码:
104-109
栏目:
综述
出版日期:
2010-02-01

文章信息/Info

Title:
Advances in Deep Web classification
作者:
陆余良房珊瑶刘金红施 凡
电子工程学院 网络系,安徽 合肥 230037
Author(s):
LU Yuliang FANG Shanyao LIU Jinhong SHI Fan
Department of Network Engineering, Electronic Engineering Institute, Hefei 230037, China
关键词:
Deep Web分类Web挖掘信息集成
分类号:
TP391
DOI:
-
文献标识码:
A
摘要:
如何高效、准确地组织和检索Deep Web蕴含的高质量信息已经成为未来Web挖掘和数据库领域面临的一项崭新课题和挑战,而Deep Web分类则是Deep Web信息检索的基础.该论文综合论述了Deep Web信息集成的研究概况,重点分析了结构化Deep Web分类的主要方法和存在的主要问题,并且讨论了解决这些问题的可能方法;最后对未来工作进行展望.

参考文献/References

[1] Fetterly D, Manasse M, Najork M, et al. A large scale study of the evolution of Web pages[C].Proceedings of the 12th International World Wide Web Conference,Budapest,2003:669-678.
[2]刘伟,孟小峰,孟卫一.Deep Web数据集成研究综述[J].计算机学报,2007,33(9):1475-1489.
[3]Bergman M K. The Deep Web: Surfacing hidden value[J].Journal of Electronic Publishing,2001,7(1):1174-1175.
[4]He B, Patel M, Zhang Z, et al. Accessing the Deep Web: A Survey[J].Communications of the ACM (CACM),2007,50(5):94-101. 
[5]Gravano L, Ipeirotis P G, Sahami M. QProber: A system for automatic classification of hiddenWeb databases[J].ACM TOIS,2003,21(1):1-41.
[6]Barbosa L, Freire J, Silva A. Organizing hiddenWeb databases by clustering visible Web documents[C].Doqac A, ed Proc of the IEEE 23rd Intl Conf on Data Engineering. Istanbul: IEEE Press,2007:326-335.
[7]He B, Tao T, Chang KCC. Organizing structured Web sources by query schemas: A clustering approach[C].Gravano L, ed. Information and Knowledge Management. Washington: ACM Press,2004:22-31. 
[8]He B, Tao T, Chang KCC. Clustering Structured Web Sources: A Schemabased, Modeldifferentiation Approach[C].Proc of the 9th Int Conf on Extending Database Technology. Heraklion: Springer-Verlag,2004:22-31.
[9]Xu Hexiang, Hao Xiulan, Wang Shuyun, et al. A method of deep Web classification[C].Proceedings of the 6th International Conference on Machine Learning and Cybernetics, Hong Kong,2007:19-22.
[10] Gong Zhiguo, Zhang Jingbai, Liu Qian. Automatic hidden Web database classification[J].PKDD 2007, LNAI 4702,2007:454-461.
[11]马军,宋玲,韩晓晖,等.基于网页上下文的 Deep Web数据库分类研究[J].软件学报,2008,19(2):267-274.
[12]王辉,刘艳威,左万利.使用分类器自动发现特定领域的深度网入口[J].软件学报,2008,19(2):246-256.

备注/Memo

备注/Memo:
收稿日期:2009-10-25
作者简介:陆余良(1964—),男,江苏宜兴人,电子工程学院教授,博士生导师.
引文格式:陆余良,房珊瑶,刘金红,等.Deep Web站点分类研究进展[J].安徽大学学报:自然科学版,2010,34(1):103-108.
更新日期/Last Update: 2010-01-15