科研管理中文献自动跟踪系统的开发Development of document tracing system in scientific research management
赵海军,李欣,杨炳儒
摘要(Abstract):
提出一种基于搜索词位置信息的搜索方法,在此基础上确立Web文献自动跟踪系统的开发过程为:用户输入搜索词,并对部分返回结果进行阅读、评价,系统据此分析用户的偏好与需求,然后按照用户设定的主题扫描间隔自动搜索相关文章,并把用户读过的文章、待读的文章、新发现的文章都清晰标明.这种算法能节约读者大量的查找、阅读的时间,适合各种人士使用.本算法也可能用于个性化智能搜索引擎的开发.
关键词(KeyWords): 个性化搜索引擎;位置信息向量;文献跟踪
基金项目(Foundation): 天津师范大学博士基金项目(52LX20);; 天津市教委基金项目(20070405)
作者(Author): 赵海军,李欣,杨炳儒
参考文献(References):
- [1]GUTHRIEWalker,GUTHRIELouise,WALKERElbert.Doc-umentClassification byMachine,Theoryand Practice Proceed-ings of COLING 94[C]//Proceedings of the 15th InternationalConference on Computational Linguistics.1994:1 059-1 063.
- [2]MCCALLUMAndrew,NIGAMKamal.A comparison of eventmodels for naive bayes text classification[C]∥AAAI/ICML-98Workshop on Learningfor Text Categorization,Portland:AAAIPress,1998.
- [3]KWON Oh-Woog,LEE Jong-Hyeok.Text categorizationbased on k-nearest neighbor approach for Web site classifica-tion[J].Information Processing and Management,2003,39(1)25-44.
- [4]TONG Simon,KOLLER Daphne.Support Vector Machine ac-tive learning with applications to text classification[J].JournalofMachine LearningResearch,2002,(2):45-66.
- [5]诗洁斌.基于概率神经网络的文本自动分类研究[J].情报学报,2004,23(2):147-151.