计算机工程
冯鹏展, 郭程, 郑剑夕, 张桂平
为解决情报采集过程中竞争企业名录的更新问题, 提出了一种基于网络的竞争企业名录自动更新方法。该方法首先利用产品名称从企业索引中检索出相关的企业名列表, 采用LCS(Longest Common Substring)算法抽取企业名模式, 以“产品名+企业名模式”的形式重构查询。然后, 使用搜索引擎进行网页搜索, 再利用贝叶斯分类算法对搜索的网页过滤, 将过滤后的企业信息更新到企业名录中。实验结果显示, 系统P@10、P@20、P@30分别为73.4%, 68.4%, 65.2%, MAP@10、MAP@20、MAP@30分别达到66.2%, 58.9%, 52.5%, 结果说明该方法可以有效的实现竞争企业名录的自动更新。