版权说明 操作指南
首页 > 成果 > 成果详情

社交网络信息采集技术研究与实现

认领
导出
下载 Link by 中国知网学术期刊 Link by 维普学术期刊 Link by 万方学术期刊
反馈
分享
QQ微信 微博
成果类型:
期刊论文
作者:
周思思;袁晓红
作者机构:
中南林业科技大学计算机与信息工程学院
[周思思; 袁晓红] 中南林业科技大学
语种:
中文
关键词:
网络爬虫;社交网络;web信息抽取
关键词(英文):
AJAX
期刊:
电子世界
ISSN:
1003-0522
年:
2012
期:
4
页码:
40-41
基金类别:
30972362:湖南省教育厅科学研究项目 30972362,31070568:国家自然科学基金 10JJ2020:湖南省自然科学基金重点项目
机构署名:
本校为第一机构
院系归属:
计算机与信息工程学院
摘要:
社交网站作为网络舆情的有效载体,在传播舆情方面有着重要作用。近年迅猛发展起来的微博就是一种典型的社交网站。本文针对微博类网站设计了支持Ajax(Asynchronous Java Scriptand XML)技术的网络爬虫,采用协议驱动和事件驱动结合的采集策略,将爬取分为用户爬取和内容爬取两部分,使用基于模板的抽取方法,实现了对微博数据的成功抽取和存储。抽样结果证明,支持Ajax技术的网络爬虫,较BFS爬虫相比,提高了信息采集的效率和覆盖率。随着DOM Tree复杂度的提高,还有待于设计更高灵活性的网络爬虫。

反馈

验证码:
看不清楚,换一个
确定
取消

成果认领

标题:
用户 作者 通讯作者
请选择
请选择
确定
取消

提示

该栏目需要登录且有访问权限才可以访问

如果您有访问权限,请直接 登录访问

如果您没有访问权限,请联系管理员申请开通

管理员联系邮箱:yun@hnwdkj.com