提交什么样的链接?
1. 请尽量提供文章列表页的链接——简单来说,就是把很多文章排列在一起的页面,一般是某个网站的特定版块,通常有以下特征:
▪ 页面展示多个文章标题,而不会展示大段文字;
▪ 页面的文章标题都带有超链接,点击后会打开或跳转到新网页。
如:从中华人民共和国科学技术部的首页,点击“科技动态”,在浏览器地址栏可获得链接:http://www.most.gov.cn/gnwkjdt/ ,这个链接就是一个文章列表页链接。将这个链接粘贴到「源看板」“定制信源”的添加框内即可。
提交文章列表页链接的好处是,「源看板」能够为您排除冗余信息,只为您精准地抓取您需要的信息。
2. 如果您提交了一个网站的首页链接(如右图),「源看板」会默认为您需要获得该页面所有链接的更新。我们可以为您实现,但是不建议您这么做,因为这等同于您直接在原网站浏览信息,您并不能体验到「源看板」的最佳效果。
3. 特殊情况:有的页面看起来简单清晰,您也可以找到列表页链接,但它其实是由javascript加载的,「源看板」无法为您抓取这样的页面。 这里有一个简单的判定方法:如果不论您点击页面上的哪一个目录条,链接都不改变,那么您基本可以确定该链接是无效的。
如:在列表页 https://navi.cnki.net/knavi/journals/GJXW/detail 之下点击第9期(下左图)和第8期(下右图),可以发现该列表页链接没有任何变化。大概率可以判断,这个页面链接为无效链接,「源看板」无法为您抓取信息。
不过,您也不要灰心,我们发现,这样的页面一般都有另外的入口,您有可能找到可以替代的链接。比如就在这个页面上,我们可以找到“RSS订阅”链接),提交这个链接,「源看板」就能正常为您抓取啦。
「源看板」暂时不能为您获取什么样的链接?
▪ 微信公众号
▪ 微博账号
▪ 客户端(APP)里的页面设有付费墙的内容
需要注册账号、登录账户才能阅读的内容
如果您还有疑问,或者本教程不能解决您的问题,您可以在我要反馈中给我们留言。