中科大《文献管理与信息分析》第六周笔记——文献数据库简介

文献检索的前中后

  • 检索前
    • 去哪儿检索?需要了解哪些数据库?数据库与SE的异同?
    • 不同数据库的定位不同,WOS
    • 检索的目标:了解?全面调研?追踪?综述?寻找新思路?
    • 文献酵素的一些基本概念:JCR、IF
  • 检索中
    • 选择数据可,如何检索(基本使用技巧),逻辑关系,检索命令,通配符
    • 关键词的选取
    • 检索完还能做什么?精炼与分析
  • 检索后
    • 如何处理检索到的文献,如何阅读,如何管理
    • 文献的评价:如何选择需要阅读的文献

检索前——理解数据库

1、寻找解决问题的方法

  • 目标清晰
  • 广而精确,同时要识别信息来源的可靠性
  • Google 百度 数据库
  • 书籍:一个领域的新方法,另一个领域可能已经非常成熟了(近些年生命科学的交叉)
  • 要注意关键词的多种表述形式,你用的关键词可能不准确

2、了解一个技术发展趋势

  • 直接检索+分析
  • 引文检索,查看这篇文章被引用的情况

3、综合了解一个领域的情况

  • 关键词的确定-从混沌到明确,关键词分析
  • Topic检索+分析(重点:理解数据库如何帮助我们快速找到文献)

数据库不是搜索引擎的子集,很多数据库搜索引擎并没有权限收集,所以只能说数据库与SE有交集

数据库导航-不同专业应该了解的数据库

检索中——数据库使用方法

检索提问式

  • 布尔逻辑符 AND、OR、NOT
  • Wildcards通配符
    • *:代表零或多个字符,比如lo*就可以代表love、logistic等等
    • $:代表零或一个字符,比如hell$就可以代表hell、hello等等
    • ?:只代表一个字符,比如compu?er,就会搜索compu?er导数第三个字符不确定的所有关键词
  • Exact Search近似检索
    • 词组检索:“” (跟搜索引擎一样,检索词组)
    • SAME:SAME算符连接的关键词必须在同一句话内,但出现的前后书序不变
  • 逻辑算符的先后顺序 ()>SAME>NOT>AND>OR

这个的使用也很简单,以在Web of Science数据库中搜索为例

(SGD OR QSGD) SAME ((ReLu OR logistic) AND convergence)

就是寻找用的SGD或QSGD算法研究ReLu或logistic函数的收敛性的文章,因为要用的是Topic搜索,因此他搜索了标题,摘要,关键词等等。

搜索结果为

还是挺符合预期的

如何选择关键词

  • 搜索引擎大致了解,敲定关键词
  • 初步检索
  • 关键词统计分析(后来会讲到)
  • 由一篇重要文献出发
  • 未来的趋势,可能就不需要关键词,利用自然语言处理技术,描述一段话即可。

推荐几个下载论文全文的工具

1、SCI-HUB

一个漂亮小姐姐觉得那些期刊数据库管理商太黑了,如果个人要买的话,一篇文章要几美元或者几十美元,超级贵。所以就开发了一个搜集数据库文献的爬虫,使用买了数据库权限的学校的网络下载了大部分论文全文,提供全世界的科研工作者下载

这个种行为从法律上来说侵犯知识产权,违法的,所以它的域名经常被封。

但从学术发展上来说,这无疑是推动科研发展的巨大引擎,因为由于数据库管理商的垄断,如果要买论文,实在是太贵了。如果这个工具没出现,可能很多论文都下载不了。

这里有个检测SCI-HUB可用域名的网站或者自行Google

2、Kopernio插件

Kopernio可以在国内访问,在官网上就可以直接安装插件

插件安装的时候需要访问Google扩展商店,这一步需要翻墙,但在搜索引擎那一周笔记中已经介绍了怎么访问Google系网站,可以直接安装

如果不能再网上直接安装直接搜索kopernio install manually,第一个就是教怎么手动安装的。

安装完就会弹出注册界面,需要填邮箱,最重要的是填学校

这个插件的原理是点击论文之后,利用你们学校的校园网搜索全文的,如果你们学校买的数据库里有这个论文,就能获得全文,如果没有,他回去开源数据库找,如果真没有,就获取不到全文。

所以这个是合法的,被Web of Science收购了。在Web of Science,Google Scholar,PubMed等数千个学术网站都能使用。

论文检索实战演示

其他的功能还是得自己多用用,多点点。

几个指标

JCR(Journal Citation Report,期刊引用报告)

JCR=引用数/文章数

h-Index

有几篇论文的引用次数超过了几次

SJR(SCImago Journal Rank)

使用的是期刊引证报告JCR的原始数据,计算公式比较复杂

SCOPUS数据库

和Web of Science一样,也是一个全科数据库

SCOPUS数据库号称是最大的摘要和引用数据库,它拥有更多新的、不同分类的期刊,也使更多期刊能被纳入科学期刊排名的范围。相对于web of science数据库,SCOPUS数据库收录了大量的非英语期刊,全部期刊数已经接近20000种。

使用方式与Web of Science差不多,但很遗憾,我们学校没有买这个数据库。如果买了的话也一定非常好用。

前沿在哪里?什么课题值得做?

  • 新闻报道
  • Hot paper(近两年高引文章)
  • 自然科学基金资助项目
  • 国家发布的科研课题申请指南
  • 海沿全球科研项目数据库
  • 跟踪牛人实验室(高产,高影响力,首席,特邀报告人)
  • 参加高质量学术会议