Hom's Blog


DOI-PMID-PMCID转换

PMID

PMID是在PubMed中使用的文章ID号, 在pubmed中搜索出来的结果都有一个PMID号.是一个数字串, 例如 24936230.

PubMed为啥不用DOI呢? 因为有的PubMed结果是没有DOI号的, 例如 3940185.

Pubmed网址后面加上PMID就是对应的记录了, 如http://www.ncbi.nlm.nih.gov/pubmed/24936230, 但如果要用DOI对应网址, 就要加个搜索项?term=doi: http://www.ncbi.nlm.nih.gov/pubmed/?term=10.1021/ml100016x.

一部分DOI在PubMed中都是收录有的, 但一些和生命医学无关的估计就没有被收录了, 例如数学的.. 一般的PMID都有DOI, 除了极少数例外没有.

PMCID

PMCID是PubMed Central中使用的ID, 由PMC前缀和一个数字串组成, 例如 PMC2883744.

PMC是提供免费 NIH/NLM 生物医学和生命科学全文文献的数据库, 至今提供300多万篇全文(写的那天). 欧洲也有Europe PMC提供全文下载.

PMCID都有PMID对应, 基本是PMID的子集. 和DOI的关系和上面一样啦, 基本有PMCID的都有DOI.

MID: NIHMSID 和 EMSID

这两个ID是类似的, MS就是 Manuscripts的缩写, 就是提供的是作者手稿版而非正式出版的版本. NIHMSID主要是NIH提供的, EMSID就是欧洲那边提供的. MID可以说是统称吧.

  • ID格式前者是NIHMS数字串, 后者往往是UKMS数字串, 两者数字串往往不一致! 如果一篇PMCID提供了MS的记录, 往往就是草稿版…
  • 他们对应的网址和PMC的差异在于多了个mid/, 例如 http://www.ncbi.nlm.nih.gov/pmc/articles/mid/NIHMS198092, 同理欧洲的也是.
  • PDF对应地址始终使用PMCID对应的地址, 所以需要转换回去PMCID.

NIHMSID和EMSID都有对应的PMCID, 所以也会有对应的PMID咯.

ID格式转换

在线转换: PMID-PMCID-DOI-ManucriptID Converter

  • 支持ID格式: 这个格式转换器可以转换PMID, PMCID, DOI, MID (NIHMSID或EMSID)
  • 结果格式: 结果可以是HTML (缺省格式), XML, JSON, CSV格式~~很强大. JSON的话会在['records'][num]['pmid']这样.

可以进行相同格式的多个ID的转换, 最多一次200个. 每个结果要是json就是在['records'][num] 对应的num处.

API: ID-converter-API

这个API提供接口提供方便的转换, 主网址是http://www.ncbi.nlm.nih.gov/pmc/utils/idconv/v1.0/

  • 像URL的GET接受查询, 所以格式就是主网址?参数名=参数值&下一参数名=参数值, 例如转换一个ID获取JSON格式: http://www.ncbi.nlm.nih.gov/pmc/utils/idconv/v1.0/?ids=10.1021/ml100016x&format=json
  • 搜索支持doi/pmid/pmcid/mid, 返回结果主要有PMID/PMCID/DOI. MID藏在['versions']里头(因为可能有多个MID)!
  • 如果文章embargo, 就是还没能用要等一段时间后才可以, 结果里面会有live="false" release-date=某个时间. 如果文章有了草稿, 迟点还会有正式出版全文, 就会在version里面某个version出现上述属性.

参数名

  • ids: 可以使用doi/PMID/PMCID/MSID/PMC版本ID等. 如果想查询多个, 使用,分隔每个ID.
  • format: 返回格式, xml(默认),html,json,csv
  • idtype: id类型, auto/pmid/pmcid/doi/mid. 一般不指定(默认auto)
  • versions: 是否显示versions, yes或者no. 默认yes 更多介绍参看官方吧.

FTP服务

官方介绍, PMC的FTP地址: ftp://ftp.ncbi.nlm.nih.gov/pub/pmc

OA web service

用来查询PMC的FTP存放的API. 注意只针对Open Access的, 例如ACS的一些在PMC有的文献并不能从这里找到.

API网址: http://www.ncbi.nlm.nih.gov/pmc/utils/oa/oa.fcgi. 返回结果xml.

  • 查询词 id=PMCID
  • 返回record里头文件格式: format=pdf 过滤出pdf;
  • 上传日期过滤 from/until 日期格式from=2013-01-01+08:00:00 或者2013-01-01.
  • resumptionToken 最多出来1000个结果, 随后的需要使用resumptionToken 来翻页.


◆ 本文地址: http://platinhom.github.io/2015/12/31/doi-pmid-pmcid/, 转载请注明 ◆

前一篇: 以正确的方式开源Python项目(ZZ)
后一篇: Python:virtualenv


Contact: Hom / 已阅读()
Source 类别: IT  标签: Internet