PUBMED的检索方法

发布时间:2018-06-01   信息来源:暂无

近年来,随着INTERNET的普及,一些机构通过INTERNET提供MEDLINE数据库免费检索服务,如美国国立卫生院提供的PubMed检索系统(http://www.ncbi.nlm.nih.gov/pubmed/)、由广告商提供的HEALTHGATE检索系统(http://www.healthgate/medline/search.html)和MEDSCAPE检索系统(http://www.medscape.com/misc/formmedlineinflive.html/)、HELIX检索系统(http://www.helix.com)、MEDEC检索系统(http://medecinteractive.com/)等、AVICENNA检索系统(http://www.avicenna.com/)等。其中PubMed数据更新快,检索系统比较完善,深受广大医务工作者和图书情报人员的欢迎。但由于不少使用者不熟悉PubMed的使用方法,因而不用或少用,即便使用,检索结果也不太满意。本文拟简要介绍PubMed及其具体操作方法。 
  PubMed检索系统所提供的书目信息数据库主要来源于MEDLINE和PREMEDLINE。其中PREMEDLINE是指将要进入MEDLINE数据库的文献先做成一个数据库,数据为每天更新。PubMed提供了强大的技术支持。使用户可以非常容易地在普通检索界面进行检索(普通检索界面可通过布尔逻辑组配执行高级检索界面的功能)。 

1 主题检索 

  在检索式提问框中输入一个或更多的词,然后按回车键或用鼠标点击`search’按钮,PubMed就会利用`自动词语匹配’功能将重要的词或词组用`AND’组合在一起进行检索。当然,也可使用MeSH/副主题词组配格式(MeSH为Medical Subject Headings的缩写,是美国国立医学图书馆编写的医学主题词表),如neoplasms/diet therapy[mh]**。“自动词语匹配”是检索系统将输入的检索词根据MeSH注释表、期刊名注释表、常用词组表和作者索引进行匹配。 

1.1 MeSH注释表 

  MeSH注释表包括MeSH词、副主题词、MeSH词相关参照(也称款目词)、物质名称、物质名称同义词等。如果输入的检索词在注释表中发现有匹配的词,则该词将被作为MeSH词和自由词(即textword)同时进行检索。例如,如果我们输入Vitamin h,PubMed会这样检索:(“Biotin[MeSH]OR itaminh[tw])——vitamin h是MeSH词Biotin的款目词。 

1.2 期刊名注释表 

  包括期刊名全称、期刊名MEDLINE缩写、ISSN号。例如,如果你输入“New England Journal of Medicine”,PubMed将按“N Engl J Med[ta]”查询。 

1.3 常用词组表 

  如果在MeSH注释表或期刊名注释表中未发现匹配的词,PubMED就会检索来自MeSH、物质名称、题名和文摘中多次出现的常用词组表,例如cold compresses。 

1.4 作者索引 

  如果输入的检索词在以上词表中未找到,且该词后有一或二个字母,PubMed就会查检作者索引。如果在作者索引中仍未找到匹配词,PubMed就将该词组分开并重复上面的查找过程。如果还没有匹配词,PubMed将该词组的每个单词用`AND’组配并在所有字段中查找。 

2 作者姓名检索 

  输入作者姓名时应采用姓+名(名的首字母缩写,不用标点符号)的格式,例如SmithJA。PubMed将自动地截取作者姓名中名的首字母以适应不同的名缩写。如果只输入作者的姓,PubMed会在包括作者字段在内的所有字段进行检索,例如只输入Yang,则PubMed将象下面一样检索:Yin-Yang[mh]或Yang[tw]。此外,如果使用双引号“”将作者的姓全称和名的第一个首字母引起来,并用作者检索字段标识符[au]限制,如“smithj”[au],PubMed将关闭自动截词,且检索姓名中名只有一个字母缩写的作者。 

3 期刊名称检索 

  可以输入期刊名全称检索,如molecular biology of the cell;期刊名MEDLINE缩写名称检索,如molbiolcell;或ISSN号检索,如1059-1524。 
  如果期刊名称正好是医学主题词表(MeSH)中的词,例如genetherapy、science、cell,PubMed会将其当作MeSH词进行检索。因此,在此种情况下应使用期刊名称检索字段标识[ta],如genetherapy[ta]。 
  如果期刊名称是一个单词,也需要使用期刊名称检索字段标识,如scanning[ta],否则会在所有字段检索该词。 
  推荐使用期刊名称全称或MEDLINE缩写形式检索期刊。同时需要注意的是,在以前的引文中,ISSN号是不能保证的。 

4 截词检索 

  在词的末尾加*号,PubMed就会检索出以该词为词根的所有词,例如,staph*,但不包括*号后有一个空格的词组,譬如,infection*包括infections,但不包括infection control。此外,截词检索将关闭自动词语匹配功能,也不能进行扩展检索。如:heart attack*不会匹配MeSH词,也不会扩展检索my-ocardial infarction、myocardial stunning、shock,cardiogenic这些方面的文献。 

5 词组检索(规定PubMed检索一个词组) 

  如果PubMed检索在常用词组列表中已有的词组,如poi-son ivy,PubMed就会把它作为一个词组来检索。但有时Pubmed可能找不到相应的词组,如brca1,此时可通过给一个词组加上双引号,使得PubMed将其当作一个词来进行检索,如“brca1”。需注意的是,使用双引号规定PubMed进行词组检索,PubMed就不会执行自动词语匹配功能和扩展检索功能。 

6 每页显示的文献数量 

  PubMed将检索出的文献记录按每页20条显示(缺省值)。要改变缺省值,单击`number of documents to display perpage’下拉菜单,并选择一个更大的值。 

7 检索时间范围限制 

  使用`entrez date limit’下拉菜单可限制检索时间范围。`entrez date’是引文追加到PubMed数据库的日期。引文以文献记录入库时间顺序显示(倒序)。 

8 检出文献记录显示格式 

  使用“abstract report”(PubMed缺省显示方式)下拉菜单可选择文献记录显示形式。 
  ①文摘报告:包括期刊出处、记录状况、论文名称、非英文文献说明、作者、作者单位、文摘(如有)、出版类型、PubMed和MEDLINE登记号等。 
  ②引文报告:期刊出处、记录状况、论文名称、非英文文献说明、作者、作者单位、文摘(如有)、出版类型、MeSH词、资助号、PubMed和MEDLINE登记号等。 
  ③MEDLINE报告:MEDLINE记录格式,采用二个字母的文献记录字段标识符。 

9 PubMed检索规则与语法 

  ①布尔运算符AND,OR,NOT必须大写,例如,vitaminc OR zinc; 
  ②PubMed从左至右进行布尔运算。不过,你可以通过加圆括符改变运算顺序,如commoncoldAND(vitamincORzinc)。 
  ③指定文献记录字段名称检索,如dna[mh]ANDcrick[au]and1993[dp]。下面列出常用字段名称缩写: 
  DP——出版日期 采用YYYY/MM/DD[DP]格式,如1998/03/06[DP]。输入日期范围则用冒号连接,如1996:1998[DP],1998/01:1998/04[dp] 
  AD——第一作者机构名称、地址、资助号 如LM05545/LM/NLM[ad] 
  AU——作者姓名 如o’brienj[au] 
  TA——期刊名称 包括期刊名全称、简称、ISSN。jbiolchem[ta]或0021-9258[ta] 
  LA——文献出版语言 Chinese[la] 
  MH-Mesh主题词 neoplasms[mh]或neoplasms/dt[mh] 
  PT——出版类型 review[pt] 
  TW——自由词 AA001794[tw] 
  T1——文献标题内自由词leiomyosarcoma[ti] 
  ④经常通过单击Details按钮观察PubMed怎样运算你的检索策略,并不断修正检索策略,以达到最佳检索结果。 

10 PubMed在提供的文献记录中,有些记录中出现有彩色标记的期刊名称缩写按钮,用鼠标点击该按钮,部分期刊将免费提供该记录的全文。 
各数据库简要介绍 
PubMed: 一个关于生物医药科学的检索系统,包括引用,摘要,和杂志的索引术语。它包括直接由出版商提供给NCBI的文献引用以及链接到在出版商网址上的全文的URLs。PubMed包括MEDLINE和PREMEDLINE的完整内容。它还包括一些被MEDLINE认为超出范围的文章和杂志,因此PubMed是比MEDLINE的更大的集合。 
Nucleotides: 该数据库收集了从GenBank, RefSeq和PDB等数据库的所有基因序列。可以用accession number,作者姓名,物种,基因/蛋白名,以及其它的术语来搜索核酸序列记录。如果要检索大量数据,可使用批量Entrez。 
Protein: 由众多数据库组成,如SwissProt, PIR, PRF, PDB,此外还包括GenBank 和RefSeq所注明的编码基因的蛋白质翻译序列。可以用accession number,作者姓名,物种,基因/蛋白名,以及其它术语来搜索蛋白序列记录。如果要检索大量数据,可使用批量Entrez。 
Genome: 该数据库包含超过800种被完整测序物种的基因组序列。其中包括多于500种病毒,25种细菌,酵母,和许多质粒及细胞器等。此外还包括正在测序中的基因组,如人,水稻等。该数据库提供完成的基因组/染色体的图形概览,并可以探究那些逐步细化的区域。也提供那些已经被NCBI工作人员分析过的物种的编码区的摘要和文本表格等。可以通过每个物种的Entrez基因组页面来下载小于350kb的基因组;通过每个物种的Entrez基因组页面上的ftp链接来下载大于350kb的基因组。 
Structure: 又称为MMDB数据库,包含了众多的已由实验确定的生物分子的三维结构。大部分结构数据来自于X射线晶体衍射和NMR核磁共振色谱分析。该数据库来源于Brookhaven蛋白数据库(PDB),只是排除了那些理论推测的结构,并重新组织和验证了这些信息,从而保证在化学和大分子三维结构之间的交叉参考。该数据库还包括以下工具: 
· Cn3D:用于NCBI数据库的结构和序列相似显示工具,它允许观察3-D结构和序列-结构或结构-结构同源比较。Cn3D用起来就象你浏览器上的一个帮助工具。 
· VAST :矢量同源比较搜索工具,一个在NCBI开发的计算算法,用于确定相似的蛋白三维结构。每一个结构的"结构邻居"都是预先计算好的,而且可以通过MMDB的结构概要页面的链接访问。这些邻居可以用来确认那些不能被序列比较识别的远的同源性。 
· VAST 搜索:结构--结构相似搜索服务。比较一个新解出的蛋白结构和在MMDB/PDB数据库中的结构的三维坐标。VAST搜索计算一系列可能会被交互浏览的结构邻居,用分子图形来观察重叠和同源相似。 
PopSet: 该数据库收集了众多的DNA序列,用于分析群体的进化相关性。使用者可通过Sequin软件向GenBank提交序列。 
Taxonomy: 该数据库包含了大于70000个物种的名称和种系,这些物种都至少在遗传数据库中有一条核酸或蛋白序列。可以检索一个特定种或者更高分类(如属,科)的核酸,蛋白,和结构记录。如果有新物种的序列数据被放到数据库中,这个物种就被加到(分类)数据库中。 
OMIM : Online Mendelian Inheritance in Man,经常更新的人类基因和遗传失调的目录,可链接到其它相关的文献参考,序列记录,和相关数据库。

总访问量: 23413

版权所有:南宁市第二人民医院 地址:南宁市江南区淡村路13号 邮编:530031

电话:0771-2246258