网站导航
联系方式
  • 26621053
  • 252209622
  • 电话:+86(0523)82829310
  • 手机:+86 18651159549
  • Editor@engineeringindex.org
  • 地址:江苏省泰兴市城东新区曾涛路56号
您当前位置:首页 > 新闻动态 > 常见问题主题语言-课外杂谈
发布时间:2012.05.07 新闻来源:google图书-冯白云, 林佳 浏览次数:

主题语言
    用主题词存取(access)文献是最通用,也是最重要的方法,因为人们最关心的是文献所含的主题内容。这种方法称主题法。主题法以主题性质语词作标识符,语词以一定规则、结构形式组成的体系称主题语言.主题词表是主题语言的具体体现。标引与检索应遵循共同语言,就主题法而论,就是必须用同样的语词来表达同一主题概念.词表则是达到此目的的工具,即标引和检索共同遵守的依据。
3.5.1主题语盲类别(本文由www.ei-istp.com整理提供)
    主题语言分为两大类:①自然语言(natural language);②人工语言(artificial language)。人工语言也称受控语言(controlled language)或规范化语言。人工语言又分两类:①标题词语言(subject heading language).它是先组式语言(pre-coordinate language);②叙词语言(descriptor language),它是后组式语言(post-coordinate language).
    上述语言的科学定义、各自特点和优缺点等,非本书议题.理由是:①从检索角度,只需应用检索语言,每一检索体系均有词表和相应的规定.检索时善于杏核词表和规定。做到选词恰当即可。必I须有语言学的荃础,包括形态学、词汇学、句法学、语用学、语义学等.有兴趣深究者可以参考有关语言学或检索语言方面的专著。。此处讨论一些实用性问题,如发展的一般趋势。
3.5.2主题语言发展趋势
    1.自然语盲将是主皿语盲的主流
    自然语言指人类在文化、科学技术等交流中采用的书面或口头语言。在文献信息领城即为著编者在文献中使用的语言.也就是未经规范的语言。但是,严格而言.它也作了一定程度的规范:只限使用实义语词,虚词、介词、冠词、连词等则
被禁用.所以自然语言检索体系都有相应的禁用词表(stop words).
    虽然,自然语言体系存在两大缺点:①词汇的同义、多义、借喻和转义造成词义棋糊含混而引起漏检或误检,②词汇量过多.不易约束.给存取带来困难。但是,这两大缺点是可以克服和弥补的:①通过检索式逻辑组配、位置限定等措施可自行排除歧义等而纠正、弥补部分漏检、误检的可能。②随着计算机存取技术的发展.词汇盆过大并不足为难.而且,自然语言其有专指度高.用户无需查对词表,检索方便.标引费用低(自动标引》;从而大大降低系统的建设费用。综上分析,自然语言必将成为主题语盲的主流.
    自然语言使用极为广泛。例如,CA' Keyword Index" (5. 6. 1节),"CA onCD”的“Word"检索字段(5. 5. 1节),以及数盈众多的全文检索系统等均使用自然语言。
    2.标题词语盲和叙词语官界限日益棋糊
    标翅词语言、叙词语言.相互吸取优点,界限日益模糊。并逐步向叙词语言的形式转化,因此,采用后组式技术实施概念组配.表达检索提问的主题概念是组构规范化词语检索式的基本方法.例如《Ei》的标题表《SHE),自1993年已演变为(Ei Thesaurus)((工程索引叙词表》),《英国国会图书馆标题表)(Library ofCongress Subject Headings),其特征、体例和使用方法,与《Ei Thesaurus),( INSPEC Thesaurus)等叙词表毫无两致。美国(化学文摘)(CA)的《普通主题标题等级表》(Hierachies of General Subject Headings),就其名称似乎是标题词语言,实质上,它与《INSPEC Thesaurus》的《Hierachical Display of Thesaurus Terms》的性质完全一样,是叙词表中以族首词字顺排列的词族等级表。上述例子充分说明了叙词语言及其词表已成为规范化语言的主体。
    3.逻辑组配
    计算机检索功能可允许不同检索字段间掩索词的逻辑组配,这样促成了自然语育与规范化语言(叙词)间逻辑组配的正确运用.可以进一步协调查全率与查准率的相互关系,达到优化检索的效果。
本文由EI检索www.ei-istp.com整理提供,出自google图书-冯白云, 林佳