A Study on Integration of Bibliographic Information from Multiple Information Sources

多信息源书目信息整合研究

基本信息

  • 批准号:
    15300084
  • 负责人:
  • 金额:
    $ 8.51万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
  • 财政年份:
    2003
  • 资助国家:
    日本
  • 起止时间:
    2003 至 2005
  • 项目状态:
    已结题

项目摘要

This study aims at developing a bibliographic information integration system which provides with an analysis method for bibliographic information obtained from multiple information sources, robust bibliographic matching function, and efficient information access. In this study, we achieved the following research results.(1)We developed a statistical model for analyzing various kinds of bibliographic strings. The proposed model is based on hidden Markov model and it enables to extract bibliographic components from refer strings. The model has ability to describe error patterns strings, therefore it can be applied reference strings obtained by OCR. We showed that the model can make matching of references strings with the accuracy of about 95% experimentally.(2)We developed an indexing method for searching records from large bibliographic databases. This method uses frequent string patterns appearing in the database and extracts variable n-grams adaptively. By this index, we can merge multiple bibliographic databases efficiently.(3)We developed a method to gather bibliographic data existing in a distributed and autonomous information network. In the proposed method, autonomous systems exchange meta data about bibliographic to discover the cite that holds the desired bibliographic information. In this method, we realized efficient query processing mechanism in autonomous and distributed environment by changing the query processing route adaptively using the meta data.
本研究旨在开发一个书目信息集成系统,为从多个信息源获取的书目信息提供分析方法、强大的书目匹配功能和高效的信息访问。在本研究中,我们取得了以下研究成果:(1)开发了一种用于分析各种书目字符串的统计模型。所提出的模型基于隐马尔可夫模型,它能够从参考字符串中提取书目成分。该模型具有描述错误模式字符串的能力,因此可以应用OCR获得的参考字符串。我们通过实验表明该模型可以以约95%的准确度进行参考文献字符串的匹配。(2)我们开发了一种从大型书目数据库中搜索记录的索引方法。该方法使用数据库中出现的频繁字符串模式并自适应地提取变量n-gram。通过这个索引,我们可以有效地合并多个书目数据库。(3)我们开发了一种收集分布式自治信息网络中存在的书目数据的方法。在所提出的方法中,自治系统交换有关书目的元数据,以发现包含所需书目信息的引用。在该方法中,我们通过使用元数据自适应地改变查询处理路径,实现了自治分布式环境中高效的查询处理机制。

项目成果

期刊论文数量(26)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Replica Placement for Effective Document Sharing Mechanisms in Peer-to=Peer Networks
对等网络中有效文档共享机制的副本放置
テキスト認識エラーモデルによる引用文献文字列からの書誌要素の抽出
使用文本识别错误模型从引用的文档字符串中提取书目元素
A Sequential Labeling Method Using Syntactical and Textual Patterns for Record Linkage
一种使用句法和文本模式进行记录链接的顺序标记方法
Adaptive Replication Method Based on Peer Behavior Pattern in Unstructured Peer-to-Peer Systems
Atsuhiro Takasu: "Bibliographic Attribute Extraction from Erroneous References Based on a Statitical Model"Proc.3^<rd> ACM & IEEE Joint Conference on Digital Libraries. 49-60 (2003)
Atsuhiro Takasu:“基于统计模型的错误参考文献的书目属性提取”Proc.3^<rd> ACM
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

TAKASU Atsuhiro其他文献

TAKASU Atsuhiro的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('TAKASU Atsuhiro', 18)}}的其他基金

A Study on Top-K algorithm for Large Unordered Tree Databases
大型无序树数据库Top-K算法研究
  • 批准号:
    24650042
  • 财政年份:
    2012
  • 资助金额:
    $ 8.51万
  • 项目类别:
    Grant-in-Aid for Challenging Exploratory Research
A Study on Information Alignment by Composite Generative Model
复合生成模型的信息对齐研究
  • 批准号:
    23300040
  • 财政年份:
    2011
  • 资助金额:
    $ 8.51万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
Study on Information Sharing Method by Multiple Latent Topics
多潜在主题信息共享方法研究
  • 批准号:
    19300032
  • 财政年份:
    2007
  • 资助金额:
    $ 8.51万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
A Study on Design and Implementation of Image-Based Scholarly Information System
基于图像的学术信息系统的设计与实现研究
  • 批准号:
    07458076
  • 财政年份:
    1995
  • 资助金额:
    $ 8.51万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了