A Study on Integration of Bibliographic Information from Multiple Information Sources
多信息源书目信息整合研究
基本信息
- 批准号:15300084
- 负责人:
- 金额:$ 8.51万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Scientific Research (B)
- 财政年份:2003
- 资助国家:日本
- 起止时间:2003 至 2005
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
This study aims at developing a bibliographic information integration system which provides with an analysis method for bibliographic information obtained from multiple information sources, robust bibliographic matching function, and efficient information access. In this study, we achieved the following research results.(1)We developed a statistical model for analyzing various kinds of bibliographic strings. The proposed model is based on hidden Markov model and it enables to extract bibliographic components from refer strings. The model has ability to describe error patterns strings, therefore it can be applied reference strings obtained by OCR. We showed that the model can make matching of references strings with the accuracy of about 95% experimentally.(2)We developed an indexing method for searching records from large bibliographic databases. This method uses frequent string patterns appearing in the database and extracts variable n-grams adaptively. By this index, we can merge multiple bibliographic databases efficiently.(3)We developed a method to gather bibliographic data existing in a distributed and autonomous information network. In the proposed method, autonomous systems exchange meta data about bibliographic to discover the cite that holds the desired bibliographic information. In this method, we realized efficient query processing mechanism in autonomous and distributed environment by changing the query processing route adaptively using the meta data.
本研究旨在开发一个书目信息整合系统,提供一个分析方法,从多个信息源获得的书目信息,强大的书目匹配功能,和有效的信息访问。本研究取得了以下研究成果。(1)We开发了一个统计模型来分析各种书目字符串。该模型是基于隐马尔可夫模型,它使参考字符串中提取书目组件。该模型具有描述错误模式串的能力,因此可以应用于OCR获得的参考字符串。实验结果表明,该模型可以实现对引用串的匹配,准确率达到95%左右。(2)We开发了一种从大型书目数据库中检索记录的索引方法。该方法利用数据库中出现的频繁字符串模式,自适应地提取可变n-gram。通过该索引,可以有效地合并多个书目数据库。(3)We开发了一种方法来收集存在于分布式和自治信息网络中的书目数据。在所提出的方法中,自治系统交换有关书目的Meta数据,发现持有所需的书目信息的引用。该方法利用Meta数据自适应地改变查询处理路径,实现了自治分布式环境下高效的查询处理机制。
项目成果
期刊论文数量(26)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Replica Placement for Effective Document Sharing Mechanisms in Peer-to=Peer Networks
对等网络中有效文档共享机制的副本放置
- DOI:
- 发表时间:2004
- 期刊:
- 影响因子:0
- 作者:T.Yamada;K.Aihara;A.Takasu;J.Adachi
- 通讯作者:J.Adachi
テキスト認識エラーモデルによる引用文献文字列からの書誌要素の抽出
使用文本识别错误模型从引用的文档字符串中提取书目元素
- DOI:
- 发表时间:2004
- 期刊:
- 影响因子:0
- 作者:高須淳宏;相原健郎
- 通讯作者:相原健郎
A Sequential Labeling Method Using Syntactical and Textual Patterns for Record Linkage
一种使用句法和文本模式进行记录链接的顺序标记方法
- DOI:
- 发表时间:2005
- 期刊:
- 影响因子:0
- 作者:相澤彰子;大山敬三;高須淳宏;安達淳;Atsuhiro Takasu
- 通讯作者:Atsuhiro Takasu
Adaptive Replication Method Based on Peer Behavior Pattern in Unstructured Peer-to-Peer Systems
- DOI:10.1109/icde.2005.182
- 发表时间:2005-04
- 期刊:
- 影响因子:0
- 作者:Taizo Yamada;K. Aihara;A. Takasu;J. Adachi
- 通讯作者:Taizo Yamada;K. Aihara;A. Takasu;J. Adachi
Atsuhiro Takasu: "Bibliographic Attribute Extraction from Erroneous References Based on a Statitical Model"Proc.3^<rd> ACM & IEEE Joint Conference on Digital Libraries. 49-60 (2003)
Atsuhiro Takasu:“基于统计模型的错误参考文献的书目属性提取”Proc.3^<rd> ACM
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
TAKASU Atsuhiro其他文献
TAKASU Atsuhiro的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('TAKASU Atsuhiro', 18)}}的其他基金
A Study on Top-K algorithm for Large Unordered Tree Databases
大型无序树数据库Top-K算法研究
- 批准号:
24650042 - 财政年份:2012
- 资助金额:
$ 8.51万 - 项目类别:
Grant-in-Aid for Challenging Exploratory Research
A Study on Information Alignment by Composite Generative Model
复合生成模型的信息对齐研究
- 批准号:
23300040 - 财政年份:2011
- 资助金额:
$ 8.51万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
Study on Information Sharing Method by Multiple Latent Topics
多潜在主题信息共享方法研究
- 批准号:
19300032 - 财政年份:2007
- 资助金额:
$ 8.51万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
A Study on Design and Implementation of Image-Based Scholarly Information System
基于图像的学术信息系统的设计与实现研究
- 批准号:
07458076 - 财政年份:1995
- 资助金额:
$ 8.51万 - 项目类别:
Grant-in-Aid for Scientific Research (B)