A fast n-gram full text search independent of document size and it application to a huge text base

独立于文档大小的快速 n-gram 全文搜索及其在庞大文本库中的应用

基本信息

  • 批准号:
    10480082
  • 负责人:
  • 金额:
    $ 7.36万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
  • 财政年份:
    1998
  • 资助国家:
    日本
  • 起止时间:
    1998 至 2001
  • 项目状态:
    已结题

项目摘要

Research results are evaluated as follows:1. Improvement of dynamic n-gram storage structuresThe ratio of improving approaches by Heisei 11, 12 and 13 became 25 %.2. Compression evaluation for postingsExperimental results in the final year reaches 85 % compression to the previous approaches.3. Retrieval Efficiency in partial MatchingThe speed is improved about 30 % for the old in des tables.4. Evaluation of practical text databasesIt is verified that n-gram full text search presented in this search is independent of the size of documents.
研究结果如下:1.动态n-gram存储结构的改进平成11、12和13的改进方法的比例为25%。最后一年的实验结果显示,与以往的方法相比,压缩率达到了85%.部分匹配时的检索效率与原DES表相比,检索速度提高了30%左右.对实际文本数据库的评价验证了本文提出的n-gram全文检索与文档大小无关。

项目成果

期刊论文数量(66)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
森田和宏: "トライ構造を用いた共起情報の効率的検索アルゴリズム" 情報処理学会論文誌. 39・9. 2563-2571 (1998)
Kazuhiro Morita:“使用 trie 结构的共现信息的高效检索算法”,日本信息处理学会汇刊 39・9(1998 年)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
E-S.Atlam: "Similarity Measurement Using Negative Weight Function"Information Processing & Management. (印刷中). (2000)
E-S.Atlam:“使用负权重函数的相似性测量”信息处理和管理(印刷中)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
K.Morita: "A Link Trie Structure of Staring Multi-Attribute"International Journal of Computer Mathematics. 118・2. 145-157 (1999)
K.Morita:“凝视多属性的链接特里结构”国际计算机数学杂志118・2(1999)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
獅々堀正幹: "多属性項目の履歴情報に基づくメイル文書のフィルタリング手法"情報処理学会論文誌. 141・8. 2299-2308 (2000)
Masaki Shisibori:“基于多属性项目的历史信息的电子邮件文档的过滤方法”日本信息处理协会交易141・8(2000)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
S.Lee, J.Aoe: "Extraction of Field coherent passages"Information Processing & Management. 38. 173-207 (2002)
S.Lee,J.Aoe:“场相干段落的提取”信息处理
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

AOE Junichi其他文献

AOE Junichi的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('AOE Junichi', 18)}}的其他基金

A Partial match technique for multi-attribute keys and its text retrieval application
多属性键的部分匹配技术及其文本检索应用
  • 批准号:
    07558273
  • 财政年份:
    1995
  • 资助金额:
    $ 7.36万
  • 项目类别:
    Grant-in-Aid for Scientific Research (A)
A Method of retrieving sentences and its intersection on large text bases
一种基于大文本的句子及其交集检索方法
  • 批准号:
    07680432
  • 财政年份:
    1995
  • 资助金额:
    $ 7.36万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
A Fast Retrieval Algorithm of Trie Structures for a Large Set of Keys
一种大键值Trie结构的快速检索算法
  • 批准号:
    04650317
  • 财政年份:
    1992
  • 资助金额:
    $ 7.36万
  • 项目类别:
    Grant-in-Aid for General Scientific Research (C)
Construction of Context Representations Early Semantic Analysis
上下文表示的构建早期语义分析
  • 批准号:
    01550290
  • 财政年份:
    1989
  • 资助金额:
    $ 7.36万
  • 项目类别:
    Grant-in-Aid for General Scientific Research (C)

相似海外基金

Development of the retrieval method for methane isotopes from the ground-based FTIR mesurements
开发基于地面 FTIR 测量的甲烷同位素反演方法
  • 批准号:
    23K03487
  • 财政年份:
    2023
  • 资助金额:
    $ 7.36万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Development of a Data Retrieval Method with Wide Availability Based on Images by Data Embedding and Image Identification
通过数据嵌入和图像识别开发基于图像的广泛可用性的数据检索方法
  • 批准号:
    20K04476
  • 财政年份:
    2020
  • 资助金额:
    $ 7.36万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Development of new retrieval method of tropospheric ozone from MAX-DOAS measurements and its application to long-term MAX-DOAS measurements in China and Germany for the validation of satellite observations and model results of tropospheric ozone
开发基于 MAX-DOAS 测量的对流层臭氧新反演方法及其在中国和德国长期 MAX-DOAS 测量中的应用,以验证对流层臭氧的卫星观测和模型结果
  • 批准号:
    428994811
  • 财政年份:
    2019
  • 资助金额:
    $ 7.36万
  • 项目类别:
    Research Grants
Development of document retrieval method considering document subject and document structure based on autocorrelation function
基于自相关函数考虑文档主题和文档结构的文档检索方法的开发
  • 批准号:
    16K00160
  • 财政年份:
    2016
  • 资助金额:
    $ 7.36万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Effective document retrieval method of Systematic review for clinical practice guidelines
临床实践指南系统评价的有效文献检索方法
  • 批准号:
    15K08858
  • 财政年份:
    2015
  • 资助金额:
    $ 7.36万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Reconsideration of phase retrieval method for coherent X-ray diffraction imaging
相干X射线衍射成像相位恢复方法的再思考
  • 批准号:
    25400438
  • 财政年份:
    2013
  • 资助金额:
    $ 7.36万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
An Advanced Information Integration and Retrieval Method of Synchronized Multimedia Streams
一种先进的同步多媒体流信息集成与检索方法
  • 批准号:
    23500142
  • 财政年份:
    2011
  • 资助金额:
    $ 7.36万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
A research on automatic component extraction and retrieval method
成分自动提取与检索方法研究
  • 批准号:
    16500022
  • 财政年份:
    2004
  • 资助金额:
    $ 7.36万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
A study of distributed database system architecture and its retrieval method
分布式数据库系统体系结构及其检索方法研究
  • 批准号:
    09680397
  • 财政年份:
    1997
  • 资助金额:
    $ 7.36万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Similarity-based image retrieval method using wavelet transformation and its application to image database of historical objects in Japan
基于相似性的小波变换图像检索方法及其在日本历史文物图像数据库中的应用
  • 批准号:
    07680424
  • 财政年份:
    1995
  • 资助金额:
    $ 7.36万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了