A Method of retrieving sentences and its intersection on large text bases

一种基于大文本的句子及其交集检索方法

基本信息

  • 批准号:
    07680432
  • 负责人:
  • 金额:
    $ 1.6万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
  • 财政年份:
    1995
  • 资助国家:
    日本
  • 起止时间:
    1995 至 1997
  • 项目状态:
    已结题

项目摘要

Storing and retrieving an useful text is animportant task in document management systems because text retrieval is the most time-consuming part of them. Inverted filing is a well-knownapproach, but there are some problems when storing a huge number ofsentences. They arise when the intersection is computed for large postings indexed by terms, or keywords. Moreover, disk access for postings also takes a lot of time in this situation. This research presents a technique fo rthe storing of multi-stages of postings and retrieving them partly in order to compute efficiently the intersection between postings for the requested terms. From the simulation results, it is shown that the presentedalgorithm is 6 to 88 times faster than the traditional approach.
存储和检索有用的文本是文档管理系统中的一项重要任务,因为文本检索是其中最耗时的部分。倒排归档是一种众所周知的方法,但在存储大量句子时存在一些问题。当计算按术语或关键字索引的大型帖子的交集时,就会出现这种情况。此外,在这种情况下,用于过帐的磁盘访问也需要花费大量时间。这项研究提出了一种存储多阶段帖子并部分检索它们的技术,以便有效计算所请求术语的帖子之间的交集。仿真结果表明,该算法比传统方法快 6 至 88 倍。

项目成果

期刊论文数量(27)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
T.Arita, M.Shishibori and J.Aoe: "An Efficient Algorithm for Full Text Retrieval for Multiple Keywords" International Journal of Information Sciences. Vol.104. 345-362 (1988)
T.Arita、M.Shishibori 和 J.Aoe:“多关键词全文检索的高效算法”国际信息科学杂志。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
J.AOE: "A Trie Compaction Algorithm for Large Set of Keys" IEEE Transactions on Knowledge and Data Engineering. (発表予定). (1996)
J.AOE:“用于大型密钥集的 Trie 压缩算法”IEEE 知识和数据工程汇刊(即将发表)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
Masao Fuketa and Jun-ichi Aoe: "A Fast Algorithm of Retrieving Common Sentences" International Journal of Information Sciences. (in press). (1998)
Masao Fuketa 和 Jun-ichi Aoe:“常见句子检索的快速算法”国际信息科学杂志。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
H.Mochizuki: "A Substring Search Algorithm in Extendible Hashing" International Journal of Information Science. (印刷中). (1998)
H. Mochizuki:“可扩展散列中的子串搜索算法”国际信息科学杂志(1998 年出版)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
J.AOE: "A Trie Compaction Algorithm for A Large Set of Keys" IEEE Transactions on Knowledge and Data Eng.(1996)
J.AOE:“A Large Set of Keys 的 Trie 压缩算法”IEEE Transactions on Knowledge and Data Eng.(1996)
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

AOE Junichi其他文献

AOE Junichi的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('AOE Junichi', 18)}}的其他基金

A fast n-gram full text search independent of document size and it application to a huge text base
独立于文档大小的快速 n-gram 全文搜索及其在庞大文本库中的应用
  • 批准号:
    10480082
  • 财政年份:
    1998
  • 资助金额:
    $ 1.6万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
A Partial match technique for multi-attribute keys and its text retrieval application
多属性键的部分匹配技术及其文本检索应用
  • 批准号:
    07558273
  • 财政年份:
    1995
  • 资助金额:
    $ 1.6万
  • 项目类别:
    Grant-in-Aid for Scientific Research (A)
A Fast Retrieval Algorithm of Trie Structures for a Large Set of Keys
一种大键值Trie结构的快速检索算法
  • 批准号:
    04650317
  • 财政年份:
    1992
  • 资助金额:
    $ 1.6万
  • 项目类别:
    Grant-in-Aid for General Scientific Research (C)
Construction of Context Representations Early Semantic Analysis
上下文表示的构建早期语义分析
  • 批准号:
    01550290
  • 财政年份:
    1989
  • 资助金额:
    $ 1.6万
  • 项目类别:
    Grant-in-Aid for General Scientific Research (C)

相似海外基金

EAGER: Integrating Pathological Image and Biomedical Text Data for Clinical Outcome Prediction
EAGER:整合病理图像和生物医学文本数据进行临床结果预测
  • 批准号:
    2412195
  • 财政年份:
    2024
  • 资助金额:
    $ 1.6万
  • 项目类别:
    Standard Grant
Identification of Monetary Policy Shocks Using Text Data and High-Frequency Data
使用文本数据和高频数据识别货币政策冲击
  • 批准号:
    22J12457
  • 财政年份:
    2022
  • 资助金额:
    $ 1.6万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
CAREER: Mortgage and Healthcare Discrimination During COVID19 Pandemic and Use of Text Data in Economics
职业:COVID19 大流行期间的抵押贷款和医疗保健歧视以及文本数据在经济学中的使用
  • 批准号:
    2046642
  • 财政年份:
    2021
  • 资助金额:
    $ 1.6万
  • 项目类别:
    Continuing Grant
Tools and methods for mining text data for electricity markets
用于挖掘电力市场文本数据的工具和方法
  • 批准号:
    564082-2021
  • 财政年份:
    2021
  • 资助金额:
    $ 1.6万
  • 项目类别:
    University Undergraduate Student Research Awards
A study of social forgetting using text data with time stamps
使用带有时间戳的文本数据研究社会遗忘
  • 批准号:
    21K04529
  • 财政年份:
    2021
  • 资助金额:
    $ 1.6万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
New Tools for Analyzing Complex Network and Text Data
用于分析复杂网络和文本数据的新工具
  • 批准号:
    2015469
  • 财政年份:
    2020
  • 资助金额:
    $ 1.6万
  • 项目类别:
    Standard Grant
International Comparative Text Data Analysis with 'Social Consciousness Lexicon'
使用“社会意识词典”进行国际比较文本数据分析
  • 批准号:
    20K02152
  • 财政年份:
    2020
  • 资助金额:
    $ 1.6万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Economic Predictions with Text Data
使用文本数据进行经济预测
  • 批准号:
    2448498
  • 财政年份:
    2020
  • 资助金额:
    $ 1.6万
  • 项目类别:
    Studentship
AI-based large-scale text data analysis for optimizing outcomes of specific health guidance.
基于人工智能的大规模文本数据分析,用于优化特定健康指导的结果。
  • 批准号:
    19K10620
  • 财政年份:
    2019
  • 资助金额:
    $ 1.6万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Financial time series forecast using information extracted from text data
使用从文本数据中提取的信息进行金融时间序列预测
  • 批准号:
    19K01597
  • 财政年份:
    2019
  • 资助金额:
    $ 1.6万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了