遍在する大規模構造化文書からの高度情報抽出

从无处不在的大规模结构化文档中进行高级信息提取

基本信息

  • 批准号:
    19024058
  • 负责人:
  • 金额:
    $ 4.1万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
  • 财政年份:
    2007
  • 资助国家:
    日本
  • 起止时间:
    2007 至 2008
  • 项目状态:
    已结题

项目摘要

本研究の目的である大規模構造化文書からの高度情報抽出を達成するために、その基礎技術を確立すべく、本年度は、(1)高精度XML文書情報検索、(2)高性能XQuery問合せ処理に関する二課題を中心に取り組んだ。まず、高精度XML文書情報検索に関しては、XML文書の部分文書を高精度に検索するために、検索精度を上げるための研究を行った。基本的な考えは、Smallest Lowest Common Ancestor (SLCA)の考え方をもとに、検索キーワードの距離、含有率、寄与率の三つのスコアを提案し、評価を行った。その結果、キーワード含有率と従来の単語の重み付けとの組合せが最も検索精度を向上させることができ、昨年度までの研究成果よりも高い検索精度を実現した。次に、構造化文書を高い能力で処理するXQuery Full-Textを実現するために、その基盤となる、XQuery分散処理方式の研究を行った。XQueryの分散処理に関して、基本的に値渡しによるリモートプロシジャコールに基づくものが既に提案されているが、参照渡しを利用した分散処理を採用することによりパイプライン処理を可能とした。また、この技術を利用し、P2Pネットワーク上で分散して構造化文書を管理しつつ、効率的な分散XQuery問合せ処理も可能な情報基盤アーキテクチャを提案した。XBenchベンチマークにより評価を行ったところ、従来よりも3〜5倍の高速処理が可能であることが判明した。
The purpose of this research is to establish the basic technology for extracting high information from large-scale structured documents. This year, two key issues are selected: (1) high-precision XML document information search, and (2) high-performance XQuery query processing. Research on high-precision XML document information retrieval and high-precision XML document retrieval Basic test, Smallest Common Anchor (SLCA) test, search, distance, content, delivery rate, proposal, evaluation The results of this study are as follows: (1) The accuracy of the results of this study is as high as that of the results of this study. A Study on XQuery Full-Text Processing with High Ability for Sub-structured Documents XQuery distributed processing is related to the basic value of the transition, the use of the transition, the decentralized processing, the possibility of the transition. This technology can be used in P2P applications, distributed structured documents, distributed query processing, and information base applications. XBench

项目成果

期刊论文数量(35)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
遅延評価を利用した並列分散XQuery問合せ処理
使用惰性求值的并行分布式 XQuery 查询处理
  • DOI:
  • 发表时间:
    2008
  • 期刊:
  • 影响因子:
    0
  • 作者:
    油井誠;宮崎純;植村俊亮;加藤博一
  • 通讯作者:
    加藤博一
A Novel XML Fragment Retrieval Method based on Statistical Analyses
一种基于统计分析的XML片段检索新方法
  • DOI:
  • 发表时间:
    2008
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Kenji Hatano;Sun Miyazaki;Atsushi Keyaki
  • 通讯作者:
    Atsushi Keyaki
文書構造情報を利用したWeb情報検索
使用文档结构信息进行网络信息搜索
  • DOI:
  • 发表时间:
    2008
  • 期刊:
  • 影响因子:
    0
  • 作者:
    伊藤智博;宮崎純;中島伸介;植村俊亮;加藤博一
  • 通讯作者:
    加藤博一
A Ranking Method based on Users' Contexts for Information Recommendation
一种基于用户上下文的信息推荐排序方法
  • DOI:
  • 发表时间:
    2008
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Kenta Oku;Shinsuke Nakajima;Jun Miyazaki;Shunsuke Uemura;Hirokazu Kato
  • 通讯作者:
    Hirokazu Kato
Ranking and Presenting Search Results in an RDB-based XML Search Engine
在基于 RDB 的 XML 搜索引擎中对搜索结果进行排名和呈现
  • DOI:
  • 发表时间:
    2007
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Kenji Hatano;Toshiyuki Shimizu;Jun Miyazaki;Yu Suzuki;Hiroko Kinutani;Masatoshi Yoshikawa
  • 通讯作者:
    Masatoshi Yoshikawa
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

宮崎 純其他文献

Agent Community based Peer-to-Peer Information Retrieval
基于代理社区的点对点信息检索
  • DOI:
  • 发表时间:
    2004
  • 期刊:
  • 影响因子:
    0
  • 作者:
    奥 健太;中島 伸介;宮崎 純;植村 俊亮;Tsunenori Mine et al.
  • 通讯作者:
    Tsunenori Mine et al.
RDBとKVSを相互に活用した大規模多次元データに対する集約演算の効率化
RDB与KVS的相互利用提高大规模多维数据聚合操作的效率
  • DOI:
  • 发表时间:
    2017
  • 期刊:
  • 影响因子:
    0
  • 作者:
    渡 佑也;欅 惇志;宮崎 純;中村 匡秀
  • 通讯作者:
    中村 匡秀
多峰性のあるコピュラを用いた文書の適合度の統合手法の提案及びその検証
使用多模态联结函数整合文档适用性的方法的提出和验证
  • DOI:
  • 发表时间:
    2016
  • 期刊:
  • 影响因子:
    0
  • 作者:
    小松田 卓也;欅 惇志;宮崎 純
  • 通讯作者:
    宮崎 純
Do knowledge assets really exist in the world and can we access such knowledge?
世界上真的存在知识资产吗?我们能否获取这些知识?
文書の可読性を考慮したWeb検索に関する一考察
考虑文档可读性的网络搜索研究
  • DOI:
  • 发表时间:
    2016
  • 期刊:
  • 影响因子:
    0
  • 作者:
    佐々木 夢;小松田 卓也;欅 惇志;宮崎 純
  • 通讯作者:
    宮崎 純

宮崎 純的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('宮崎 純', 18)}}的其他基金

応用システム指向グラフ型知識ベースのビュー構成方法に関する研究
面向应用系统的图知识库视图构建方法研究
  • 批准号:
    23K28091
  • 财政年份:
    2024
  • 资助金额:
    $ 4.1万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
A Study on View Constuction for Application-oriented Graph Knowledge Base
面向应用的图知识库视图构建研究
  • 批准号:
    23H03401
  • 财政年份:
    2023
  • 资助金额:
    $ 4.1万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
木構造スキーマを持つデータベースの分散処理に関する研究
树结构数据库分布式处理研究
  • 批准号:
    17700109
  • 财政年份:
    2005
  • 资助金额:
    $ 4.1万
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)
ハードウェアとソフトウェアの連携による高速主記憶データベース処理の研究
软硬件配合高速主存数据库处理研究
  • 批准号:
    15700090
  • 财政年份:
    2003
  • 资助金额:
    $ 4.1万
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)
分散アクティブデータベースアーキテクチャに関する研究
分布式主动数据库架构研究
  • 批准号:
    11780205
  • 财政年份:
    1999
  • 资助金额:
    $ 4.1万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)

相似国自然基金

XQuery语言运行时自动程序例化技术的研究
  • 批准号:
    61202074
  • 批准年份:
    2012
  • 资助金额:
    23.0 万元
  • 项目类别:
    青年科学基金项目

相似海外基金

Towards a computational frame work on ranked trust policies in data interoperability problems used in XQuery
针对 XQuery 中使用的数据互操作性问题中的排名信任策略的计算框架
  • 批准号:
    18K11252
  • 财政年份:
    2018
  • 资助金额:
    $ 4.1万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Rewriting XQuery using Schema Mappings to Solve Data Interoperability Problems
使用模式映射重写 XQuery 解决数据互操作性问题
  • 批准号:
    26330097
  • 财政年份:
    2014
  • 资助金额:
    $ 4.1万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Efficient query processing over ordered data with application to execution of XQuery
通过应用 XQuery 执行对有序数据进行高效查询处理
  • 批准号:
    217353-2007
  • 财政年份:
    2011
  • 资助金额:
    $ 4.1万
  • 项目类别:
    Discovery Grants Program - Individual
Efficient query processing over ordered data with application to execution of XQuery
通过应用 XQuery 执行对有序数据进行高效查询处理
  • 批准号:
    217353-2007
  • 财政年份:
    2010
  • 资助金额:
    $ 4.1万
  • 项目类别:
    Discovery Grants Program - Individual
Efficient query processing over ordered data with application to execution of XQuery
通过应用 XQuery 执行对有序数据进行高效查询处理
  • 批准号:
    217353-2007
  • 财政年份:
    2009
  • 资助金额:
    $ 4.1万
  • 项目类别:
    Discovery Grants Program - Individual
Efficient query processing over ordered data with application to execution of XQuery
通过应用 XQuery 执行对有序数据进行高效查询处理
  • 批准号:
    217353-2007
  • 财政年份:
    2008
  • 资助金额:
    $ 4.1万
  • 项目类别:
    Discovery Grants Program - Individual
Efficient query processing over ordered data with application to execution of XQuery
通过应用 XQuery 执行对有序数据进行高效查询处理
  • 批准号:
    217353-2007
  • 财政年份:
    2007
  • 资助金额:
    $ 4.1万
  • 项目类别:
    Discovery Grants Program - Individual
Relationale Datenbanksysteme als hocheffiziente XQuery-Prozessoren: Compilationstechniken und Laufzeitsysteme
作为高效 XQuery 处理器的关系数据库系统:编译技术和运行时系统
  • 批准号:
    27645166
  • 财政年份:
    2006
  • 资助金额:
    $ 4.1万
  • 项目类别:
    Research Grants
ストリーム指向の超高速XQuery処理技術に関する研究
面向流的超高速XQuery处理技术研究
  • 批准号:
    18700092
  • 财政年份:
    2006
  • 资助金额:
    $ 4.1万
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)
ユビキタスコンピューティング環境に適した分散型XQuery処理方式に関する研究
适合普适计算环境的分布式XQuery处理方法研究
  • 批准号:
    17700110
  • 财政年份:
    2005
  • 资助金额:
    $ 4.1万
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了