最適パターン発見に基づく大規模半構造データからの知的情報獲得システムの開発

基于最优模式发现的大规模半结构化数据智能信息获取系统开发

基本信息

  • 批准号:
    14019070
  • 负责人:
  • 金额:
    $ 3.97万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
  • 财政年份:
    2002
  • 资助国家:
    日本
  • 起止时间:
    2002 至 无数据
  • 项目状态:
    已结题

项目摘要

ネットワーク上に分散したウェブページやXML等の半構造データの急速な増大に対して,これらのコンテンツに直接アクセスするための効率良い手法の開発が緊急の課題となっている.本研究では,大規模半構造データからのデータマイニング(ウェブマイニング)に基づき,大量のデータ解析を対話的に支援する効率的なツールとして,従来の情報検索システムを超えた新しい情報アクセスシステムの開発を目指す.そのための鍵となる技術として,最適パターン発見を木やグラフ構造に拡張して,半構造データに対する頑健かつ高速な最適化パターン発見アルゴリズムを開発する.さらに,ウェブマイニングを(a)有用な情報源の発見,および(b)特徴的なパターンの発見,(c)情報抽出の3つの過程ととらえ,これらを有機的に結合して,半構造データを対象とした知識獲得システムの効率良い実現方式を明らかにすることを目標とする.また,計算量理論と計算学習理論の最新成果を援用し,計算量に徹底的に配慮した高速なアルゴリズムの開発を目指すのも特色である.平成14年度は,次の研究成果を得た.(a)「有用な情報源の発見」に関しては,従来より表現力の高いパターンである可変長変数パターン(VLDCパターン)に対する新しいテキスト索引構造を開発し,これを用いて,効率よい最適化マイニングアルゴリズムを開発した.(b)「特徴的なパターンの発見」に関しては,XML-MessagingとSOAPへの応用を目指して,昨年開発した半構造データマイニング手法FREQTを元に,高速な半構造データストリームマイニングSTREAMTを開発した.これは,非常に少なく資源を使いながらデータストリームを監視し、有用なパターンを逐次報告するアルゴリズムである.また,FREQTの最適化マイニングへの拡張と理論的性能解析を行い,この方式の最適性を示した.(c)「情報抽出」に関しては,XMLデータ処理の基本技術である符号語列上のパターン照合機械技術を開発し,XMLパターン検索への応用を考察した.
The rapid growth of semi-structural data such as XML, etc., is an urgent problem for the development of high-quality data. This study aims to provide guidance for the development of large-scale semi-structured data structures based on the analysis of a large number of data structures to support the efficiency of data analysis and the development of new information systems. The key technology is to optimize the development of structural, semi-structural and structural systems, and to optimize the development of high-speed systems. In this regard, it is necessary to: (a) discover useful information sources;(b) discover characteristic information;(c) extract information from information sources; and (d) combine information with information in an organic way. The latest achievements of computational theory and computational learning theory are applied to the development of computational theory. In 2014, the second research results were obtained. (a)"Useful information source discovery" is related to the development of a new index structure for high performance, variable length (VLDC), and efficiency optimization. (b)The development of XML-Messaging and SOAP technology is related to the development of XML-Messaging and SOAP technology. This is a very rare resource that can be used to monitor, monitor, and report information. FREQT optimization is performed in a theoretical manner, and the optimality of the method is demonstrated. (c)"Information extraction" is related to the basic technology of XML data processing, the development of XML data processing technology, and the application of XML data processing technology.

项目成果

期刊论文数量(12)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
竹田 正幸, 篠原 歩: "圧縮されたテキスト上のパターン照合-データ圧縮とパターン照合の新展開-"情報処理学会学会誌. 43(7). 763-769 (2002)
Masayuki Takeda、Ayumu Shinohara:“压缩文本的模式匹配 - 数据压缩和模式匹配的新发展”日本信息处理学会杂志 43(7) (2002)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
有村 博紀, 坂本 比呂志: "データマイニングにおける最適パターン発見"応用数理,応用数理学会. 12(4). 32-44 (2002)
Hiroki Arimura、Hiroshi Sakamoto:“发现数据挖掘中的最佳模式”应用数学,应用数学学会 12(4) (2002)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
K.Abe et al.: "Optimized Substructure Discovery for Semi-structured Data"Proc. 6th European Conf. on Principles and Practice of Knowledge Discovery in Databases(PKDD-2002). LNAI2431. 1-14 (2002)
K.Abe 等人:“半结构化数据的优化子结构发现”Proc。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
T.Asai et al.: "Efficient Substructure Discovery from Large Semi-structured Data"Proc. Second SIAM International Conference on Data Mining(SDM'02). 158-174 (2002)
T.Asai 等人:“从大型半结构化数据中进行有效的子结构发现”Proc。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
T.Asai et al.: "Online Algorithms for Mining Semi-structured Data Stream"Proc. IEEE International Conference on Data Mining(ICDM'02). 27-34 (2002)
T.Asai 等人:“挖掘半结构化数据流的在线算法”Proc。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

有村 博紀其他文献

Parallel vertex and facet enumeration with mplrs
使用 mplrs 进行并行顶点和面枚举
  • DOI:
  • 发表时间:
    2017
  • 期刊:
  • 影响因子:
    0
  • 作者:
    佐々木 耀一,渋谷 哲朗,大森 亮介,伊藤 公人;有村 博紀;Thomas Zeugmann;Skip Jordan
  • 通讯作者:
    Skip Jordan
ルールリストに対するRashomon集合の厳密計算と予測多重性解析
规则列表罗生门集的精确计算和预测多重性分析
  • DOI:
  • 发表时间:
    2021
  • 期刊:
  • 影响因子:
    0
  • 作者:
    又 康太;金森 憲太朗;有村 博紀
  • 通讯作者:
    有村 博紀
Variable Importance Cloudの要約方法と決定木に対する実験的評価
变量重要性云汇总方法和决策树的实验评估
  • DOI:
  • 发表时间:
    2020
  • 期刊:
  • 影响因子:
    0
  • 作者:
    又 康太;金森 憲太朗;有村 博紀
  • 通讯作者:
    有村 博紀
What we talk when we talk about society and robots
当我们谈论社会和机器人时我们在谈论什么
  • DOI:
  • 发表时间:
    2020
  • 期刊:
  • 影响因子:
    0
  • 作者:
    又 康太;金森 憲太朗;有村 博紀;Yoshihiko Nakamura
  • 通讯作者:
    Yoshihiko Nakamura
複数テキスト索引構造のオンライン構築
在线构建多种文本索引结构
  • DOI:
  • 发表时间:
    2020
  • 期刊:
  • 影响因子:
    0
  • 作者:
    高木 拓也;稲永 俊;有村 博紀;Dany Breslauer;Diptarama Hendrian
  • 通讯作者:
    Diptarama Hendrian

有村 博紀的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('有村 博紀', 18)}}的其他基金

Development of Next-generation Semi-Structured Data Mining Technology Towards The Real-World Knowledge Creation Infrastructure
面向现实世界知识创造基础设施的下一代半结构化数据挖掘技术的开发
  • 批准号:
    20H00595
  • 财政年份:
    2020
  • 资助金额:
    $ 3.97万
  • 项目类别:
    Grant-in-Aid for Scientific Research (A)
最適パターン発見に基づく大規模半構造データからの知的情報獲得システムの開発
基于最优模式发现的大规模半结构化数据智能信息获取系统开发
  • 批准号:
    15017268
  • 财政年份:
    2003
  • 资助金额:
    $ 3.97万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
最適パターン発見に基づく大規模半構造データからの知的情報獲得システムの開発
基于最优模式发现的大规模半结构化数据智能信息获取系统开发
  • 批准号:
    13224073
  • 财政年份:
    2001
  • 资助金额:
    $ 3.97万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas (C)
高度知識ベースを対象とした知識獲得システムの研究
针对高级知识库的知识获取系统研究
  • 批准号:
    11780277
  • 财政年份:
    1999
  • 资助金额:
    $ 3.97万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
超大規模データからの高速データマイニング・システムの研究
超大规模数据高速数据挖掘系统研究
  • 批准号:
    09230215
  • 财政年份:
    1997
  • 资助金额:
    $ 3.97万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
高度知識ベースを対象とした知識獲得システムの研究
针对高级知识库的知识获取系统研究
  • 批准号:
    09780343
  • 财政年份:
    1997
  • 资助金额:
    $ 3.97万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
大規模オブジェクト指向データベースを対象とした知識獲得システムの研究
大规模面向对象数据库知识获取系统研究
  • 批准号:
    08780371
  • 财政年份:
    1996
  • 资助金额:
    $ 3.97万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
大規模オブジエクト指向データベースを対象とした知識獲得システムの研究
大规模面向对象数据库知识获取系统研究
  • 批准号:
    07780339
  • 财政年份:
    1995
  • 资助金额:
    $ 3.97万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
プログラム自動合成システムにおける一般化を用いた効率的学習の基礎的研究
自动程序合成系统中泛化高效学习的基础研究
  • 批准号:
    04750354
  • 财政年份:
    1992
  • 资助金额:
    $ 3.97万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)

相似海外基金

最適パターン発見に基づく大規模半構造データからの知的情報獲得システムの開発
基于最优模式发现的大规模半结构化数据智能信息获取系统开发
  • 批准号:
    16016266
  • 财政年份:
    2004
  • 资助金额:
    $ 3.97万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
最適パターン発見に基づく大規模半構造データからの知的情報獲得システムの開発
基于最优模式发现的大规模半结构化数据智能信息获取系统开发
  • 批准号:
    15017268
  • 财政年份:
    2003
  • 资助金额:
    $ 3.97万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
最適パターン発見に基づく大規模半構造データからの知的情報獲得システムの開発
基于最优模式发现的大规模半结构化数据智能信息获取系统开发
  • 批准号:
    13224073
  • 财政年份:
    2001
  • 资助金额:
    $ 3.97万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas (C)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了