最適パターン発見に基づく大規模半構造データからの知的情報獲得システムの開発
基于最优模式发现的大规模半结构化数据智能信息获取系统开发
基本信息
- 批准号:15017268
- 负责人:
- 金额:$ 3.33万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Scientific Research on Priority Areas
- 财政年份:2003
- 资助国家:日本
- 起止时间:2003 至 无数据
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
本研究では,大量のウェブページやXML等の大規模半構造データからのデータマイニング(ウェブマイニング)に基づき,大量のデータ解析を対話的に支援する効率的なツールとして,従来の情報検索システムを超えた新しい情報アクセスシステムの実現方式を明らかにすることを目標としている.鍵になる技術として,最適パターン発見を木やグラフ構造に拡張し,計算量理論と計算学習理論の最新の成果を援用しながら,半構造データに対する頑健かつ高速な最適化パターン発見アルゴリズムの開発に取り組んだ.平成15年度は,前年度の成果に基づき,(a)有用な情報源の発見,(b)特徴的なパターンの発見,(c)情報の抽出の3つの情報獲得問題について,次の研究を行った.(1)前年度開発した最適分類パターンを用いた高精度テキスト自動分類手法を一種の正規表現を扱えるよう一般化した.さらに,近似文字列照合を可能なパターン発見エンジンを開発し,加速学習法を用いて決定木学習システムBONSAIに組み込んだ(竹田・篠原).(2)XPathパターンに対する最適パターン発見アルゴリズムを設計し,半構造データマイニングエンジンを開発した.とくに今回は,より現実の半構造データに近い無順序木モデルに対して,高速なパターン発見エンジンを開発した.パターンの圧縮表現に対する,高速な列挙アルゴリズムを開発した.独自に開発したオンライン化技術を用いて,オンラインパターン発見手法を開発した(有村).(3)情報抽出に関して,現状の技術動向の調査を行い,水平方向制約(Sequence制約)付き半構造データに対するラッパー帰納アルゴリズムの設計を行った(坂本).さらに,半構造データに適した高性能圧縮アルゴリズムを開発し,性能に関する理論的解析を行った.並行して,開発したアルゴリズムの計算量を解析し(下薗,篠原),個々のアルゴリズムの最適化をおこない,性能を向上させた(全員).最後に,ウェブデータとXMLデータに関する評価実験をおこない,この方式の有効性を評価した(有村・篠原).
In this study, a large number of large-scale models such as XML and so on have been established to support the performance of high-performance computer systems. I don't know how to tell you how to do it. I don't know how to tell you how to do it. This is the most important thing in the field of technology and technology. The most important thing is to see that you can use the latest results of calculation theory, calculation theory, computer science, and so on. In the 15th year of Pingcheng, the results of the previous year were based on, (a) useful information on the source of information, (b) special information on information, and (c) on the basis of the results of the 15th year of Pingcheng and the previous year. The second study was conducted. (1) the year before last, the most advanced classification system has been introduced in the past year, which uses the automatic classification method of high-precision classification to demonstrate the generalization of the system. It is possible to use the accelerated learning method to determine the performance of the BONSAI system (Takeda Yuehara). (2) the most important information of the XPath system is in the design of the equipment design, and half of the system is used to determine the performance of the system. In response to this request, you will be able to do a lot of work in the near future. For high-speed traffic, please see the opening of the vehicle. The high-speed train will start the operation of high-speed train stations. On your own, you can use the equipment to improve the performance of the technology. (3) if you are in a situation, you can pull out the equipment and apply it to the market, and the horizontal system (Sequence) will pay for the design of the equipment (Sakamoto). In this paper, the analytical line of the theory of performance analysis is introduced, and the analysis of the theory of performance analysis is completed. At the same time, we will start the calculation and analysis of calculation and analysis (lower, original), and make sure that the performance is improved (full staff). At the end of the day, there are some sexual problems (there is a village in the village) in a way that is similar to that of a village. In the end, there is a question of sex and sex in the end. In the end, there is a problem in the end, that is, in the end, there is a lot of sex in the way of XML.
项目成果
期刊论文数量(24)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Tatsuya Asai et al.: "半構造データマイニングにおけるパターン発見技法"電子情報通信学会論文誌. J87-D-1・2. 111-139 (2003)
Tatsuya Asai 等:“半结构化数据挖掘中的模式发现技术”,电子信息通信工程师学会会刊 J87-D-1・2(2003 年)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
Kensuke Baba et al.: "On the Length of the Minimum Solution of Word Equations in One Variable"Lecture Notes in Computer Science. 2747. 189-197 (2003)
Kensuke Baba 等人:“论单变量词方程的最小解的长度”计算机科学讲义。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
Hiroki Arimura: "Efficient Text and Semi-structured Data Mining : Knowledge Discovery in the Cyberspace"The first Franco-Japanese Workshop on Information Search, Integration and Personalization (ISIP'03). (2003)
Hiroki Arimura:“高效文本和半结构化数据挖掘:网络空间中的知识发现”第一届法日信息搜索、集成和个性化研讨会(ISIP03)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
有村 博紀: "計算学習理論における学習"人工知能学会誌. 18・5. 531-536 (2003)
Hironori Arimura:“计算学习理论中的学习”人工智能学会杂志18・5(2003)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
Tomohiko Sugimachi et al.: "A Method of Extracting Related Words Using Standardized Mutual Information"Lecture Notes in Computer Science. 2843. 478-485 (2003)
Tomohiko Sugimachi 等人:“使用标准化互信息提取相关词的方法”计算机科学讲义。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
有村 博紀其他文献
ルールリストに対するRashomon集合の厳密計算と予測多重性解析
规则列表罗生门集的精确计算和预测多重性分析
- DOI:
- 发表时间:
2021 - 期刊:
- 影响因子:0
- 作者:
又 康太;金森 憲太朗;有村 博紀 - 通讯作者:
有村 博紀
Parallel vertex and facet enumeration with mplrs
使用 mplrs 进行并行顶点和面枚举
- DOI:
- 发表时间:
2017 - 期刊:
- 影响因子:0
- 作者:
佐々木 耀一,渋谷 哲朗,大森 亮介,伊藤 公人;有村 博紀;Thomas Zeugmann;Skip Jordan - 通讯作者:
Skip Jordan
Variable Importance Cloudの要約方法と決定木に対する実験的評価
变量重要性云汇总方法和决策树的实验评估
- DOI:
- 发表时间:
2020 - 期刊:
- 影响因子:0
- 作者:
又 康太;金森 憲太朗;有村 博紀 - 通讯作者:
有村 博紀
What we talk when we talk about society and robots
当我们谈论社会和机器人时我们在谈论什么
- DOI:
- 发表时间:
2020 - 期刊:
- 影响因子:0
- 作者:
又 康太;金森 憲太朗;有村 博紀;Yoshihiko Nakamura - 通讯作者:
Yoshihiko Nakamura
Low-Cost Vehicle Sensing using Stereo Microphone",
使用立体声麦克风的低成本车辆传感”,
- DOI:
- 发表时间:
2017 - 期刊:
- 影响因子:0
- 作者:
高木 拓也;有村 博紀;Shigemi Ishida - 通讯作者:
Shigemi Ishida
有村 博紀的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('有村 博紀', 18)}}的其他基金
Development of Next-generation Semi-Structured Data Mining Technology Towards The Real-World Knowledge Creation Infrastructure
面向现实世界知识创造基础设施的下一代半结构化数据挖掘技术的开发
- 批准号:
20H00595 - 财政年份:2020
- 资助金额:
$ 3.33万 - 项目类别:
Grant-in-Aid for Scientific Research (A)
最適パターン発見に基づく大規模半構造データからの知的情報獲得システムの開発
基于最优模式发现的大规模半结构化数据智能信息获取系统开发
- 批准号:
14019070 - 财政年份:2002
- 资助金额:
$ 3.33万 - 项目类别:
Grant-in-Aid for Scientific Research on Priority Areas
最適パターン発見に基づく大規模半構造データからの知的情報獲得システムの開発
基于最优模式发现的大规模半结构化数据智能信息获取系统开发
- 批准号:
13224073 - 财政年份:2001
- 资助金额:
$ 3.33万 - 项目类别:
Grant-in-Aid for Scientific Research on Priority Areas (C)
高度知識ベースを対象とした知識獲得システムの研究
针对高级知识库的知识获取系统研究
- 批准号:
11780277 - 财政年份:1999
- 资助金额:
$ 3.33万 - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (A)
超大規模データからの高速データマイニング・システムの研究
超大规模数据高速数据挖掘系统研究
- 批准号:
09230215 - 财政年份:1997
- 资助金额:
$ 3.33万 - 项目类别:
Grant-in-Aid for Scientific Research on Priority Areas
高度知識ベースを対象とした知識獲得システムの研究
针对高级知识库的知识获取系统研究
- 批准号:
09780343 - 财政年份:1997
- 资助金额:
$ 3.33万 - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (A)
大規模オブジェクト指向データベースを対象とした知識獲得システムの研究
大规模面向对象数据库知识获取系统研究
- 批准号:
08780371 - 财政年份:1996
- 资助金额:
$ 3.33万 - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (A)
大規模オブジエクト指向データベースを対象とした知識獲得システムの研究
大规模面向对象数据库知识获取系统研究
- 批准号:
07780339 - 财政年份:1995
- 资助金额:
$ 3.33万 - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (A)
プログラム自動合成システムにおける一般化を用いた効率的学習の基礎的研究
自动程序合成系统中泛化高效学习的基础研究
- 批准号:
04750354 - 财政年份:1992
- 资助金额:
$ 3.33万 - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (A)
相似海外基金
最適パターン発見に基づく大規模半構造データからの知的情報獲得システムの開発
基于最优模式发现的大规模半结构化数据智能信息获取系统开发
- 批准号:
16016266 - 财政年份:2004
- 资助金额:
$ 3.33万 - 项目类别:
Grant-in-Aid for Scientific Research on Priority Areas
最適パターン発見に基づく大規模半構造データからの知的情報獲得システムの開発
基于最优模式发现的大规模半结构化数据智能信息获取系统开发
- 批准号:
14019070 - 财政年份:2002
- 资助金额:
$ 3.33万 - 项目类别:
Grant-in-Aid for Scientific Research on Priority Areas
最適パターン発見に基づく大規模半構造データからの知的情報獲得システムの開発
基于最优模式发现的大规模半结构化数据智能信息获取系统开发
- 批准号:
13224073 - 财政年份:2001
- 资助金额:
$ 3.33万 - 项目类别:
Grant-in-Aid for Scientific Research on Priority Areas (C)