木の編集距離による近似パタン発見と半構造データからの情報抽出

使用树编辑距离和半结构化数据信息提取的近似模式发现

基本信息

  • 批准号:
    17700138
  • 负责人:
  • 金额:
    $ 2.24万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)
  • 财政年份:
    2005
  • 资助国家:
    日本
  • 起止时间:
    2005 至 2007
  • 项目状态:
    已结题

项目摘要

前年度までに、木の編集距離の様々な既存アルゴリズムを対象に、その近似の度合いを代数的に定式化した。これにより、既存の木の編集距離のアルゴリズムを、統一的に記述し俯瞰することができるようになり、その近似の度合いや計算量に応じた自然なクラス階層が存在することもわかった。この成果は、カーネル法に基づく機械学習においても、2つの木構造間の写像の数え上げをベースにした類似度関数を設計することにより、木の編集距離の様々なアルゴリズムをカーネル関数として利用できることがわかった。本年度は、当初の計画では、木の構造照合に関する理論的な枠組みが出来次第、Webのページの木構造を対象にした情報抽出という応用へ研究を進める予定であったが、理論的により興味深く、かつ一般的な成果が得られたため、理論面の研究を進めた。具体的には、前年度までの研究成果を踏まえて、木構造のみでなく、文字列をはじめとする他の離散構造を対象とした既存の畳み込みカーネルの性質を調べた。その結果、畳み込みカーネルの厳密な定義ではなく「共通部分構造の重みつき数え上げ」という概念的な理解により設計されたカーネルで、畳み込みカーネルの定義を逸脱したものが散見されることが判明した。そのようなカーネル関数では、半正定値性が保証されず、その妥当性を確認する必要が発生する。このようなカーネル関数に対しても、本研究で、2つの木構造間のカーネル関数の設計として構築したマッピングの数え上げに基づくカーネル関数の設計手法が有効であることを示した。また、多項式カーネルを一般化したPolynomial Summaryカーネルを提案し、既存の様々なフレームワークを包括する手法であることを示した。すなわち、多項式カーネルは、限定された形式の多項式で定義されているが、これを、より一般の多項式について定義し、カーネル関数となる条件を与えた。
Before the annual ま で に compiling distance, wood の の others 々 な existing ア ル ゴ リ ズ ム を に, seaborne そ の approximate の degrees or い を algebra に demean し た. こ れ に よ り compiling distance, the preexisting の wood の の ア ル ゴ リ ズ ム を, unified に account し overlooking す る こ と が で き る よ う に な り, そ の approximate の degrees or い や computation に 応 じ た natural な ク ラ ス class が exist す る こ と も わ か っ た. こ の results は, カ ー ネ ル subgrade に づ く rote learning に お い て も, 2 つ の wood structure between の written number like の え げ を ベ ー ス に し た masato several similar degrees を design す る こ と に よ り compiling distance, wood の の others 々 な ア ル ゴ リ ズ ム を カ ー ネ ル masato number と し て using で き る こ と が わ か っ た. は this year, at the beginning の plan で は, wood の structure as に masato す る theory な 枠 group み が out time, Web の ペ ー ジ の wooden structure を like に seaborne し た intelligence drew と い う 応 を へ research into め る designated で あ っ た が, theory of に よ り tumblers deep く, か つ generally な results が ら れ た た め, theory を の research into め た. Specific に は, former annual ま で の research tread を ま え て, wood structure の み で な く, text columns を は じ め と す る he の discrete structure を like と seaborne し た existing の 畳 み 込 み カ ー ネ ル の nature を adjustable べ た. そ の results, 畳 み 込 み カ ー ネ ル の 厳 dense な definition で は な く "common part structure の み つ き number え げ" と い う な understanding of the concept of に よ り design さ れ た カ ー ネ ル で, 畳 み 込 み カ ー ネ ル の definition を ease off し た も の が shi kan さ れ る こ と が.at し た. そ の よ う な カ ー ネ ル masato number で は, half positive definite numerical が ensure さ れ ず, そ の justice を confirm す る necessary が 発 raw す る. こ の よ う な カ ー ネ ル masato number に し seaborne て も, this study で, 2 つ の wood structure between の カ ー ネ ル masato number の design と し て build し た マ ッ ピ ン グ の on several え げ に base づ く カ ー ネ ル masato number の design gimmick が have sharper で あ る こ と を shown し た. ま た, Polynomial カ ー ネ ル を generalization し た Polynomial Summary カ ー ネ ル を proposal し, existing の others 々 な フ レ ー ム ワ ー ク を including す る gimmick で あ る こ と を shown し た. す な わ ち, polynomial カ ー ネ ル は, qualified さ れ た definitions of の polynomial で さ れ て い る が, こ れ を, よ り general の polynomial に つ い て definition し, カ ー ネ ル masato number と な を る conditions and え た.

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
A Spectrum Tree Kernel
A gram distribution kernel applied to glycan classification and motif extraction.
畳み込みカーネルと多項式カーネルの一般化
卷积核和多项式核的推广
  • DOI:
  • 发表时间:
    2007
  • 期刊:
  • 影响因子:
    0
  • 作者:
    久保山哲二;申吉浩
  • 通讯作者:
    申吉浩
A q-Grams Based Distance for Ordered Labeled Trees
基于 q-Gram 的有序标记树距离
A Theoretical Analysis of Alignment and Edit Problems for Trees
树的对齐和编辑问题的理论分析
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

久保山 哲二其他文献

Enumeration of Maximally Frequent Ordered Tree Patterns with Height-Constrained Variables for Trees
具有树高度约束变量的最大频繁有序树模式的枚举
  • DOI:
  • 发表时间:
    2018
  • 期刊:
  • 影响因子:
    0
  • 作者:
    鈴木 祐介;宮原 哲浩;正代 隆義;内田 智之;松本 哲志;久保山 哲二
  • 通讯作者:
    久保山 哲二
特徴的な複合的TTSPグラフパターンの獲得における深さラベル列の利用
利用深度标签序列获取特征复杂 TTSP 图模式
  • DOI:
  • 发表时间:
    2017
  • 期刊:
  • 影响因子:
    0
  • 作者:
    山縣 佑貴;宮原 哲浩;鈴木 祐介;徳原 史也;内田 智之;久保山 哲二
  • 通讯作者:
    久保山 哲二
属性情報の図示に基づく概念束分解手法の比較
基于属性信息图解表示的概念束分解方法比较
  • DOI:
  • 发表时间:
    2019
  • 期刊:
  • 影响因子:
    0
  • 作者:
    徳原 史也;宮原 哲浩;鈴木 祐介;内田 智之;久保山 哲二;石榑隼人, 武藤敦子, 森山甲一, 犬塚信博
  • 通讯作者:
    石榑隼人, 武藤敦子, 森山甲一, 犬塚信博
女子師範学校・高等女学校における女子体操服
女子师范学校和女子高中的女子体操服
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    徳永 弘子;久保山 哲二;木村 敦;武川 直樹;吉田雅典,髙子雄一朗,小野遥香,鈴木崚太;Hideyuki Tomosaka; Khulan Enkhbayar; Yuki Kakinuma; Ruriko Suto;滝沢隆,及川裕子,野呂千鶴子,日比野直子,藤木真由美,高橋幸子;亀谷英杏,大住 晏陽,金井 博幸,若月 薫,森川 英明;城戸千晶・久保博子・東実千代・佐々尚美・磯田憲生;難波知子
  • 通讯作者:
    難波知子
多様性の解析を用いたニュース記事に対するコメント集合の分析
使用多样性分析对新闻文章的评论集进行分析
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    宇野 毅明;武富 有香;小林 亮太;橋本 隆子;久保山 哲二;申 吉浩
  • 通讯作者:
    申 吉浩

久保山 哲二的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('久保山 哲二', 18)}}的其他基金

無限平面上の離散構造列挙と類似度設計による結晶の表面構造探索
通过无限平面上离散结构的枚举和相似设计来搜索晶体的表面结构
  • 批准号:
    23K28151
  • 财政年份:
    2024
  • 资助金额:
    $ 2.24万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
Exploration of Crystal Surface Structures through Enumeration of Discrete Structures on an Infinite Plane and Similarity Design
通过无限平面上离散结构的枚举和相似性设计探索晶体表面结构
  • 批准号:
    23H03461
  • 财政年份:
    2023
  • 资助金额:
    $ 2.24万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
Figure and ground approaches for scalable biclustering and their applications
可扩展双聚类的图形和地面方法及其应用
  • 批准号:
    19K12125
  • 财政年份:
    2019
  • 资助金额:
    $ 2.24万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)

相似海外基金

サポートベクターマシンのための深層カーネル関数の学習法とその応用に関する研究
支持向量机的深度核函数学习方法及其应用研究
  • 批准号:
    24K07552
  • 财政年份:
    2024
  • 资助金额:
    $ 2.24万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
カーネル関数を用いる新たな学習理論に基づいたレーダ画像の解析手法に関する研究
基于核函数新学习理论的雷达图像分析方法研究
  • 批准号:
    13750406
  • 财政年份:
    2001
  • 资助金额:
    $ 2.24万
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了