超高速データストリームのためのオンライン型半構造情報変換システムの開発
超高速数据流在线半结构化信息转换系统开发
基本信息
- 批准号:16650021
- 负责人:
- 金额:$ 1.6万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Exploratory Research
- 财政年份:2004
- 资助国家:日本
- 起止时间:2004 至 2005
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
本研究では,半構造データに対する高速なXPath処理法を提案した.これまでに,データを効率的に圧縮する手法として知られている算術符号化を半構造データの検索に応用した,逆算術符号化が提案されている.これは,木構造データ上のパスの依存関係を,データを圧縮したまま復号化することなく検査できる手法であり,この関係性を利用することで,パスによる問い合わせを高速に処理できる.しかしながら,この問い合わせで利用可能なパスの形式は限定されているため,一般のXPathの問い合わせは処理が困難である.そこで本研究では,このような逆算術符号化にノード間の先祖子孫関係を判定可能な範囲ラベルを導入することにより,より複雑な問い合わせ処理を高速に実現するための手法を提案する.評価実験の結果,300MB程度のXMLデータに対してテキストを直接処理する既存の手法と比較し,数十から百倍の高速化を達成した.また,本研究では,畳み込みカーネルのアイディアに基づいた,ラベル付き順序木に対するこれまでにない新しいカーネル関数を提案した.まず,畳み込みカーネルの枠組みにおいてラベル付き順序木に対して任意の部分グラフを部分構造として用いた場合の,効率の良いカーネル計算のアルゴリズムを提案し,曖昧なラベルや構造を取り込むような拡張を行った.さらに,より一般的な木構造として,順序のないラベル付き根付き木に対するカーネルを考えた場合には,カーネルの計算が#P-完全問題であることを示した.
In this paper, we propose a semi-structured XPath processing method. This is the first time that we've had a problem with this problem. The dependency relationship between the structure and the structure is discussed in detail below. This is a very difficult problem to deal with. In this study, we propose a method for determining the possible range of ancestor and descendant relations between the two groups by inverse arithmetic symbolization. As a result of the evaluation, the XML file of 300MB level is processed directly by the existing method, and the speed of tens of times is achieved. In this study, we propose a number of new ways to improve the quality of life in the community. In this case, the efficiency of the system is good, and the calculation of the system is very simple. In addition, when considering the general wooden structure and the order of the wooden structure, the calculation of the wooden structure is a #P-complete problem.
项目成果
期刊论文数量(13)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
WWWからの情報抽出-ウェブラッパーの自動構築-
从 WWW 中提取信息 - 自动构建 Web 包装器 -
- DOI:
- 发表时间:2004
- 期刊:
- 影响因子:0
- 作者:有村博紀;坂本比呂志他2名
- 通讯作者:坂本比呂志他2名
A Space-Saving Linear-Time Algorithm for Grammar-Based Compression
一种基于语法的压缩的节省空间的线性时间算法
- DOI:
- 发表时间:2004
- 期刊:
- 影响因子:0
- 作者:H.Sakarnoto;T.Kida;S.Shimozono
- 通讯作者:S.Shimozono
Efficient Substructure Discovery from Large Semi-Structured Data
- DOI:10.1137/1.9781611972726.10
- 发表时间:2001-10
- 期刊:
- 影响因子:0
- 作者:Tatsuya Asai;K. Abe;Shinji Kawasoe;H. Sakamoto;Hiroki Arimura;S. Arikawa
- 通讯作者:Tatsuya Asai;K. Abe;Shinji Kawasoe;H. Sakamoto;Hiroki Arimura;S. Arikawa
A Fully Linear-Time Approximation Algorithm for Grammar-Based Compression
基于语法的压缩的完全线性时间近似算法
- DOI:
- 发表时间:2005
- 期刊:
- 影响因子:0
- 作者:鹿島 久嗣;他2名;Shunsuke Inenaga 他1名;Takuya Kida;石野 明(他1名);大谷 壽一(他3名);Hiroshi Sakamoto
- 通讯作者:Hiroshi Sakamoto
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
坂本 比呂志其他文献
In vivo and in vitro constant expression of GATA-4 in mouse postnata Sertoli cells.
小鼠产后支持细胞中 GATA-4 的体内和体外恒定表达。
- DOI:
- 发表时间:
2004 - 期刊:
- 影响因子:0
- 作者:
Hashi;Y.et al.;谷口英樹;Kanatsu-Shinohara M.et al.;坂本 比呂志;Kanatsu-Shinohara M.et al.;谷口英樹;戴 国友;Kanatsu-Shinohara M.et al.;Imai T.et al. - 通讯作者:
Imai T.et al.
血管内皮細胞の形態制御に関与する転写因子Foxo1の標的因子の探索
寻找转录因子Foxo1参与血管内皮细胞形态调控的靶因子
- DOI:
- 发表时间:
2012 - 期刊:
- 影响因子:0
- 作者:
田村-辻 潔美;坂本 比呂志;小川 峰太郎 - 通讯作者:
小川 峰太郎
Hemogenic and non-hemogenic endothelium can be distinguished by the activity of fetal liver kinase (FlK)-l promoter/enhancer during mouse embryogenesis.
造血内皮和非造血内皮可以通过小鼠胚胎发生期间胎儿肝激酶(FlK)-1启动子/增强子的活性来区分。
- DOI:
- 发表时间:
2003 - 期刊:
- 影响因子:0
- 作者:
Hashi;Y.et al.;谷口英樹;Kanatsu-Shinohara M.et al.;坂本 比呂志;Kanatsu-Shinohara M.et al.;谷口英樹;戴 国友;Kanatsu-Shinohara M.et al.;Imai T.et al.;中島 光業;谷口英樹;久恒 洋;谷口英樹;Furuyama T.et al.;坂本 比呂志;谷口英樹;Iseki M.et al.;坂本比呂志;Nakayama N.et al.;谷口英樹;平位 秀世 - 通讯作者:
平位 秀世
造血発生の発生分化におけるc-Myb発現レベルの意義
c-Myb表达水平在造血发育分化中的意义
- DOI:
- 发表时间:
2007 - 期刊:
- 影响因子:0
- 作者:
坂本比呂志;小川峰太郎;坂本 比呂志 - 通讯作者:
坂本 比呂志
坂本 比呂志的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('坂本 比呂志', 18)}}的其他基金
Compressed learning: theory and application of data compression technique that allows direct learning from optimally encoded data
压缩学习:数据压缩技术的理论和应用,允许从最佳编码数据中直接学习
- 批准号:
23K11233 - 财政年份:2023
- 资助金额:
$ 1.6万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
c-Myb reporterマウスを用いた造血幹細胞のシングルセル解析
使用 c-Myb 报告小鼠对造血干细胞进行单细胞分析
- 批准号:
16K09830 - 财政年份:2016
- 资助金额:
$ 1.6万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
データの更新に対して頑健・高速な半構造データからの情報抽出アルゴリズムの構築
从半结构化数据构建信息提取算法,该算法对数据更新具有鲁棒性和快速性
- 批准号:
18700154 - 财政年份:2006
- 资助金额:
$ 1.6万 - 项目类别:
Grant-in-Aid for Young Scientists (B)
成体型造血の多分化能獲得のための血管内皮細胞の機能解析
血管内皮细胞在成人造血中获得多能性的功能分析
- 批准号:
17790652 - 财政年份:2005
- 资助金额:
$ 1.6万 - 项目类别:
Grant-in-Aid for Young Scientists (B)
ES細胞の試験管内発生モデルを用いた造血幹細胞の多分化能獲得機構の研究
利用ES细胞体外发育模型研究造血干细胞获得多能性的机制
- 批准号:
15790495 - 财政年份:2003
- 资助金额:
$ 1.6万 - 项目类别:
Grant-in-Aid for Young Scientists (B)
半構造テキストデータの一般構造を推論する高度情報抽出アルゴリズムの構築
构建推断半结构化文本数据一般结构的高级信息提取算法
- 批准号:
15700136 - 财政年份:2003
- 资助金额:
$ 1.6万 - 项目类别:
Grant-in-Aid for Young Scientists (B)
造血幹細胞・血管新生のシグナル伝達をふくむ分子論的研究
造血干细胞信号转导和血管生成等分子研究
- 批准号:
01J00388 - 财政年份:2001
- 资助金额:
$ 1.6万 - 项目类别:
Grant-in-Aid for JSPS Fellows
ネットワーク上の半構造テキストデータの変換規則に関する知識獲得システムの研究
网络半结构化文本数据转换规则知识获取系统研究
- 批准号:
12780233 - 财政年份:2000
- 资助金额:
$ 1.6万 - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (A)
JABによるJAK型チロシンキナーゼの制御機構と生理機能の解明
JAB阐明JAK型酪氨酸激酶的调节机制和生理功能
- 批准号:
99J02692 - 财政年份:1999
- 资助金额:
$ 1.6万 - 项目类别:
Grant-in-Aid for JSPS Fellows
相似海外基金
GPUクラスタを用いた半構造データの並列分散処理基盤の構築
利用GPU集群构建半结构化数据并行分布式处理平台
- 批准号:
15J02121 - 财政年份:2015
- 资助金额:
$ 1.6万 - 项目类别:
Grant-in-Aid for JSPS Fellows
データの更新に対して頑健・高速な半構造データからの情報抽出アルゴリズムの構築
从半结构化数据构建信息提取算法,该算法对数据更新具有鲁棒性和快速性
- 批准号:
18700154 - 财政年份:2006
- 资助金额:
$ 1.6万 - 项目类别:
Grant-in-Aid for Young Scientists (B)
木の編集距離による近似パタン発見と半構造データからの情報抽出
使用树编辑距离和半结构化数据信息提取的近似模式发现
- 批准号:
17700138 - 财政年份:2005
- 资助金额:
$ 1.6万 - 项目类别:
Grant-in-Aid for Young Scientists (B)
最適パターン発見に基づく大規模半構造データからの知的情報獲得システムの開発
基于最优模式发现的大规模半结构化数据智能信息获取系统开发
- 批准号:
16016266 - 财政年份:2004
- 资助金额:
$ 1.6万 - 项目类别:
Grant-in-Aid for Scientific Research on Priority Areas
最適パターン発見に基づく大規模半構造データからの知的情報獲得システムの開発
基于最优模式发现的大规模半结构化数据智能信息获取系统开发
- 批准号:
15017268 - 财政年份:2003
- 资助金额:
$ 1.6万 - 项目类别:
Grant-in-Aid for Scientific Research on Priority Areas
最適パターン発見に基づく大規模半構造データからの知的情報獲得システムの開発
基于最优模式发现的大规模半结构化数据智能信息获取系统开发
- 批准号:
14019070 - 财政年份:2002
- 资助金额:
$ 1.6万 - 项目类别:
Grant-in-Aid for Scientific Research on Priority Areas
最適パターン発見に基づく大規模半構造データからの知的情報獲得システムの開発
基于最优模式发现的大规模半结构化数据智能信息获取系统开发
- 批准号:
13224073 - 财政年份:2001
- 资助金额:
$ 1.6万 - 项目类别:
Grant-in-Aid for Scientific Research on Priority Areas (C)
半構造データからのスキーマ情報抽出アルゴリズムの開発
半结构化数据模式信息提取算法的开发
- 批准号:
12780317 - 财政年份:2000
- 资助金额:
$ 1.6万 - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (A)
テキストマイニング技術を用いた半構造データ可視化システムの構成技術に関わる研究
利用文本挖掘技术的半结构化数据可视化系统配置技术相关研究
- 批准号:
11130211 - 财政年份:1999
- 资助金额:
$ 1.6万 - 项目类别:
Grant-in-Aid for Scientific Research on Priority Areas (A)














{{item.name}}会员




