グラフ構造解析を用いたハイパーテキストの順位づけ,クラスタリング,特徴語抽出

使用图结构分析进行超文本排序、聚类和特征词提取

基本信息

  • 批准号:
    13780244
  • 负责人:
  • 金额:
    $ 1.34万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)
  • 财政年份:
    2001
  • 资助国家:
    日本
  • 起止时间:
    2001 至 2002
  • 项目状态:
    已结题

项目摘要

本研究の目的は、リンク構造を持つ大量のWebページの順位づけとクラスダリング手法を構築、これを利用した検索エンジンの構築である。今年度の実績は以下のとおりである。1 テキスト部分の抽出Webページはコンテンツ以外にもマークアップのための情報や構造化のための情報を含む。前年度に、このようなファイルからコンテンツ部分のみを抜きだすアルゴリズムを開発実装した。本年度はさらに、これを拡張しWebページだけでなく、構造を持つ任意のテキストに適用可能なように拡張した。この結果は11月にドイツ・リューベックで行われた国際会議で発表した。ここまでの抽出アルゴリズムは、構造化の情報を利用していなかったが、これを利用するようにした場合の抽出精度について調べ、従来のものより高精度あることを示した。この結果は、現在国際ワークショップに投稿中である。2 Webグラフの定義拡張Webグラフとは、Webページとリンク情報の構造を表わすものである。これをキーワードやパタンも表現可能なようにいくつかの定義の拡張を行なった。さらに、前年度に収集していた上述したデータベースの実データを用いた実証実験を行った。この過程において、類似の見栄えを持つ文字列の特徴付けるアルゴリズムを開発し、グラフの作成をより高精度に行えることを確認した。この結果は、現在国際会議に投稿中である。
は の purpose, this study リ ン ク tectonic を hold つ large の Web ペ ー ジ の sequence づ け と ク ラ ス ダ リ ン グ gimmick を constructs, こ れ を using し た 検 cable エ ン ジ ン の build で あ る. The <s:1> actual performance とお for this year is as follows とお とお である. Part 1 テ キ ス ト の out Web ペ ー ジ は コ ン テ ン ツ outside に も マ ー ク ア ッ プ の た め の intelligence や structured の た め の intelligence を む. In the previous year, the に, <s:1> ようなファ ようなファ ようなファ <s:1> <s:1> <s:1> ゴリズムを ゴリズムを ゴリズムを ゴリズムを ゴリズムを らコ らコ <s:1> テ <s:1> <s:1> ようなファ ゴリズムを ゴリズムを ゴリズムを ゴリズムを of the previous year was launched. The actual decoration of the <s:1> みを, <s:1> テ and ゴリズムを ゴリズムを was carried out. This year's は さ ら に, こ れ を company, zhang し Web ペ ー ジ だ け で な く, tectonic を つ arbitrary の テ キ ス ト に may apply な よ う に company, zhang し た. The <s:1> results of the で November にド にド にド リュ · リュ ベッ ベッ で で international conference で is scheduled to take place た た. こ こ ま で の spare ア ル ゴ リ ズ ム は, construct の intelligence を using し て い な か っ た が, こ れ を using す る よ う に し た occasions の extraction accuracy に つ い て べ, 従 to の も の よ り high-precision あ る こ と を shown し た. The results are and are currently in the international ワ, ワ, ショップに and ショップに submissions である. 2 Webグラフ <s:1> defines 拡 Webグラフと <e:1>, Webペ ジとリ ジとリ <s:1> <s:1> information <e:1> constructs を table わす <s:1> である である. The performance may なように れをキ ワ ワ ドやパタ ドやパタ ドやパタ ワ the performance may なように く く なように definition 拡 拡 zhang を line なった. さ ら に, former annual に 収 set し て い た above し た デ ー タ ベ ー ス の be デ ー タ を with い た be card be 験 を line っ た. こ の process に お い て, similar の see tech students.their ownship え を hold つ text columns の 徴 pay especially け る ア ル ゴ リ ズ ム を open 発 し, グ ラ フ の made を よ り line high-precision に え る こ と を confirm し た. The result of is currently being submitted to the international conference に である.

项目成果

期刊论文数量(6)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Y.Yamada, D.Ikeda, S.Hirokawa: "Automatic Wrapper Generation for Multilingual Web Resources"Proceedings of the 5th International conference on Discovery Science(Lecture Notes in Computer Science). 2534. 332-339 (2002)
Y.Yamada、D.Ikeda、S.Hirokawa:“多语言 Web 资源的自动包装生成”第五届发现科学国际会议论文集(计算机科学讲义)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
S.Hirokawa, D.Ikeda: "Visualization and Analysis of Web Graphs"Progress in Discovery Science(Lecture Notes in Computer Science). 2581. 616-627 (2002)
S.Hirokawa、D.Ikeda:“网络图的可视化和分析”发现科学进展(计算机科学讲义)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
Yasuhiro Yamada, Daisuke Ikeda, Sachio Hirokawa: "SCOOP : A Record Extractor without Knowledge on Input"Proceedings of the 4th International Conference on Discovery Science, Lecture Notes in Artificial Intelligence. 2226. 482-487 (2002)
Yasuhiro Yamada、Daisuke Ikeda、Sachio Hirokawa:“SCOOP:无需输入知识的记录提取器”第四届国际发现科学会议论文集,人工智能讲义。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
池田大輔, 山田泰寛, 廣川左千男: "Web上の多言語テキストデータからのラッパー自動生成"九州大学情報基盤センター年報. 3(予定). (2003)
Daisuke Ikeda、Yasuhiro Yamada、Sachio Hirokawa:“从网络上的多语言文本数据自动生成包装”九州大学信息技术中心年度报告 3(计划)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
Daisuke Ikeda, Sachio Hirokawa: "Visualization and Analysis of Web Graphs"Progresses in Discovery Science, Lecture Notes in Computer Science(to appera).
Daisuke Ikeda、Sachio Hirokawa:“网络图的可视化和分析”发现科学进展,计算机科学讲义(to appera)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

池田 大輔其他文献

臍帯血/骨髄造血幹細胞の増幅
脐带血/骨髓造血干细胞扩增
Global Radiation Medicine: Educational Challenges for Academia
全球放射医学:学术界的教育挑战
  • DOI:
  • 发表时间:
    2012
  • 期刊:
  • 影响因子:
    0
  • 作者:
    阿部 修司;新堀 淳樹;林 寛生;池田 大輔;湯元 清文;津田 敏隆;山下裕作;Shunichi Yamashita
  • 通讯作者:
    Shunichi Yamashita
An Authorization Model with Privacy Protection
一种具有隐私保护的授权模型
  • DOI:
  • 发表时间:
    2007
  • 期刊:
  • 影响因子:
    0
  • 作者:
    中村 徹;Toru Nakamura;稲永 俊介;Shunsuke Inenaga;馬場 謙介;K. Baba;池田 大輔;Daisuke Ikeda;安浦 寛人;H. Yasuura
  • 通讯作者:
    H. Yasuura
外部連携サービスによる機関リポジトリの潜在需要の解析
使用外部协作服务分析机构存储库的潜在需求
  • DOI:
  • 发表时间:
    2009
  • 期刊:
  • 影响因子:
    0
  • 作者:
    池田 大輔;他
  • 通讯作者:
Autoschediastic text mining algorithms
自动调度文本挖掘算法
  • DOI:
  • 发表时间:
    2004
  • 期刊:
  • 影响因子:
    0
  • 作者:
    池田 大輔
  • 通讯作者:
    池田 大輔

池田 大輔的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('池田 大輔', 18)}}的其他基金

極高エネルギー宇宙線観測のための自律トリガー可能な次世代大気蛍光望遠鏡の開発
开发能够自主触发极高能宇宙线观测的下一代大气荧光望远镜
  • 批准号:
    24K07073
  • 财政年份:
    2024
  • 资助金额:
    $ 1.34万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
有価証券報告書内の段落、文に対する階層的な将来見通しのトーン判定と説明可能性
确定证券报告中段落和句子的分层未来前景的语气和可解释性
  • 批准号:
    23K28149
  • 财政年份:
    2024
  • 资助金额:
    $ 1.34万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
Hierarchical Sentiment Polarity Judgement and Explainability for Paragraphs and Sentences in Securities Reports
证券报告段落、句子的层次情感极性判断及解释
  • 批准号:
    23H03459
  • 财政年份:
    2023
  • 资助金额:
    $ 1.34万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
Establishment of event reconstruction technique for fluorescence telescope in future huge cosmic ray observatory
未来巨型宇宙线观测站​​荧光望远镜事件重建技术的建立
  • 批准号:
    21K03605
  • 财政年份:
    2021
  • 资助金额:
    $ 1.34万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
超高エネルギー宇宙線におけるエネルギースペクトルの精密測定とその起源の解明
超高能宇宙线能谱的精确测量并阐明其起源
  • 批准号:
    08J10092
  • 财政年份:
    2008
  • 资助金额:
    $ 1.34万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了