バックリンクに基づく高品質クラスタリング手法の開発と日本全ウェブページへの適応

开发基于反向链接的高质量聚类方法并应用于所有日语网页

基本信息

  • 批准号:
    02F00114
  • 负责人:
  • 金额:
    $ 1.22万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
  • 财政年份:
    2002
  • 资助国家:
    日本
  • 起止时间:
    2002 至 2003
  • 项目状态:
    已结题

项目摘要

本研究では、リンク情報に基づくクラスタリング技術に加え、ページの内容を考慮したクラスタリング技法を開発することを目的としている。昨年度は、特定のトピクスに対する実証実験を行い、提案する方式の有効性を確認した。本年度は、昨年度の結果をさらに拡張し、様々のトピクスへの適応性を備え、高品質の結果を得られる方式の検討を行った。1.40以上の様々なトピクスを用いて、提案する方式とWWW検索エンジンの結果について、詳細に検討、比較を行った2.トピクスをカテゴリーごとに分類しているオープンディレクトリ(www.dmoz.com)の結果を比較することにより、提案する方式が異なるタイプのトピクスに対して有効であることを示した。3.提案する方式の結果をコンテンツクラスタリング検索エンジン(www.vivisimo)と比較し、我々の方式が有効であることを確認した。4.異なるタイプのトピクス(内容が多岐にわたるもの、多岐ではないが抽象的なもの、限られたもの)ごとに、検索エンジンで得られた結果および検索エンジンの応答性能について詳細に解析を行った。5.以上の詳細な評価結果から、提案する方式が一般的なトピクス(抽象度の高い"HIV"などのキーワード)に関して品質が良くないことが確認できた。そこで、新たにインリンク解析の強化およびアンカーウィンドウの解析を加えることで、提案する方式が多様なトピクスに対応可能であることを示した。今後は、WWWの最大の特長である容量に対処すべく、密度ベースクラスタリング方式を用いて提案した方式の性能向上を目指す予定である。
This study で は, リ ン ク intelligence に base づ く ク ラ ス タ リ ン グ technology に え, ペ ー ジ の content を consider し た ク ラ ス タ リ ン グ techniques を open 発 す る こ と を purpose と し て い る. The validity of the する, specific <s:1> トピ, スに and スに of the previous year for the する actual evidence and を practice <e:1>, as well as the する proposal method <e:1>, was を confirmed to be た た. This year's annual の は, yesterday the result を さ ら に company, zhang し, others 々 の ト ピ ク ス へ の optimum 応 を prepared え, the result of high quality の を ら れ る way の 検 line for を っ た. Above 1.40 の others 々 な ト ピ ク ス を with い て, proposal す る way と WWW 検 cable エ ン ジ ン の results に つ い て, detailed に beg, compare を っ 検 た 2. ト ピ ク ス を カ テ ゴ リ ー ご と に classification し て い る オ ー プ ン デ ィ レ ク ト リ (www.dmoz.com) の results を す る こ と に よ り, proposal す る way が different な る タ イ プ の ト ピ ク ス に し seaborne て have sharper で あ る こ と を shown し た. 3. The proposal す る way の results を コ ン テ ン ツ ク ラ ス タ リ ン グ 検 cable エ ン ジ ン と し, (www.vivisimo) I 々 の way が have sharper で あ る こ と を confirm し た. 4. Different な る タ イ プ の ト ピ ク ス (content more than が toki に わ た る も の, toki で は な い が abstract な も の, limit ら れ た も の) ご と に, 検 エ ン ジ ン で must ら れ た results お よ び 検 cable エ ン ジ ン の 応 a performance に つ い detailed analytical を に line っ て た. More than 5. の な detailed review 価 results か ら, proposal す る way が general な ト ピ ク ス (abstract degree high の い "HIV" な ど の キ ー ワ ー ド) に masato し て good quality が く な い こ と が confirm で き た. そ こ で, new た に イ ン リ ン ク parsing の strengthening お よ び ア ン カ ー ウ ィ ン ド ウ の parsing を plus え る こ と で, proposal す が る way more than others in な ト ピ ク ス に 応 seaborne may で あ る こ と を shown し た. Future は, WWW の の largest specialty で あ る capacity に 処 seaborne す べ く, density ベ ー ス ク ラ ス タ リ ン を グ way with い て proposal し た way の performance up を refers す designated で あ る.

项目成果

期刊论文数量(6)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Yitong Wang, Masaru Kitsuregawa: "Evaluating contents-link coupled web page clustering for web Search Results"Proceedings of Eleventh International Conference on Information and Knowledge Management (ACM Press). 499-506 (2002)
Yitong Wang、Masaru Kitsurekawa:“评估网络搜索结果的内容链接耦合网页聚类”第十一届国际信息和知识管理会议论文集(ACM Press)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
Yitong Wang, Masaru Kitsuregawa: "An Link-Contents Coupled Clustering for Web Search Results"第1回情報科学技術フォーラム(FIT2002). (2002)
Yitong Wang,Masaru Kitsurekawa:“网络搜索结果的链接内容耦合聚类”第一届信息科学与技术论坛(FIT2002)(2002 年)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
王 イートン, 喜連川 優: "Enhancing Contents-Link coupled Web page Mustering and Its Evaluation"電子情報通信学会第14回データ工学ワークショップ(DEWS2004). (2004)
Eaton Wang、Yu Kitsurekawa:“增强内容链接耦合网页集合及其评估”IEICE 第 14 届数据工程研讨会 (DEWS2004) (2004)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
Yitong Wang, Masaru Kitsuregawa: "On Combining Link and Contents Information for Web page Clustering"Lecture Notes in Computer Science (Springer). Vol.2118. 902-913 (2002)
Yitong Wang、Masaru Kitsurekawa:“On Combining Link and Content Information for Web page Clustering”计算机科学讲义(Springer)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
Yitong Wang, Masaru Kitsuregawa: "Combining Link and Contents in Clustering Web Search Results to Improve Information Interpretation"電子情報通信学会第13回データ工学ワークショップ(DEWS2002). C4-2 (2002)
Yitong Wang、Masaru Kitsurekawa:“结合聚类 Web 搜索结果中的链接和内容以改进信息解释”IEICE 第 13 届数据工程研讨会 (DEWS2002) (C4-2)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

喜連川 優其他文献

電力を考慮したプログラミングのためのシステム構築に関する検討
考虑功耗的编程系统构建研究
  • DOI:
  • 发表时间:
    2012
  • 期刊:
  • 影响因子:
    0
  • 作者:
    横山 大作;喜連川 優;横山大作;横山大作,喜連川優;横山大作;横山大作,田浦健次朗,喜連川優
  • 通讯作者:
    横山大作,田浦健次朗,喜連川優
アウトオブオーダ型クエリ実行に基づくプラグイン型データベースエンジン加速機構
基于乱序查询执行的插件式数据库引擎加速机制
  • DOI:
  • 发表时间:
    2013
  • 期刊:
  • 影响因子:
    0
  • 作者:
    早水 悠登;合田 和生;喜連川 優
  • 通讯作者:
    喜連川 優
大規模データベースにおけるアクセス局所性を利用したVMライブマイグレーショ ンスケジューリング手法の提案と評価
大规模数据库中利用访问局部性的VM热迁移调度方法的提出与评估
  • DOI:
  • 发表时间:
    2013
  • 期刊:
  • 影响因子:
    0
  • 作者:
    石田 渉;横山 大作;中野 美由紀;豊田 正史;喜連川 優
  • 通讯作者:
    喜連川 優
アウトオブオーダ型クエリ実行に基づくプラグイン可能なデータベースエンジン加速機構
基于乱序查询执行的可插拔数据库引擎加速机制
発話状況を意識したオンライン上の対話における応答選択
在线对话中的响应选择与对话情境的意识
  • DOI:
  • 发表时间:
    2016
  • 期刊:
  • 影响因子:
    0
  • 作者:
    佐藤 翔悦;石渡 祥之佑;吉永 直樹;豊田 正史;喜連川 優
  • 通讯作者:
    喜連川 優

喜連川 優的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('喜連川 優', 18)}}的其他基金

自律的負荷均衡機能を有するデペンダブルなGRID・P2P構築の為の基盤技術
构建具有自主负载均衡功能的可靠GRID/P2P的基础技术
  • 批准号:
    03F03259
  • 财政年份:
    2003
  • 资助金额:
    $ 1.22万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
自律的負荷分散機能を有するデペンダブルなGRID・P2P構築の為の基盤技術
构建具有自主负载分配功能的可靠GRID/P2P的基础技术
  • 批准号:
    03F00259
  • 财政年份:
    2003
  • 资助金额:
    $ 1.22万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
我国における全WEBグラフからのサイバーコミュニティの抽出とその成長過程の解析
从日本所有网络图中提取网络社区并分析其成长过程
  • 批准号:
    13480078
  • 财政年份:
    2001
  • 资助金额:
    $ 1.22万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
データマイニングによる高度自己管理機構を有す次世代ストレージアーキテクチャの確立
利用数据挖掘建立具有先进自我管理机制的下一代存储架构
  • 批准号:
    13852015
  • 财政年份:
    2001
  • 资助金额:
    $ 1.22万
  • 项目类别:
    Grant-in-Aid for Scientific Research (S)
ストレージエリアネットワークを利用した動的負荷変動に強い統合データ管理機構の開発
使用存储区域网络开发抗动态负载波动的综合数据管理机制
  • 批准号:
    13358003
  • 财政年份:
    2001
  • 资助金额:
    $ 1.22万
  • 项目类别:
    Grant-in-Aid for Scientific Research (A)
モバイル型データベースのためのブロードキャストディスクアーキテクチャの研究
移动数据库广播磁盘架构研究
  • 批准号:
    00F00098
  • 财政年份:
    2000
  • 资助金额:
    $ 1.22万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
メディアサーバの為の同時実行制御の研究
媒体服务器并发控制研究
  • 批准号:
    98F00317
  • 财政年份:
    1999
  • 资助金额:
    $ 1.22万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
メディアサーバの為の同時実行制御の研究
媒体服务器并发控制研究
  • 批准号:
    97F00020
  • 财政年份:
    1998
  • 资助金额:
    $ 1.22万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
情報ス-パハイウェイ環境に適した超分散マルチメディア情報ベースシステムの検討
适合信息高速公路环境的超分布式多媒体信息库系统研究
  • 批准号:
    07358003
  • 财政年份:
    1995
  • 资助金额:
    $ 1.22万
  • 项目类别:
    Grant-in-Aid for Co-operative Research (B)
超並列データベースサーバアーキテクチャの研究
大规模并行数据库服务器体系结构研究
  • 批准号:
    05219205
  • 财政年份:
    1993
  • 资助金额:
    $ 1.22万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas

相似海外基金

NeTS: Small: Incentivizing Internet-Scale Web Mining with Webcoin
NeTS:小型:利用 Webcoin 激励互联网规模的网络挖矿
  • 批准号:
    1810582
  • 财政年份:
    2018
  • 资助金额:
    $ 1.22万
  • 项目类别:
    Standard Grant
Social web mining and sentiment analysis for mental illness detection
用于精神疾病检测的社交网络挖掘和情感分析
  • 批准号:
    478857-2015
  • 财政年份:
    2017
  • 资助金额:
    $ 1.22万
  • 项目类别:
    Strategic Projects - Group
Social web mining and sentiment analysis for mental illness detection
用于精神疾病检测的社交网络挖掘和情感分析
  • 批准号:
    478857-2015
  • 财政年份:
    2016
  • 资助金额:
    $ 1.22万
  • 项目类别:
    Strategic Projects - Group
Social web mining and sentiment analysis for mental illness detection
用于精神疾病检测的社交网络挖掘和情感分析
  • 批准号:
    478857-2015
  • 财政年份:
    2015
  • 资助金额:
    $ 1.22万
  • 项目类别:
    Strategic Projects - Group
Supporting Autonomous Learning Based on Web Mining
支持基于Web挖掘的自主学习
  • 批准号:
    26750085
  • 财政年份:
    2014
  • 资助金额:
    $ 1.22万
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)
Web mining to protect mobile app users against fraud
网络挖掘可保护移动应用程序用户免遭欺诈
  • 批准号:
    436866-2012
  • 财政年份:
    2012
  • 资助金额:
    $ 1.22万
  • 项目类别:
    Engage Grants Program
Development of memory-saving and time-efficient Web mining strategies and its applications on cloud computing
节省内存、高效的Web挖掘策略开发及其在云计算上的应用
  • 批准号:
    24500178
  • 财政年份:
    2012
  • 资助金额:
    $ 1.22万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Hardware support for desktop web mining
桌面网络挖掘的硬件支持
  • 批准号:
    36401-2006
  • 财政年份:
    2010
  • 资助金额:
    $ 1.22万
  • 项目类别:
    Discovery Grants Program - Individual
Hardware support for desktop web mining
桌面网络挖掘的硬件支持
  • 批准号:
    36401-2006
  • 财政年份:
    2009
  • 资助金额:
    $ 1.22万
  • 项目类别:
    Discovery Grants Program - Individual
Hardware support for desktop web mining
桌面网络挖掘的硬件支持
  • 批准号:
    36401-2006
  • 财政年份:
    2008
  • 资助金额:
    $ 1.22万
  • 项目类别:
    Discovery Grants Program - Individual
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了