リンク情報とWebデータの半構造性を融合した高品質広域コンテンツ・マイニング

结合链接信息和半结构化网络数据的高质量广域内容挖掘

基本信息

  • 批准号:
    13224072
  • 负责人:
  • 金额:
    --
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas (C)
  • 财政年份:
    2001
  • 资助国家:
    日本
  • 起止时间:
    2001 至 无数据
  • 项目状态:
    已结题

项目摘要

Webデータは人間が作成するにせよ、データベース等から半自動的に生成されるにせよ、ハイパーリンクと半構造性の2つの特色を持ち、これが従来のリレーショナル・データや単純なテキストデータやマルチメディア・データと大きく異なる点である。本研究は、同一の意味的内容のコンテンツを持つ高品質な広域Webデータ群を抽出するために、リンク情報とWebデータの半構造性を融合した手法の開発研究を行った。従来開発してきたリンクデータベースでは、存在しなくなったページや、誤った記述を含むページの処理でハングアップするという問題があった。そこで本年度はまず、postgressを使い頑強なリンクデータベースを再構築した。また、テキスト中のn-gramの出現頻度と長さnに基づき、重要部分と非重要部分を分離する手法を開発した。その成果は、国際会議における2編の論文として発表した。リンク情報を知識として活用する枠組みとして、Webのナビゲーションへの応用システムを開発し、ICCE2001ならびにWebNet2001において論文発表した。関連するWebページ群を、その間のリンク情報を用いてグラフをして表現し、そのコミュニティ分析にグラフを表す行列の特異値分解が有効であることを具体例を用いて示した。
Web data is generated from semi-automatic data sets, such as data sets, data sets, and data sets. This study aims to develop a method for extracting high-quality web data from a single content, and for integrating information and web data into a semi-structured web. In the future, there will be problems with the development of new technologies, including the processing of new technologies. This year, we will re-establish the "post-stress" system. The frequency and length of the n-gram in the list are different, and the important part and the non-important part are different. The results of international conferences and international conferences are presented in two series of papers. The development of information technology and application systems for Web applications, ICCE2001 and WebNet2001 For example, if you want to use the Web site, you can use it to analyze the content of the Web site.

项目成果

期刊论文数量(5)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
K.Nishino, S.Hirokawa: "Rapid Prototyping of WWW Tour from Browsing History and Link"Proc. ICCE/Shool Net2001. 1545-1548 (2001)
K.Nishino、S.Hirokawa:“通过浏览历史和链接快速构建 WWW 旅游原型”Proc。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
廣川佐千男, 池田大輔: "Webグラフの構造解析"人工知能学会誌. 16・4. 525-529 (2001)
Sachio Hirokawa、Daisuke Ikeda:“网络图的结构分析”人工智能学会杂志 16・4(2001 年)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
Y.Yamada, D.Ikeda, S.Hirokawa: "SCOOP : A Record Extractor without Knowledge on Input"Springer LNCS. 2226. 225-228 (2001)
Y.Yamada、D.Ikeda、S.Hirokawa:“SCOOP:无需输入知识的记录提取器”Springer LNCS。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
K.Nishino, D.Nagano, S.Hirokawa: "Generation of Navigation Script from Log and Link"Proc. WebNet 2001. 534-539 (2001)
K.Nishino、D.Nagano、S.Hirokawa:“从日志和链接生成导航脚本”Proc。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
D.Ikeda, Y.Yamada, S.Hirokawa: "Eliminating Useless Parts in Semi-structured Documents using Alternation Counts"Springer LNCS. 2226. 113-127 (2001)
D.Ikeda、Y.Yamada、S.Hirokawa:“使用交替计数消除半结构化文档中无用的部分”Springer LNCS。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

廣川 佐千男其他文献

Parallel Reduction in Type Free lambda/mu-Calculus
无类型 lambda/mu 微积分的并行归约
A Feedback System on Institutional Repository
机构知识库反馈系统
  • DOI:
  • 发表时间:
    2011
  • 期刊:
  • 影响因子:
    0
  • 作者:
    K. Baba;M. Mori;E. Ito;S. Hirokawa;馬場 謙介;森 雅生;伊東 栄典;廣川 佐千男
  • 通讯作者:
    廣川 佐千男
Trend Report of Search Sites with Complex Search
复杂搜索的搜索网站趋势报告
  • DOI:
  • 发表时间:
    2004
  • 期刊:
  • 影响因子:
    0
  • 作者:
    大森 敬介;K. Ohmori;中藤 哲也;Yasuhiro Nakatoh;山田 泰寛;Yasuhiro Yamada;原 由加里;Yukari Hara;廣川 佐千男;S. Hirokawa
  • 通讯作者:
    S. Hirokawa
Cities and biological dynamics: spatial efficiency of land use
城市与生物动力学:土地利用的空间效率
  • DOI:
  • 发表时间:
    2016
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Brendan Flanagan;廣川 佐千男;金子恵美子;和泉絵美;井奥陽子;吉田惇;Jun Yoshida
  • 通讯作者:
    Jun Yoshida
バウムガルテン『形而上学』(第四版)「経験的心理学」訳注――その1――
鲍姆加滕《形而上学》(第4版)《经验心理学》翻译笔记-第1部分-
  • DOI:
  • 发表时间:
    2015
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Brendan Flanagan;廣川 佐千男;樋笠勝士・井奥陽子・津田栞里
  • 通讯作者:
    樋笠勝士・井奥陽子・津田栞里

廣川 佐千男的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('廣川 佐千男', 18)}}的其他基金

Web空間における自然な分布からの乖離現象解明
阐明网络空间中自然分布的偏差
  • 批准号:
    16650030
  • 财政年份:
    2004
  • 资助金额:
    --
  • 项目类别:
    Grant-in-Aid for Exploratory Research
リンク情報とWebデータの半構造性を融合した高品質コンテンツ・マイニング
结合链接信息和半结构化网络数据的高质量内容挖掘
  • 批准号:
    16016267
  • 财政年份:
    2004
  • 资助金额:
    --
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
リンク情報とWebデータの半構造性を融合した高品質コンテンツ・マイニング
结合链接信息和半结构化网络数据的高质量内容挖掘
  • 批准号:
    15017269
  • 财政年份:
    2003
  • 资助金额:
    --
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
リンク情報とWebデータの半構造性を融合した高品質コンテンツ・マイニング
结合链接信息和半结构化网络数据的高质量内容挖掘
  • 批准号:
    14019069
  • 财政年份:
    2002
  • 资助金额:
    --
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
WWWリンク動的ナビゲーションの研究
WWW链接动态导航研究
  • 批准号:
    10878047
  • 财政年份:
    1998
  • 资助金额:
    --
  • 项目类别:
    Grant-in-Aid for Exploratory Research
リンク情報からの知識網構成に関する研究
基于链接信息的知识网络构建研究
  • 批准号:
    11130217
  • 财政年份:
    1998
  • 资助金额:
    --
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas (A)
リンク情報からの知識網構成に関する研究
基于链接信息的知识网络构建研究
  • 批准号:
    10143215
  • 财政年份:
    1998
  • 资助金额:
    --
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas (A)

相似海外基金

GPUクラスタを用いた半構造データの並列分散処理基盤の構築
利用GPU集群构建半结构化数据并行分布式处理平台
  • 批准号:
    15J02121
  • 财政年份:
    2015
  • 资助金额:
    --
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
データの更新に対して頑健・高速な半構造データからの情報抽出アルゴリズムの構築
从半结构化数据构建信息提取算法,该算法对数据更新具有鲁棒性和快速性
  • 批准号:
    18700154
  • 财政年份:
    2006
  • 资助金额:
    --
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)
木の編集距離による近似パタン発見と半構造データからの情報抽出
使用树编辑距离和半结构化数据信息提取的近似模式发现
  • 批准号:
    17700138
  • 财政年份:
    2005
  • 资助金额:
    --
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)
最適パターン発見に基づく大規模半構造データからの知的情報獲得システムの開発
基于最优模式发现的大规模半结构化数据智能信息获取系统开发
  • 批准号:
    16016266
  • 财政年份:
    2004
  • 资助金额:
    --
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
最適パターン発見に基づく大規模半構造データからの知的情報獲得システムの開発
基于最优模式发现的大规模半结构化数据智能信息获取系统开发
  • 批准号:
    15017268
  • 财政年份:
    2003
  • 资助金额:
    --
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
大規模半構造データからの知織発見
从大规模半结构化数据中发现知识
  • 批准号:
    03J07730
  • 财政年份:
    2003
  • 资助金额:
    --
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
最適パターン発見に基づく大規模半構造データからの知的情報獲得システムの開発
基于最优模式发现的大规模半结构化数据智能信息获取系统开发
  • 批准号:
    14019070
  • 财政年份:
    2002
  • 资助金额:
    --
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
最適パターン発見に基づく大規模半構造データからの知的情報獲得システムの開発
基于最优模式发现的大规模半结构化数据智能信息获取系统开发
  • 批准号:
    13224073
  • 财政年份:
    2001
  • 资助金额:
    --
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas (C)
半構造データからのスキーマ情報抽出アルゴリズムの開発
半结构化数据模式信息提取算法的开发
  • 批准号:
    12780317
  • 财政年份:
    2000
  • 资助金额:
    --
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
テキストマイニング技術を用いた半構造データ可視化システムの構成技術に関わる研究
利用文本挖掘技术的半结构化数据可视化系统配置技术相关研究
  • 批准号:
    11130211
  • 财政年份:
    1999
  • 资助金额:
    --
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas (A)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了