Web空間における自然な分布からの乖離現象解明

阐明网络空间中自然分布的偏差

基本信息

  • 批准号:
    16650030
  • 负责人:
  • 金额:
    $ 2.11万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Exploratory Research
  • 财政年份:
    2004
  • 资助国家:
    日本
  • 起止时间:
    2004 至 2005
  • 项目状态:
    已结题

项目摘要

経済現象や社会現象と同様に、Web空間でも自然な分布が存在することが知られている。例えば、Webページ間のリンク数の頻度分布は、魚群や都市の規模分布や大企業の所得分布と同様なベキ分布に従う。一方、このような自然な多様性から乖離する多数のWebデータも存在する。それはデータベース等から半自動的に生成される同一形式のページや、最新の話題について短期間に増加するページ群である。前者では、共通パターンや反復パターンのテンプレートの出現頻度が自然な分布から乖離し、後者では特徴的キーワードの出現頻度やページ間のリンク状況が自然な分布から乖離している。本研究は、有用な情報を自動的に発見・抽出するため、Web空間における自然な分布からの乖離現象を解明をめざした。具体的には100万件規模のWebページ群を対象に、部分文字列の出現頻度の頻度分布についてベキ分布からの乖離と定型的パターンの関連ならびに、ページ間のリンク数の分布に基づき、萌芽的Webコミュニティ、特異的Webコミュニテイの特徴解明を目指した。具体的には、シラバスに代表されるシリーズ型ページ群に対し、長さnの部分文字列で出現頻度fの文字列の種類数V(n, f)の分布を解析し、共通パターン発見アルゴリズムを開発した。また評判情報に関するページ群を収集し、一般的ページにおける形容詞の出現頻度との乖離を用いて、評判情報に特徴的な単語の抽出手法を考案した。単語の出現頻度の解析によりさらに単語間の上位下位概念に対する新しい定式化である「概念グラフ」を考案した。これは文書群から決定的に決まるもので、様々な文書群に適用できることを確認している。当初のべき分布からの乖離という方向とは異なるが、オントロジー構築への新しい可能性として今後の展開が期待できる新しいテーマと考えてる。当初予定していた、リンク構造の分析については時間的にできなかった。しかし、この「概念グラフ」は文書と単語だけでなく、ページ間のリンクの解析についても適用できる。
Social phenomena and social phenomena are the same, and natural distribution exists in Web space. For example, the frequency distribution of the number of Web pages, the size distribution of the fish population, the income distribution of large enterprises, and the distribution of the number of web pages. A party, a party For example, semi-automatic generation of the same type of page, the latest topic, short-term increase in the number of pages. The former is a natural distribution of frequency of occurrence of common and repeated patterns, while the latter is a natural distribution of frequency of occurrence of characteristic patterns. This study aims to explain the phenomenon of automatic discovery and extraction of useful information and natural distribution in Web space. Specific Web page groups with a scale of 1 million pieces are targeted, frequency distribution of occurrence frequency of partial text lines, distribution of separation and correlation of fixed text lines, distribution of number of separation between pages, basic information, budding Web page information, and characteristic solution of specific Web page information. The distribution of V(n, f), which represents the number of types of character strings with frequency f of occurrence in partial character strings, is analyzed and common character strings are discovered. The collection of adjectives, the frequency of occurrence and the method of extracting adjectives from the evaluation information, and the characteristics of the evaluation information are examined. The analysis of the frequency of occurrence of a single language is based on the new formalization of the superordinate and subordinate concepts of the single language. This document group determines whether the document group is applicable or not. In the beginning, the distribution of new information was different, and the possibility of new information was expected. The analysis of the structure of the original predetermined time is carried out. "Concept" is a term used to describe the relationship between the text and the object.

项目成果

期刊论文数量(11)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
An Approach to Analyzing Correlation between Songs/Artisits Using iTMS Playlists
使用 iTMS 播放列表分析歌曲/艺术​​家之间相关性的方法
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Yufen Dou;Eisuke Itoh;Sachio Hirokawa;Daisuke Ikeda
  • 通讯作者:
    Daisuke Ikeda
Information Extraction from Web Pages Using Semi-strucutered Data Alighment
使用半结构化数据对齐从网页中提取信息
部分文字列増幅法による共通パタン発見アルゴリズム
使用子串放大方法的常见模式发现算法
Towards Multilingual Syllabus Integration
迈向多语言教学大纲整合
交代数を用いた他言語Webテキストからの共通部分特定とラッパーの生成法
一种从其他语言的网络文本中识别公共部分并使用交替次数生成包装的方法
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

廣川 佐千男其他文献

Parallel Reduction in Type Free lambda/mu-Calculus
无类型 lambda/mu 微积分的并行归约
A Feedback System on Institutional Repository
机构知识库反馈系统
  • DOI:
  • 发表时间:
    2011
  • 期刊:
  • 影响因子:
    0
  • 作者:
    K. Baba;M. Mori;E. Ito;S. Hirokawa;馬場 謙介;森 雅生;伊東 栄典;廣川 佐千男
  • 通讯作者:
    廣川 佐千男
Trend Report of Search Sites with Complex Search
复杂搜索的搜索网站趋势报告
  • DOI:
  • 发表时间:
    2004
  • 期刊:
  • 影响因子:
    0
  • 作者:
    大森 敬介;K. Ohmori;中藤 哲也;Yasuhiro Nakatoh;山田 泰寛;Yasuhiro Yamada;原 由加里;Yukari Hara;廣川 佐千男;S. Hirokawa
  • 通讯作者:
    S. Hirokawa
Cities and biological dynamics: spatial efficiency of land use
城市与生物动力学:土地利用的空间效率
  • DOI:
  • 发表时间:
    2016
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Brendan Flanagan;廣川 佐千男;金子恵美子;和泉絵美;井奥陽子;吉田惇;Jun Yoshida
  • 通讯作者:
    Jun Yoshida
バウムガルテン『形而上学』(第四版)「経験的心理学」訳注――その1――
鲍姆加滕《形而上学》(第4版)《经验心理学》翻译笔记-第1部分-
  • DOI:
  • 发表时间:
    2015
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Brendan Flanagan;廣川 佐千男;樋笠勝士・井奥陽子・津田栞里
  • 通讯作者:
    樋笠勝士・井奥陽子・津田栞里

廣川 佐千男的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('廣川 佐千男', 18)}}的其他基金

リンク情報とWebデータの半構造性を融合した高品質コンテンツ・マイニング
结合链接信息和半结构化网络数据的高质量内容挖掘
  • 批准号:
    16016267
  • 财政年份:
    2004
  • 资助金额:
    $ 2.11万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
リンク情報とWebデータの半構造性を融合した高品質コンテンツ・マイニング
结合链接信息和半结构化网络数据的高质量内容挖掘
  • 批准号:
    15017269
  • 财政年份:
    2003
  • 资助金额:
    $ 2.11万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
リンク情報とWebデータの半構造性を融合した高品質コンテンツ・マイニング
结合链接信息和半结构化网络数据的高质量内容挖掘
  • 批准号:
    14019069
  • 财政年份:
    2002
  • 资助金额:
    $ 2.11万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
リンク情報とWebデータの半構造性を融合した高品質広域コンテンツ・マイニング
结合链接信息和半结构化网络数据的高质量广域内容挖掘
  • 批准号:
    13224072
  • 财政年份:
    2001
  • 资助金额:
    $ 2.11万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas (C)
WWWリンク動的ナビゲーションの研究
WWW链接动态导航研究
  • 批准号:
    10878047
  • 财政年份:
    1998
  • 资助金额:
    $ 2.11万
  • 项目类别:
    Grant-in-Aid for Exploratory Research
リンク情報からの知識網構成に関する研究
基于链接信息的知识网络构建研究
  • 批准号:
    11130217
  • 财政年份:
    1998
  • 资助金额:
    $ 2.11万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas (A)
リンク情報からの知識網構成に関する研究
基于链接信息的知识网络构建研究
  • 批准号:
    10143215
  • 财政年份:
    1998
  • 资助金额:
    $ 2.11万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas (A)

相似海外基金

デジタルツインに向けた積雪寒冷都市の公共空間デザインのための行動意識解析評価
面向数字孪生的冰雪寒冷城市公共空间设计行为认知分析评估
  • 批准号:
    22K04486
  • 财政年份:
    2022
  • 资助金额:
    $ 2.11万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
ウェアラブルヘルスモニタリングに向けたマルチスケール心拍変動解析・評価技術の開発
可穿戴健康监测多尺度心率变异性分析评估技术开发
  • 批准号:
    19H04506
  • 财政年份:
    2019
  • 资助金额:
    $ 2.11万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
衝撃波による植物細胞破壊現象の画像解析評価
冲击波引起植物细胞破坏现象的图像分析评价
  • 批准号:
    20923009
  • 财政年份:
    2008
  • 资助金额:
    $ 2.11万
  • 项目类别:
    Grant-in-Aid for Encouragement of Scientists
プリオン/アミロイド型蛋白質凝集の生細胞系での解析・評価システムの開発
开发活细胞系统中朊病毒/淀粉样蛋白聚集体的分析和评估系统
  • 批准号:
    15659050
  • 财政年份:
    2003
  • 资助金额:
    $ 2.11万
  • 项目类别:
    Grant-in-Aid for Exploratory Research
電子顕微鏡による複合機能ナノ空間の構造解析・評価
使用电子显微镜对多功能纳米空间进行结构分析和评估
  • 批准号:
    14045202
  • 财政年份:
    2002
  • 资助金额:
    $ 2.11万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
人工血管置換による血行動態変化の工学的解析評価システムの開発
人工血管置换引起的血流动力学变化工程分析评价系统的开发
  • 批准号:
    13770751
  • 财政年份:
    2001
  • 资助金额:
    $ 2.11万
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)
パラレルワイヤ駆動機構の解析・評価・設計・制御システム
平行线驱动机构分析、评估、设计与控制系统
  • 批准号:
    11750115
  • 财政年份:
    1999
  • 资助金额:
    $ 2.11万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
受水域の水質影響を考慮したポイント・ノンポイント負荷の解析・評価
考虑受纳区水质影响的点、面荷载分析与评价
  • 批准号:
    10750413
  • 财政年份:
    1998
  • 资助金额:
    $ 2.11万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
微細粒子を用いた局所心筋マイクロストレインの解析・評価
细颗粒局部心肌微应变分析与评价
  • 批准号:
    10780545
  • 财政年份:
    1998
  • 资助金额:
    $ 2.11万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
音素・単語・フレーズの同時スポッティングによる対話音声の解析評価
通过同时识别音素、单词和短语来分析和评估对话语音
  • 批准号:
    07221216
  • 财政年份:
    1995
  • 资助金额:
    $ 2.11万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了