ソーシャルメディアからの言語横断的な話題抽出に関する研究

社交媒体跨语言主题抽取研究

基本信息

  • 批准号:
    16J05352
  • 负责人:
  • 金额:
    $ 0.83万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
  • 财政年份:
    2016
  • 资助国家:
    日本
  • 起止时间:
    2016-04-22 至 2018-03-31
  • 项目状态:
    已结题

项目摘要

本研究課題では、Twitterに代表されるソーシャルメディアから言語横断的に話題を抽出し、異なる言語間で共通して話題となっている情報、あるいは、特定の言語のみ話題となっている情報など、言語の壁を超えた話題情報の分析を可能とする枠組みの構築を目指している。言語横断的な話題抽出により、異なる言語圏の話題情報の比較が可能となるため、言語の違いだけでなく、国や文化、さらには、ソーシャルメディアのユーザの居住地や所属コミュニティなど様々な観点からソーシャルメディア上の話題の包括的な分析への応用が期待される。本年度は以下のような課題に取り組んだ。従来の話題抽出手法はソーシャルメディアのテキスト中の単語の出現回数などの統計情報から話題を表す単語もしくは単語群を抽出するため、抽出した話題を異なる言語間で比較することができなかった。そこで、テキスト中の話題を表す単語を多言語Web百科事典Wikipediaの記事に対応付けるエンティティリンキング手法を提案した。Wikipediaでは同じ概念を表す異なる言語の記事は言語間リンクと呼ばれるリンクにより互いに繋がっているため、異なる言語から抽出した話題についても比較が可能となる。また、前述の方法により抽出した話題情報について、言語間の共通点あるいは相違点を抽出する手法についても検討を進めた。例えば、複数の言語間で継続的に話題になっているような情報であっても、その話題の度合や関連して話題になっている情報が言語間で異なると考えられる。そこで、ソーシャルメディア上の話題を、互いに関連する話題同士を繋げたグラフ構造として表現し、各言語の話題グラフを比較することで対象の話題の共通点や相違点を明らかできる。
In this study, the topic, Twitter represents the problem extraction of the cross-section of the topic, the common problem in the language, the situation, and the analysis of the situation in the wall. Cross-sectional questions are drawn and compared with each other in terms of possible information, language, culture, culture, education, home, and so on. This year, we will learn about the organization of the following questions. The method of drawing out the problem is that the number of responses is found in the statistics table of the problem table, the group draws out the problem, the problem is drawn out, and there is a comparison between words and expressions. The list of questions in the Web Encyclopedia, the Encyclopedia of Wikipedia, the Chronicle, the Encyclopedia, the Chronicle, the Encyclopedia, the Encyclopedia. Wikipedia talks about concepts, records, records The aforementioned methods are used to extract information, information, words, common points, points, For example, the problem of communication between two or more languages, such as the number of words, and so on. This is the same as the common point of the problem, the common point of the problem, the common point, the common point.

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Cross-lingual Trend Extraction from Social Media
从社交媒体中提取跨语言趋势
  • DOI:
  • 发表时间:
    2016
  • 期刊:
  • 影响因子:
    0
  • 作者:
    T. Nakamura;M. Shirakawa and T. Hara
  • 通讯作者:
    M. Shirakawa and T. Hara
Linking Bursty Terms on Twitter to Wikipedia towards Trend Analysis
将 Twitter 上的突发术语链接到维基百科以进行趋势分析
  • DOI:
  • 发表时间:
    2016
  • 期刊:
  • 影响因子:
    0
  • 作者:
    T. Nakamura;M. Shirakawa and T. Hara
  • 通讯作者:
    M. Shirakawa and T. Hara
Wikipediaのページビュー数を用いたツイートに対するエンティティリンキング
使用维基百科页面视图计数的推文实体链接
  • DOI:
  • 发表时间:
    2017
  • 期刊:
  • 影响因子:
    0
  • 作者:
    中村 達哉;白川 真澄;原 隆浩
  • 通讯作者:
    原 隆浩
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

中村 達哉其他文献

Deep Learningによる指文字認識システムの開発
利用深度学习开发手指字符识别系统
  • DOI:
  • 发表时间:
    2017
  • 期刊:
  • 影响因子:
    0
  • 作者:
    高橋真司;仲間 祐貴;土門 寛幸;中村 達哉;松木 俊貴
  • 通讯作者:
    松木 俊貴
組込みシステム実習教育を支援するための拡張現実感による学習情報の可視化
利用增强现实实现学习信息可视化,支持嵌入式系统培训教育
  • DOI:
  • 发表时间:
    2017
  • 期刊:
  • 影响因子:
    0
  • 作者:
    高橋真司;仲間 祐貴;土門 寛幸;中村 達哉;松木 俊貴;小木曽 晴信・矢ケ崎 朋樹;原槙 稔幸
  • 通讯作者:
    原槙 稔幸
テレイグジスタンスの研究 (第 87 報) ―空中における身体拡張感のための飛行型テレイグジスタンスシステムの提案―
远程存在研究(第87次报告) - 提出一种飞行远程存在系统,以实现空中物理膨胀感 -
  • DOI:
  • 发表时间:
    2016
  • 期刊:
  • 影响因子:
    0
  • 作者:
    中村 達哉;白川 真澄;原 隆浩;西尾 章治郎;早川 裕彦,MHD Yamen Saraiji,Charith Fernando,南澤 孝太,舘 暲
  • 通讯作者:
    早川 裕彦,MHD Yamen Saraiji,Charith Fernando,南澤 孝太,舘 暲
Twitterユーザの関心の表現に適したデータ構造の検証
验证适合表达 Twitter 用户兴趣的数据结构
  • DOI:
  • 发表时间:
    2016
  • 期刊:
  • 影响因子:
    0
  • 作者:
    松岡 紀行;中村 達哉;白川 真澄;原 隆浩;西尾 章治郎
  • 通讯作者:
    西尾 章治郎
福島からの報告
来自福岛的报告
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
    中村 達哉;白川 真澄;原 隆浩;西尾 章治郎;庄 建倉;山下俊一
  • 通讯作者:
    山下俊一

中村 達哉的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('中村 達哉', 18)}}的其他基金

施工性を考慮した木質グリッドシェル構造の接合部実用化に向けた補強金物の導入
考虑到施工的简便性,引入了用于木网格壳结构接缝实际使用的加固硬件
  • 批准号:
    24H02564
  • 财政年份:
    2024
  • 资助金额:
    $ 0.83万
  • 项目类别:
    Grant-in-Aid for Encouragement of Scientists

相似海外基金

Time Series Topic Extraction from Millions of Tweets after the East Japan Great Earthquake Considering Author's Role
考虑作者角色的东日本大地震后数百万条推文的时间序列主题提取
  • 批准号:
    15K00314
  • 财政年份:
    2015
  • 资助金额:
    $ 0.83万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
A code clone detection approach based on topic extraction
一种基于主题提取的代码克隆检测方法
  • 批准号:
    26730036
  • 财政年份:
    2014
  • 资助金额:
    $ 0.83万
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了