携帯メールの書き手の同定に関する統計的研究
移动电子邮件作者识别的统计研究
基本信息
- 批准号:19650067
- 负责人:
- 金额:$ 2.11万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Challenging Exploratory Research
- 财政年份:2007
- 资助国家:日本
- 起止时间:2007 至 2009
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
携帯メールの文面情報を構成する主な要素は、文字列と絵文字・顔文字である。携帯メールの中で同じ意味やニュワンスで用いる絵文字・顔文字は、機種によって形状が異なる。携帯機種に依存しない書き手の特徴データを抽出するため、本研究では絵文字について感情を表すもの、身振り・抑揚を表すもの、装飾として用いられているもののようにカテゴリ化し、データ集計を行った。文字列データ関しては、機械的に集計を行った。21年度は、これらのデータ抽出の見直しおよびチェックとそのデータに基づいた書き手の識別について繰り返し実験を行った。実験分析では、絵文字・顔文字データ、文面の文字列データを結合し、サポートベクターマシン法、バキング法、ブースティング法、ランダムフォレスト法など機械学習法の分類器を用いた。正解率の評価は交差確認法を用いた。その結果、正解率は分類器によって若干異なるが、平均約90%の正解率で書き手を同定することが可能であることが分かった。しかし、書き手の同定の正解率は、同定すべく書き手の組み合わせによって、そのバラツキが大きい。任意の2人間の場合、交差確認法による正解率の範囲は約70%~99%になることが分かった。また、本年度ではメールの書き手の同定に関連する研究として、文学作品の書き手の同定や執筆時期の推定などに関する次の研究も行った。川端康成の作品の中で三島由紀夫が代筆したと言われている作品の書き手の同定文章の執筆時期の推定-芥川龍之介の作品を例として-
The main elements of the text are: With the same meaning, the characters are different. In this study, the characteristics of the hand are extracted from the model, and the text is used to express the emotion, the body vibration is used to express the emotion, the decoration is used to express the emotion, and the collection is used to express the emotion. The text column is closed, and the mechanical column is closed. In 2011, the company was founded in 1998, and the company was founded in 1999. The classification method of machine learning is used in the combination of text analysis, text Correct solution rate evaluation and cross validation method are used. The results show that the positive solution rate of the classifier is about 90% on average. The correct solution rate of the book is the same as that of the book. In any case between two people, the range of positive solution rate is about 70%~99% This year, the research on the relationship between the author and the author, the research on the relationship between the author and the author of literary works The works of Yasunari Kawabata were written by Yukio Mishima. The works of Yukio Mishima and Yukio Mishima were written by Yukio Mishima.
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
テキストマイニングの基本的な考え方と諸種の実践事例
文本挖掘的基本思想以及各种实际例子
- DOI:
- 发表时间:2009
- 期刊:
- 影响因子:0
- 作者:瀬戸範彦;奥田哲士;中井智司;西嶋渉;岡田光正;日本シミュレーション学会;金明哲
- 通讯作者:金明哲
Authorship Identification with Same Classifiers
使用相同分类器进行作者身份识别
- DOI:
- 发表时间:2009
- 期刊:
- 影响因子:0
- 作者:Mingzhe Jin;Masakatsu Murtakami;Yuejun Zheng
- 通讯作者:Yuejun Zheng
テキスト分類とカーネル関数
文本分类和核函数
- DOI:
- 发表时间:2008
- 期刊:
- 影响因子:0
- 作者:Satoshi Nakai;T.Isobe;Wataru Nishijima;Mitsumasa Okada;Sanae Chiba;金明哲
- 通讯作者:金明哲
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
金 明哲其他文献
「ではないか」「のではないか」の談話機能 ―3種のコーパスに基づいて―
“奈奈卡”和“野奈卡”的话语功能 -基于三种语料库-
- DOI:
- 发表时间:
2022 - 期刊:
- 影响因子:0
- 作者:
柳 燁佳;金 明哲;野田春美;野田春美 - 通讯作者:
野田春美
金 明哲的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('金 明哲', 18)}}的其他基金
Integrated Ensemble Learning with Embedded Vectors in Authorship Attribution
作者归属中使用嵌入式向量的集成集成学习
- 批准号:
22K12726 - 财政年份:2022
- 资助金额:
$ 2.11万 - 项目类别:
Grant-in-Aid for Scientific Research (C)














{{item.name}}会员




