正当な電子メールの特徴を利用した言語の種類に依存しない迷惑メールフィルターの開発
开发利用合法电子邮件特征的独立于语言的垃圾邮件过滤器
基本信息
- 批准号:21700078
- 负责人:
- 金额:$ 2.83万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Young Scientists (B)
- 财政年份:2009
- 资助国家:日本
- 起止时间:2009 至 2011
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
正当な電子メールの特徴に着目し、言語の種類に依存しない迷惑メールフィルターシステムを構築した。また、処理速度および分類精度の向上を図るため、電子メール受信モジュール、言語解析モジュール、機械学習モジュール、電子メール分類モジュールなどに分割したシステム設計を行った。特に、機械学習モジュールは別サーバ上での実行を想定して、データの自動入出力インターフェイスを実装した。これにより、比較的処理時間の長くかかる機械学習処理をクラスターPCなどの別サーバ上で処理することが可能となり、分類精度を低下させることなく処理時間の短縮が実現できた。また、分類精度のさらなる改善を目的に、学習に利用する電子メール情報(本文情報、メールヘッダ情報)の組み合わせを検討すると同時に、本プロジェクトで開発したものとは別のメールフィルタリングソフト(ベイジアンフィルタ)を併用して分類処理することで、より分類精度を高くできることを明らかにした。二つのフィルターシステムは、異なる指標でメール分類規則を導き出すため、今回の結果は、正規メールの回収率は高いが迷惑メールを多く混入してしまうベイジアンフィルタの短所を、本プロジェクトで開発したメールフィルターシステムが補完して、迷惑メールの混入を防ぐことが出来たことによる精度の向上と考えられた。さらに、分類判定のパラメーターを最適化することで、これまで約97%の分類正解率を、およそ99%に引き上げることができた。
Just as the characteristics of electronic media are dependent on the type of speech, the structure of electronic media is confused. For example, processing speed and classification accuracy are improved, electronic equipment is received, speech analysis is performed, mechanical learning is performed, electronic equipment classification is performed, and classification is performed. In particular, mechanical learning is the implementation of the idea of setting up an automatic input and output mechanism for the system. The processing time for comparison is long, and the processing time for machine learning is short. For the purpose of improving classification accuracy and learning, the combination of electronic information (text information, media information) is discussed. At the same time, the application of electronic information to classification processing is discussed. 2. The classification rules are introduced, the results are returned, the return rate of regular products is high, the confusion rate is high, and the accuracy of the classification rules is improved. The classification accuracy is about 97%, and the classification accuracy is about 99%.
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
メーリングリストを対象とした機械学習によるスパムメールの分類
使用机器学习对邮件列表进行垃圾邮件分类
- DOI:
- 发表时间:2009
- 期刊:
- 影响因子:0
- 作者:村中慎治;廣森聡仁;山口弘純;東野輝夫;杉井学;山口博之;山口博之;角朝香
- 通讯作者:角朝香
ベイジアン方式と機械学習の併用によるスパムメールフィルタリング
使用贝叶斯方法和机器学习过滤垃圾邮件
- DOI:
- 发表时间:2010
- 期刊:
- 影响因子:0
- 作者:村中慎治;廣森聡仁;山口弘純;東野輝夫;杉井学;山口博之;山口博之
- 通讯作者:山口博之
機械学習によるメールヘッダ情報に基づく迷惑メールフィルタリング
使用机器学习基于电子邮件标头信息过滤垃圾邮件
- DOI:
- 发表时间:2010
- 期刊:
- 影响因子:0
- 作者:村中慎治;廣森聡仁;山口弘純;東野輝夫;杉井学
- 通讯作者:杉井学
ベイジアン方式と機械学習を併用したスパムメールフィルタの検討
使用贝叶斯方法和机器学习的垃圾邮件过滤器的考虑
- DOI:
- 发表时间:2010
- 期刊:
- 影响因子:0
- 作者:村中慎治;廣森聡仁;山口弘純;東野輝夫;杉井学;山口博之
- 通讯作者:山口博之
機械学習を応用したスパムメールフィルタリング手法の検討と評価
应用机器学习的垃圾邮件过滤方法研究与评估
- DOI:
- 发表时间:2009
- 期刊:
- 影响因子:0
- 作者:村中慎治;廣森聡仁;山口弘純;東野輝夫;杉井学;山口博之;山口博之;角朝香;角朝香
- 通讯作者:角朝香
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
杉井 学其他文献
言語分布地図を扱うGIS構築
处理语言分布图的 GIS 构建
- DOI:
- 发表时间:
2006 - 期刊:
- 影响因子:0
- 作者:
Tokumaru;Aid;徳丸 亜木;徳丸亜木;古家信平;乾 秀行;乾 秀行;乾 秀行;柘植 洋一;柘植 洋一;Yoichi TSUGE;小脇 光男;Akio NAKANO;杉井 学;杉井 学 - 通讯作者:
杉井 学
Synthetic Speech for Foreign Language Learning : A Viewpoint of Teachers
外语学习中的合成语音:教师的观点
- DOI:
- 发表时间:
2007 - 期刊:
- 影响因子:0
- 作者:
森山潤;三浦吉信;松浦正史;小川 勤;杉井 学;M. Sugii;糸長 雅弘;M. Itonaga;T. Ogawa;小柏 香穂理;M. Sugii;糸長 雅弘;M. Itonaga;康 敏 - 通讯作者:
康 敏
地方と都市のバスケト語母語話者の言語使用
城乡篮球母语者的语言使用情况
- DOI:
- 发表时间:
2008 - 期刊:
- 影响因子:0
- 作者:
葉山アツコ;葉山アツコ;Hayama Atsuko;葉山アツコ;葉山アツコ;葉山アツコ;葉山アツコ;葉山アツコ;葉山アツコ;乾秀行;乾秀行;乾秀行;柘植洋一;小脇光男;柘植洋一;乾秀行;乾秀行;小脇光男;柘植洋一;乾秀行;柘植洋一;乾 秀行;柘植 洋一;小脇 光男;杉井 学;乾秀行;乾秀行;乾秀行 - 通讯作者:
乾秀行
マロ語の音素目録
马洛语音素清单
- DOI:
- 发表时间:
2007 - 期刊:
- 影响因子:0
- 作者:
葉山アツコ;葉山アツコ;Hayama Atsuko;葉山アツコ;葉山アツコ;葉山アツコ;葉山アツコ;葉山アツコ;葉山アツコ;乾秀行;乾秀行;乾秀行;柘植洋一;小脇光男;柘植洋一;乾秀行;乾秀行;小脇光男;柘植洋一;乾秀行;柘植洋一;乾 秀行;柘植 洋一;小脇 光男;杉井 学;乾秀行;乾秀行;乾秀行;柘植洋一;小脇光男;杉井学;小脇光男;杉井学;Yoichi TSUGE;小脇光男;杉井学;乾 秀行;乾 秀行;乾 秀行;小脇 光男;杉井 学;乾秀行 - 通讯作者:
乾秀行
On the development of e-learning material for the information security education
浅谈信息安全教育电子教材的开发
- DOI:
- 发表时间:
2007 - 期刊:
- 影响因子:0
- 作者:
森山潤;三浦吉信;松浦正史;小川 勤;杉井 学;M. Sugii - 通讯作者:
M. Sugii
杉井 学的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
相似海外基金
機械学習アルゴリズムを用いた敗血症性凝固線溶障害の早期予測モデルの開発
使用机器学习算法开发脓毒性凝血和纤溶性疾病的早期预测模型
- 批准号:
24K12133 - 财政年份:2024
- 资助金额:
$ 2.83万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
アニーリングと機械学習の融合による説明可能AI基盤の研究
结合退火和机器学习研究可解释的人工智能基础设施
- 批准号:
24KJ1081 - 财政年份:2024
- 资助金额:
$ 2.83万 - 项目类别:
Grant-in-Aid for JSPS Fellows
機械学習による滑走路の離着陸容量の短期的予測手法に関する研究
基于机器学习的跑道起降能力短期预测方法研究
- 批准号:
24K07722 - 财政年份:2024
- 资助金额:
$ 2.83万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
機械学習を用いた波形解析による高速中性子エネルギー測定法の技術開拓
利用机器学习进行波形分析的快中子能量测量方法的技术开发
- 批准号:
24K08298 - 财政年份:2024
- 资助金额:
$ 2.83万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
調理シミュレーションと機械学習の融合および非接触計測による加熱制御システムの構築
结合烹饪模拟与机器学习和非接触测量构建加热控制系统
- 批准号:
24K05572 - 财政年份:2024
- 资助金额:
$ 2.83万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
肝臓内酸素動態を含む透析低血圧発症予知モデルの構築:統計・機械学習分析による解析
构建预测透析低血压发作(包括肝内氧动态)的模型:使用统计和机器学习分析进行分析
- 批准号:
24K15796 - 财政年份:2024
- 资助金额:
$ 2.83万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
臨床情報による高精度分娩進行予測モデルの開発: 機械学習の活用
利用临床信息开发高精度的分娩进展预测模型:利用机器学习
- 批准号:
24K13948 - 财政年份:2024
- 资助金额:
$ 2.83万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
新興感染症のシステマティック・レビューを機械学習を用いて簡易に実施するための研究
利用机器学习轻松对新发传染病进行系统评价的研究
- 批准号:
24K13518 - 财政年份:2024
- 资助金额:
$ 2.83万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
独立成分分析を活用した信頼性の高い機械学習手法の構築
使用独立成分分析构建可靠的机器学习方法
- 批准号:
24K15093 - 财政年份:2024
- 资助金额:
$ 2.83万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
学習過程情報に基づき理由を説明可能な高速論理型機械学習器の開発の提案
开发可根据学习过程信息解释原因的高速逻辑机器学习装置的提案
- 批准号:
24K15095 - 财政年份:2024
- 资助金额:
$ 2.83万 - 项目类别:
Grant-in-Aid for Scientific Research (C)