Quantification of writing style feature of reports using machine learning

使用机器学习量化报告的写作风格特征

基本信息

  • 批准号:
    20K03135
  • 负责人:
  • 金额:
    $ 1.83万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
  • 财政年份:
    2020
  • 资助国家:
    日本
  • 起止时间:
    2020-04-01 至 2024-03-31
  • 项目状态:
    已结题

项目摘要

本研究では授業課題レポート作成者の「記述特徴」(書き方の「クセ」)を記述スタイルモデルに学習させ、作成者認証を行うことで内容の類似したレポート文書における盗用を発見する手法を提案している。従来の内容に基づく類似性検出で危惧される、レポート内単語の偶然の一致による誤判定リスクの軽減が期待される一方で、本手法には作成者認証における前処理として過去に作成した複数のレポート文書を予めモデルに学習させておく必要があるというデメリットがある。この問題を解決するため、作成者の記述特徴の一つとしてWord文書をXML解析することで得られる書式情報を定量化し、説明変数として用いる手法を新たに提案した。本年度は実際の授業で提出されたレポート文書を対象とした評価実験を行い、90%の精度でレポート作成者の識別を行えることを確認し、査読付き学術雑誌に論文が掲載された。また、作成者識別結果の可視化に関する検討の一つとして、k-means法によるクラスタリングを行った。
这项研究提出了一种通过学习描述样式模型并对创建者进行认证以识别具有相似内容的报告文档中的pla窃的方法,通过学习类分配报告创建者的“描述性特征”(写作的“怪癖”(写作的“怪癖”),发现具有相似内容的报告文档的窃方法。尽管预计由于报告中的单词巧合而导致虚假判断的风险,但基于常规内容的相似性检测而担心,但该方法的缺点是,过去在过去中创建的多个报告文档必须在模型中提前培训,以作为作者身份验证的预处理。为了解决这个问题,我们提出了一种新方法,用于量化通过使用XML作为作者描述特征之一分析Word文档获得的格式信息,并将其用作解释变量。今年,对实际课程提交的报告文件进行了一项评估实验,证实可以以90%的准确性来确定报告作者,并在同行评审的学术期刊上发表了该论文。此外,使用K-均值方法进行聚类,作为创建者识别结果可视化研究的一部分。

项目成果

期刊论文数量(10)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Application of Web-based Visual Compiler to Computer Education
基于网络的可视化编译器在计算机教育中的应用
Acquisition of Synonyms for Colloquial Expressions in Science Reports Using Word2vec
使用 Word2vec 获取科学报告中口语表达的同义词
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    志村聖子;大久保真利子;出口実紀;斉藤 準;中橋 雄;本田 光来,髙橋 晶子,大河 雄一,趙 秀敏,三石 大,阿部 亨,菅沼 拓夫;Asako Ohno
  • 通讯作者:
    Asako Ohno
Prototype of a Spoken Language Checker for Writing Science Reports
用于撰写科学报告的口语检查器原型
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Asako Ohno;Nao Isoda;Reika Maruyama;and Yuka Nakagawa
  • 通讯作者:
    and Yuka Nakagawa
Quantification of the Depth of Student Learning in Group Discussions to Support Active Learning Using Revised Taxonomy
使用修订的分类法量化小组讨论中学生学习的深度以支持主动学习
  • DOI:
    10.1541/ieejeiss.142.382
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Seppala Jarmo;Mitsuishi Takashi;Ohkawa Yuichi;Zhao Xiumin;Nieminen Marko;堀川紘子,中橋 雄,佐藤和紀,浅井和行;深見俊崇;Asako Ohno
  • 通讯作者:
    Asako Ohno
An Experience of Active Online Programming Class During COVID-19 for Engineering Undergraduates
COVID-19期间工程本科生活跃在线编程课的经验
  • DOI:
  • 发表时间:
    2021
  • 期刊:
  • 影响因子:
    0
  • 作者:
    大矢健一;朱丹陽;中山裕一郎;伊藤智義;山下哲;渡邉ゆきこ,小渡悟,大前智美;田中ゆみ,三石大,大河雄一,本郷哲;志村聖子;斉藤 準;Asako Ohno
  • 通讯作者:
    Asako Ohno
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

大野 麻子其他文献

車載HMIの開発動向と自動運転,ADASへの応用, 第8章 ドライバの運転行動、運転意図の評価とモデル構築
车载HMI发展趋势及其在自动驾驶和ADAS中的应用,第8章驾驶员驾驶行为和驾驶意图评估及模型构建
  • DOI:
  • 发表时间:
    2019
  • 期刊:
  • 影响因子:
    0
  • 作者:
    栂井 一英;大野 麻子
  • 通讯作者:
    大野 麻子

大野 麻子的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('大野 麻子', 18)}}的其他基金

Word文書のXML解析と機械学習を用いた授業課題レポート作成者の識別
使用 Word 文档的 XML 分析和机器学习识别课堂作业报告创建者
  • 批准号:
    23K02723
  • 财政年份:
    2023
  • 资助金额:
    $ 1.83万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)

相似海外基金

Word文書のXML解析と機械学習を用いた授業課題レポート作成者の識別
使用 Word 文档的 XML 分析和机器学习识别课堂作业报告创建者
  • 批准号:
    23K02723
  • 财政年份:
    2023
  • 资助金额:
    $ 1.83万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
An Application of Deep Learning to detect Plagiarisms in Assigned Reports based on the Style Model
基于风格模型的深度学习在指定报告中检测抄袭的应用
  • 批准号:
    16K00476
  • 财政年份:
    2016
  • 资助金额:
    $ 1.83万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Modeling of writing style features of authors extracted from class report documents and implementation in plagiarism detection system
从课堂报告文件中提取作者写作风格特征的建模及其在抄袭检测系统中的实现
  • 批准号:
    15K21514
  • 财政年份:
    2015
  • 资助金额:
    $ 1.83万
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)
Development of a Plagiarisms Detecting System for Reporting Assignments based on the Style Model
基于风格模型的作业报告抄袭检测系统的开发
  • 批准号:
    25330408
  • 财政年份:
    2013
  • 资助金额:
    $ 1.83万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
A development of an integrated programming class support system focusing on the similarity based on the content of source codes and author's coding style
基于源代码内容和作者编码风格的关注相似性的集成编程课堂支持系统的开发
  • 批准号:
    24700918
  • 财政年份:
    2012
  • 资助金额:
    $ 1.83万
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了