自然言語処理技術を用いた快適なWeb利活用支援に関する研究
利用自然语言处理技术支持舒适网络使用的研究
基本信息
- 批准号:19K12241
- 负责人:
- 金额:$ 2.75万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Scientific Research (C)
- 财政年份:2019
- 资助国家:日本
- 起止时间:2019-04-01 至 2024-03-31
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
本年度では研究計画に沿って、以下の各々のテーマで推進した。(1)前年度の用語抽出研究で得られた研究成果に基づき、小・中学生のプログラミング教育の接続支援に関する研究を展開した。本年度では、プログラミング課題を記述する文章(課題テキスト)の可読化を目指し、課題テキストとそれを遂行するためのプログラムコードの対応データの収集を行った。さらに、課題テキストに対し、入力や与えられた条件、出力などに関する記述箇所を特定する情報(タグ)を付与し、タグ付きコーパスの構築を行った。構築したコーパスの有用性を検証するために、用語抽出研究で開発したBERTのQAタスク仕様での用語抽出手法での、タグ付きコーパスを用いたファインチューニングと課題テキストのタグ付けの実験を進めている。(2)前年度の日本語学習支援に関する研究を引き続き推進した。日本語学習者への作文支援を行うための、作文中の日本語文法の誤り検出に関する研究を行った。文法誤り検出を系列ラベリングタスクとしてとらえ、BERTモデルをベースとし、日本語入力を単語分割せずにも解析できるFlairモデルの導入など、深層学習で解く手法を提案した。語学学習のための、誤りを含む文とその訂正文からなるLang-8コーパスから抽出・加工した72万文のデータを用いた実験で、提案手法の有効性を確認した。(3)そのほかに、多言語Amazonレビューテキスト中の約20万日本語レビューテキストに対し、BERTとRoBERTaのレーティング予測(星数の予測)に関する比較実験も行った。また、本科研費課題の要素技術としてテキストの段落分割の研究も行った。BERTにauxiliary lossを導入することにより、従来手法より段落分割の精度が向上したことを確認した。上記研究成果は査読付き学術雑誌論文1編と査読なし論文2編として発表した。
This year's research plan is progressing along the following lines: (1)The previous year's term extraction study was conducted on the basis of research findings on primary and secondary school education and access support. This year, we will focus on the usability of articles (topic topics) describing topics on the platform and the collection of relevant data from platform users for the implementation of topic topics. For example, if you are interested in a project, you may contact us. The term extraction method of constructing the useful model of BERT is proposed. The term extraction method of BERT is proposed. (2)Research on Japanese Language Learning Support in the Past Year Japanese language learner's writing support and research on Japanese grammar errors in writing Grammar error detection: series of errors, BERT errors, Japanese language entry: single language segmentation: analysis: Flair errors, introduction: deep learning: solution: proposal Language learning includes the following aspects: text, error, extraction, processing, application, and effectiveness of proposal. (3)About 200,000 Japanese language service providers in the multi-language Amazon service provider, BERT and ROBERTA service provider forecast (star number forecast) The research on paragraph segmentation of the key elements of this research project BERT auxiliary loss is introduced and the accuracy of paragraph segmentation is confirmed. The results of the above research are listed in the first part of the academic journal paper and the second part of the paper.
项目成果
期刊论文数量(16)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Estimating Evaluation of Cosmetics Reviews with Machine Learning Methods
用机器学习方法估算化妆品评论的评价
- DOI:
- 发表时间:2020
- 期刊:
- 影响因子:0
- 作者:Q. Ma;M. Tsukagoshi and M. Murata
- 通讯作者:M. Tsukagoshi and M. Murata
Topic Extraction and Classification for Questions Posted in Community-Based Question Answering Services
- DOI:10.1109/csci49370.2019.00253
- 发表时间:2019-12
- 期刊:
- 影响因子:0
- 作者:Qing Ma;M. Murata
- 通讯作者:Qing Ma;M. Murata
単語クラスタリングによって文書情報を整理する手法の改良
词聚类组织文档信息方法的改进
- DOI:
- 发表时间:2021
- 期刊:
- 影响因子:0
- 作者:森廣勇樹;南條浩輝;馬青;董卜睿,村田真樹,馬青;池内省吾,南條浩輝,馬青;三木謙志,村田真樹,馬青;池内省吾, 南條浩輝, 馬青;本田涼太,村田真樹, 馬青;符 家俊,村田真樹,馬青
- 通讯作者:符 家俊,村田真樹,馬青
Improved Method for Organizing Information Contained in Multiple Documents into a Table
将多个文档中包含的信息组织到表中的改进方法
- DOI:10.5715/jnlp.28.802
- 发表时间:2021
- 期刊:
- 影响因子:0
- 作者:Murata Masaki;Okazaki Kensuke;Ma Qing
- 通讯作者:Ma Qing
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
馬 青其他文献
馬 青的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}