言語学習者の誤用に注目した単語と文の分散表現の獲得と分析
获取和分析单词和句子的分布式表示,重点关注语言学习者的误用
基本信息
- 批准号:19KK0286
- 负责人:
- 金额:$ 8.07万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Fund for the Promotion of Joint International Research (Fostering Joint International Research (A))
- 财政年份:2020
- 资助国家:日本
- 起止时间:2020 至 2023
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
本国際共同研究では、言語学習者のライティングに存在する「誤り」に着目し、言語学習者がどのような単語や文を書いているのかの分析を行います。言語学習者が実際に書いた文章だけでなく、大規模データを用いて擬似的に誤りを発生させることで、様々な種類の誤りを分析するだけでなく、複数の言語で比較することで言語横断的な分析をも可能にする、というのが本研究の狙いです。渡航前には本研究室でこれまでに使っている Lang-8 コーパスを中心に英語の擬似誤りを用いた研究に取り組み、渡航後にはケンブリッジ大学が保有する大規模な Cambridge Learner Corpus を活用した研究を行う予定です。また、現在使われているデータ以外のコーパスについても、英語については様々な分野のジャンルが含まれるように、そしてそれ以外の言語についてもカバーしていくように、評価用・訓練用含めて拡充していく計画です。2022年度は、2021年度中に投稿して採択されていた国際会議の発表を2件行いました(オンライン発表です)。また、中国語の文法誤り訂正に疑似誤りを用いた事前学習モデルを適用する手法に関する研究が国際論文誌に採択されました。現在は、中国語文法誤り訂正の評価手法のメタ評価に関する研究に取り組んでいます。そして、日本語学習者がどのような誤りを犯すのかについてのタグを付与したコーパスを作成した研究が論文誌に採択されました。最後に、英語文法誤り検出のフィードバックコメント生成の研究に取り組みました。
这项国际协作研究的重点是语言学习者写作中存在的“错误”,并分析了他们写的单词和句子。这项研究的目的不仅是使用语言学习者实际编写的文本,还要使用大规模数据来产生伪错误,这不仅可以分析各种类型的错误,而且还可以通过比较多种语言来启用跨语言分析。在旅行之前,我们将使用英语伪错误进行研究,重点关注我们实验室到目前为止使用的Lang-8语料库,并且在旅行后,我们将使用剑桥大学拥有的大型剑桥学习者语料库进行研究。此外,我们计划扩大当前使用的数据以外的其他语料库,包括用于评估和培训,以便英语包括来自各个领域的流派,并涵盖其他语言。 2022年,我们从2021年(在线演示)期间发布和通过的国际会议进行了两次演讲。此外,《国际杂志》已经采用了对使用伪纠正纠正中文语法错误应用预学模型的方法的研究。目前,我正在研究中国语法错误校正评估方法的元评估。一项创造了一项由日语学习者错误标记的语料库的研究,然后在期刊中采用。最后,我们研究了对英语语法错误检测的反馈评论的生成。
项目成果
期刊论文数量(21)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Optimization of Reference-less Evaluation Metric of Grammatical Error Correction for Manual Evaluations
- DOI:10.5715/jnlp.28.404
- 发表时间:2021
- 期刊:
- 影响因子:0
- 作者:Ryoma Yoshimura;Masahiro Kaneko;Tomoyuki Kajiwara;Mamoru Komachi
- 通讯作者:Ryoma Yoshimura;Masahiro Kaneko;Tomoyuki Kajiwara;Mamoru Komachi
日本語文法誤り訂正の流暢性評価に向けたデータ作成
日语语法纠错流利度评价数据制作
- DOI:
- 发表时间:2022
- 期刊:
- 影响因子:0
- 作者:木山朔;上坂奏人;佐藤郁子;佐藤京也;米田悠人;小山碧海;三田雅人;岡照晃;小町守
- 通讯作者:小町守
Japanese Writing Support System with Fast Grammatical Error Correction
具有快速语法错误纠正功能的日语写作支持系统
- DOI:10.1527/tjsai.37-1_b-l22
- 发表时间:2022
- 期刊:
- 影响因子:0
- 作者:本間広樹;小町守
- 通讯作者:小町守
Comparison of Grammatical Error Correction Using Back-Translation Models
- DOI:10.18653/v1/2021.naacl-srw.16
- 发表时间:2021-04
- 期刊:
- 影响因子:0
- 作者:Aomi Koyama;Kengo Hotate;Masahiro Kaneko;Mamoru Komachi
- 通讯作者:Aomi Koyama;Kengo Hotate;Masahiro Kaneko;Mamoru Komachi
学習者データに対する擬似誤り生成を用いた文法誤り訂正モデルの分析
使用学习者数据伪错误生成的语法错误纠正模型分析
- DOI:
- 发表时间:2021
- 期刊:
- 影响因子:0
- 作者:Aizawa Masataka;Mizota Chitoshi;Hosono Takahiro;Shinjo Ryuichi;Furukawa Yuki;Nobori Yoshihiro;小山碧海,金子正弘,小町守
- 通讯作者:小山碧海,金子正弘,小町守
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
小町 守其他文献
Mutual <I>k</I>-Nearest Neighbor Graph Construction in Graph-based Semi-Supervised Classification
基于图的半监督分类中的互<I>k</I>-最近邻图构建
- DOI:
10.1527/tjsai.28.400 - 发表时间:
2013 - 期刊:
- 影响因子:0
- 作者:
小嵜 耕平;新保 仁;小町 守;松本 裕治 - 通讯作者:
松本 裕治
事前学習モデルを用いた近代文語文のニューラル機械翻訳
使用预训练模型对现代文学文本进行神经机器翻译
- DOI:
10.20729/00216233 - 发表时间:
2022 - 期刊:
- 影响因子:0
- 作者:
喜友名 朝視顕;平澤 寅庄;小町 守;小木曽 智信 - 通讯作者:
小木曽 智信
市村 太郎, 河瀬 彰宏, 小木曽 智信
市村太郎、河濑明弘、小木曾智宣
- DOI:
- 发表时间:
2012 - 期刊:
- 影响因子:0
- 作者:
小木曽 智信;小町 守;松本 裕治;岡部嘉幸;近世口語テキストの構造化とその課題 - 通讯作者:
近世口語テキストの構造化とその課題
小町 守的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('小町 守', 18)}}的其他基金
深層学習による言語生成の評価データセットの構築と品質推定
使用深度学习构建评估数据集和语言生成质量评估
- 批准号:
23K24907 - 财政年份:2024
- 资助金额:
$ 8.07万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
Construction of an Evaluation Dataset and Quality Estimation for Neural Language Generation
神经语言生成评估数据集的构建和质量评估
- 批准号:
22H03651 - 财政年份:2022
- 资助金额:
$ 8.07万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
大規模なコーパスを用いた機械学習による名詞句の項構造解析
使用大规模语料库使用机器学习对名词短语进行术语结构分析
- 批准号:
08J09545 - 财政年份:2008
- 资助金额:
$ 8.07万 - 项目类别:
Grant-in-Aid for JSPS Fellows
相似海外基金
Construction of an Evaluation Dataset and Quality Estimation for Neural Language Generation
神经语言生成评估数据集的构建和质量评估
- 批准号:
22H03651 - 财政年份:2022
- 资助金额:
$ 8.07万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
Examination of the effects of explicit instruction and error correction to Japanese learners of English
明确教学和纠错对日本英语学习者的效果检验
- 批准号:
21H00541 - 财政年份:2021
- 资助金额:
$ 8.07万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
Compositionality and Interpretation of Word Embeddings
词嵌入的组合性和解释
- 批准号:
19K12099 - 财政年份:2019
- 资助金额:
$ 8.07万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
学習者のライティングレベルを考慮した自動英語文法誤り訂正
自动英语语法纠错,考虑学习者的写作水平
- 批准号:
19J14084 - 财政年份:2019
- 资助金额:
$ 8.07万 - 项目类别:
Grant-in-Aid for JSPS Fellows
An automatic English sentence generator of a language model predicting the inflection of words
预测单词变形的语言模型的自动英语句子生成器
- 批准号:
18K00904 - 财政年份:2018
- 资助金额:
$ 8.07万 - 项目类别:
Grant-in-Aid for Scientific Research (C)