計量的分析のための15世紀朝鮮語形態素解析済みコーパス構築:仏教諺解を対象に

构建 15 世纪韩语词法语料库以进行定量分析:以佛教谚语为目标

基本信息

  • 批准号:
    20K00558
  • 负责人:
  • 金额:
    $ 1.75万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
  • 财政年份:
    2020
  • 资助国家:
    日本
  • 起止时间:
    2020-04-01 至 2024-03-31
  • 项目状态:
    已结题

项目摘要

計画の3年目である令和4年度にも,引き続きMeCab(めかぶ)向けの15世紀朝鮮語形態素解析用辞書である「MkHanDic」に,辞書項目の追加を行った.現在の辞書項目数は9730項目で,学習用データは3070文である.解析の精度について,やはり同音異義語の判定に問題があり,解決方法について検討を行っている.ただし,これまでの作業を通じて,辞書の項目数を着実に増やしており,さらに登録項目を増やしていくことで,全体的な精度を向上させることが可能である.引き続き,辞書項目と学習用データを増やしていく.また,形態素解析を行う前段階の作業として,TEI(Text Encoding Initiative)ガイドラインを用いた電子データの整備を並行して行っているが,今年度は『般若心経諺解』『救急簡易方諺解』の電子データ構築に着手した.これらの文献も15世紀に刊行されたものであるが,本研究で対象とする『月印釈譜』とはテキストの構造,構成がやや異なる.様々なタイプの文献について,TEIガイドラインによる電子データ化を行うことで,知見がより深まり,『月印釈譜』に対する電子データ化もさらに精緻さを加えることが可能になると考える.また,形態素解析の結果も盛り込んだ電子データ化の方法についても,今後検討する予定である.今後はこれらのデータを元に,本研究の研究対象である『月印釈譜』の他の巻についても電子データ化を行い,作業が終了したデータから形態素解析を行って,未登録の項目を辞書項目として追加する作業を行う.
In the 3rd and 4th year of the project, the dictionary "MkHanDic" was added to the dictionary for morphological analysis of the 15th century. The number of dictionary items now is 9730, and the number of learning items is 3070. Parsing precision The number of entries in the dictionary has increased, and the number of entries has increased. The accuracy of all entries has increased. The dictionary project and the study project are used to increase the content of the dictionary. In addition, TEI (Text Encoding Initiative) has been working on the electronic data preparation and parallel processing of morpheme analysis. This year, TEI has started the electronic data construction of "Prajna Mental Solution" and "Emergency Simple Solution". This paper studies the structure of the moon seal spectrum and the structure of the moon seal spectrum, which are published in the 15th century. For example, if you want to know more about the electronic technology, you can add more information about the electronic technology. The results of morpheme analysis are described in detail below. In the future, the research object of this study is to complete the electronic transformation of the "moon print spectrum" and to complete the morphological analysis of the "moon print spectrum".

项目成果

期刊论文数量(4)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
中期朝鮮語の計量的分析の試み―クラスター分析による『釈譜詳節』各巻の分類―
尝试对中古朝鲜语进行定量分析:使用聚类分析对《Shafu Shosettsu》各卷进行分类。
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    木下瞳;林炫情;須賀井義教;斉藤信浩・林炫情・淺尾仁彦・李在鎬・須賀井義教;李在鎬;李在鎬;Yoshihiko Asao;水野淳太・淺尾仁彦;須賀井 義教
  • 通讯作者:
    須賀井 義教
中期朝鮮語の計量的分析の試み
中朝鲜语定量分析的尝试
「MeCab で韓国語」
“MeCab 韩国菜”
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
MeCab用形態素解析辞書MkHanDic
MeCab 的形态分析词典 MkHanDic
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

須賀井 義教其他文献

誤謬推論とUnconditional Presupposition
谬误推理与无条件预设
  • DOI:
  • 发表时间:
    2020
  • 期刊:
  • 影响因子:
    0
  • 作者:
    山森良枝;荻野千砂子;Hiroshi Aoyagi;須賀井 義教;團迫雅彦;秋谷裕幸;松本和子・吉田さち・奥村晶子;中井延美;Hiroshi Aoyagi;荻野千砂子;須賀井義教;松本和子・高田三枝子・奥村晶子・吉田さち;梶 茂樹;山森良枝
  • 通讯作者:
    山森良枝
韓国語文章リーダビリティ判定システム「kReadability」
韩文文本可读性判断系统“kReadability”
  • DOI:
  • 发表时间:
    2021
  • 期刊:
  • 影响因子:
    0
  • 作者:
    淺尾 仁彦;林 炫情;李 在鎬;須賀井 義教;斉藤 信浩
  • 通讯作者:
    斉藤 信浩
目的語関係節とwhen従属節が同じであることについて-ニョロ語からの考察-
关于宾语关系从句和从属从句相同的事实 - 来自 Nyoro 语言的考虑 -
  • DOI:
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    0
  • 作者:
    山森良枝;荻野千砂子;Hiroshi Aoyagi;須賀井 義教;團迫雅彦;秋谷裕幸;松本和子・吉田さち・奥村晶子;中井延美;Hiroshi Aoyagi;荻野千砂子;須賀井義教;松本和子・高田三枝子・奥村晶子・吉田さち;梶 茂樹
  • 通讯作者:
    梶 茂樹
ICT を利用した読解授業について
关于利用ICT的阅读理解课程
  • DOI:
  • 发表时间:
    2020
  • 期刊:
  • 影响因子:
    0
  • 作者:
    淺尾 仁彦;林 炫情;李 在鎬;須賀井 義教;斉藤 信浩;李 在鎬;李在鎬
  • 通讯作者:
    李在鎬
Interpretation of the antecedent for the English pro-form one
英语原式一的先行词解释
  • DOI:
    10.57300/cac.42.1_63
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    山森良枝;荻野千砂子;Hiroshi Aoyagi;須賀井 義教;團迫雅彦;秋谷裕幸;松本和子・吉田さち・奥村晶子;中井延美
  • 通讯作者:
    中井延美

須賀井 義教的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

相似海外基金

発話行為機能タグ付きコーパスおよびコーパス連動型オンライン学習サイトの構築
构建具有言语行为功能标签的语料库和语料库链接的在线学习网站
  • 批准号:
    24K03956
  • 财政年份:
    2024
  • 资助金额:
    $ 1.75万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
日本語学習者コーパスの拡充およびコーパスを活用した習得研究
日语学习者语料库的扩展以及利用该语料库的习得研究
  • 批准号:
    24K03976
  • 财政年份:
    2024
  • 资助金额:
    $ 1.75万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
看護留学生等に必要な言語知識ー教科書コーパスと語彙テストに基づく研究・教材開発
留学生所需的语言知识等 - 基于教科书语料库和词汇测试的研究和教材开发
  • 批准号:
    24K03990
  • 财政年份:
    2024
  • 资助金额:
    $ 1.75万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
ICNALE-WE22:アジア圏22か国を網羅する新しい英語学習者作文コーパスの構築と分析
ICNALE-WE22:覆盖22个亚洲国家的新型英语学习者作文语料库的构建与分析
  • 批准号:
    23K25338
  • 财政年份:
    2024
  • 资助金额:
    $ 1.75万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
大規模進化コーパスの構築・利活用によるソフトウェア自動進化の促進
通过构建和利用大规模进化语料库促进软件自动进化
  • 批准号:
    23K24823
  • 财政年份:
    2024
  • 资助金额:
    $ 1.75万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
合成メディアの大規模比較評価の最適化と主観比較評価コーパスの構築
合成媒体大规模对比评价优化及主观对比评价语料库构建
  • 批准号:
    24K20792
  • 财政年份:
    2024
  • 资助金额:
    $ 1.75万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
聴解コーパスの構築による日本語学習者の聴解困難点と推測技術の実証的研究
基于听力语料库的日语学习者听力理解困难及估计技术的实证研究
  • 批准号:
    23K21941
  • 财政年份:
    2024
  • 资助金额:
    $ 1.75万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
「話題から始まる日本語教育」を支援する情報サイトの構築と話題別会話コーパスの拡充
构建支持“从主题开始的日语教育”的信息网站,扩大主题对话语料库
  • 批准号:
    23K21940
  • 财政年份:
    2024
  • 资助金额:
    $ 1.75万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
ジェスチャー情報付きコーパスの構築と統語構造に対応するジェスチャーの解明
构建包含手势信息的语料库并阐明与句法结构相对应的手势
  • 批准号:
    24K16050
  • 财政年份:
    2024
  • 资助金额:
    $ 1.75万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
マルチモーダルな視点による日本語講義動画およびコーパスの開発
多模态视角下的日语讲座视频和语料库开发
  • 批准号:
    24K03981
  • 财政年份:
    2024
  • 资助金额:
    $ 1.75万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了