複数の事前学習モデルを利用した語義曖昧性解消のドメイン適応

使用多个预训练模型进行词义消歧的领域适应

基本信息

  • 批准号:
    22K12145
  • 负责人:
  • 金额:
    $ 2.75万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
  • 财政年份:
    2022
  • 资助国家:
    日本
  • 起止时间:
    2022-04-01 至 2025-03-31
  • 项目状态:
    未结题

项目摘要

語義曖昧性解消の論文として、異なった古文と現代文という二つの基準の語義タグを使った研究を行い、分散表現(word2vec)を利用した手法でジャーナルを1報、現代文のBERTを利用したレキシカル・サンプルタスクの研究で国際会議を1報、さらに現代文のBERTを利用したコーパス中の全単語を対象とした語義曖昧性解消の研究で、研究会の論文を1報執筆し、発表を行った。研究会の論文はブラシュアップして国際会議に投稿予定である。さらに、日本語歴史コーパスの語義曖昧性解消の関連論文として、日本語歴史コーパスの古文から現代文への翻訳を事前学習モデルであるT5を用いて行った研究について国内学会で発表を行った。こちらについても、2023年度以降に国際会議に投稿予定である。また、関連論文として、異なった区切りの異なった単語に関係して、ある複合語の単語の分散表現(word2vec)をそれぞれの構成語から合成する研究について、執筆したジャーナル論文が公開された。また、副次的な研究として、語義曖昧性解消ではないが、同じ手法を用いた、単語の読みを付与するシステムを作成する研究を行った。こちらについても、異なったタグと皆さえる疑似データがシステムの正解率を上昇させるという結果を示した。この研究は、国内学会で発表済みであるが、2023年度以降に国際会議に投稿予定である。さらに、関連論文として、「日本語 PromptBERT におけるプロンプトベース対照学習の有効性とプロンプトの性質の調査」の発表を行った。
In this paper, the meaning of ignorance is discussed, and the basic information is used to make the research progress, word2vec, the use of information techniques, the use of information technology, the use In this paper, the BERT is used to study the meaning of ignorance elimination in the information system, and the research association is responsible for the study of ignorance. The Institute will submit articles and articles to the International Conference on International Studies. The history of Japan, the history of Japan and the history of Japan. We are expected to submit contributions to the International Conference on International Affairs in the year 2023. In this paper, we need to know how to make sure that the information is available. In this way, we need to make sure that the information is open to the public. In this way, we need to make sure that the information is available to the public. In addition, we need to make sure that the information is open to the public. In the second and second study, the understanding of ignorance, the elimination of ignorance, the use of the same method, the use of the same method, the payment of the second and the second, the meaning of the understanding of ignorance, the elimination of ignorance, the use of the same method, and so on. It is suspected that the correct solution is correct. The results show that the results are not correct. In the year 2023, contributions to the International Conference will be submitted to the International Conference. In Japan, PromptBERT, please read the text, please tell me that there is something wrong with you in terms of sex, and so on.

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Word Sense Disambiguation of Corpus of Historical Japanese Using Japanese BERT Trained with Contemporary Texts
使用受当代文本训练的日语 BERT 对历史日语语料库进行词义消歧
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Kanako Komiya;Nagi Oki and Masayuki Asahara
  • 通讯作者:
    Nagi Oki and Masayuki Asahara
日本語歴史コーパスのAll-words WSD
日本历史语料库全词WSD
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    臼井久生;古宮嘉那子
  • 通讯作者:
    古宮嘉那子
Composing Word Embeddings for Compound Words Using Linguistic Knowledge
疑似訓練データを用いたone-shot 設定における同形異音語の読み推定
使用伪训练数据进行一次性设置的同形异义词阅读估计
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    小林汰一郎;古宮嘉那子; 新納浩幸
  • 通讯作者:
    新納浩幸
Diachronic Domain Adaptation of Word Sense Disambiguation in Corpus of Historical Japanese Using Word Embeddings
使用词嵌入对历史日语语料库中的词义消歧进行历时域适应
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

古宮 嘉那子其他文献

語義曖昧性解消の領域適応のための訓練データの選択法 ~複数ドメインからの選択~
词义消歧领域适应的训练数据选择方法~多领域选择~
  • DOI:
  • 发表时间:
    2013
  • 期刊:
  • 影响因子:
    0
  • 作者:
    堀内 浩史郎;古宮 嘉那子;小谷 善行
  • 通讯作者:
    小谷 善行
固有表現抽出におけるタグセットの相互適応
命名实体提取中标签集的相互适应
  • DOI:
  • 发表时间:
    2017
  • 期刊:
  • 影响因子:
    0
  • 作者:
    鈴木雅也;古宮 嘉那子;佐々木 稔;新納 浩幸
  • 通讯作者:
    新納 浩幸
順方向多層 LSTM と分散表現を用いた教師あり学習による語義曖昧性解消
使用前向多层 LSTM 和分布式表示通过监督学习进行词义消歧
  • DOI:
  • 发表时间:
    2017
  • 期刊:
  • 影响因子:
    0
  • 作者:
    新納 浩幸;古宮 嘉那子;佐々木 稔
  • 通讯作者:
    佐々木 稔
All-words WSDとfine-tuningを利用した分類語彙表の語義の分散表現の構築
使用 All-words WSD 和微调构建分类词典中单词含义的分布式表示
  • DOI:
  • 发表时间:
    2019
  • 期刊:
  • 影响因子:
    0
  • 作者:
    柳沼 大輝;古宮 嘉那子;新納 浩幸
  • 通讯作者:
    新納 浩幸
固有表現抽出におけるアノテーション手法の比較
命名实体提取标注方法比较
  • DOI:
  • 发表时间:
    2016
  • 期刊:
  • 影响因子:
    0
  • 作者:
    鈴木 雅也;古宮 嘉那子;岩倉 友哉;佐々木 稔;新納 浩幸
  • 通讯作者:
    新納 浩幸

古宮 嘉那子的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('古宮 嘉那子', 18)}}的其他基金

語義曖昧性解消技術と領域適応手法を利用した情報抽出手法の研究開発
利用词义消歧技术和领域适应方法的信息抽取方法研究与开发
  • 批准号:
    17KK0002
  • 财政年份:
    2018
  • 资助金额:
    $ 2.75万
  • 项目类别:
    Fund for the Promotion of Joint International Research (Fostering Joint International Research)

相似海外基金

大規模事前学習モデルを活用した生成型複数テキスト要約に関する研究
使用大规模预训练模型的生成式多文本摘要研究
  • 批准号:
    24K02997
  • 财政年份:
    2024
  • 资助金额:
    $ 2.75万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
3次元医用画像タスクに汎用利用可能な事前学習モデルの確立と公開
建立并发布可普遍用于3D医学图像任务的预学习模型
  • 批准号:
    23K17234
  • 财政年份:
    2023
  • 资助金额:
    $ 2.75万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
事前学習モデルによる博物館学習を支援する学習教材の開発と評価
使用预学习模型开发和评估支持博物馆学习的学习材料
  • 批准号:
    08J06388
  • 财政年份:
    2008
  • 资助金额:
    $ 2.75万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了