文脈化単語埋め込みによる1億語規模の比喩表現実態調査

使用上下文词嵌入对 1 亿个词语比喻表达进行调查

基本信息

项目摘要

『現代日本語書き言葉均衡コーパス』(BCCWJ)は、日本語の自然言語処理において広く用いられている1億語規模のテキストデータセットの1つである。NWJC-BERTは250億語規模の『国語研日本語ウェブコーパス』から訓練した深層学習 BERT のモデルである。BCCWJに対して、NWJC-BERTを用いて文脈化単語埋め込みを付与する作業が進めた。文脈化単語埋め込みとは、単語の意味表現をベクトルとして表現する手法の1つで、その単語が現れる文脈によって意味が変化することを考慮する。このベクトル表現に基づく語義の評価の定量化を進めた。語義評価の定量化に基づき、語義の転換である比喩表現の認識手法を検討中である。並行して日本語の比喩表現のタグ付け基準について検討した。分類語彙表に基づく語義を手がかりとし、MIP (metaphor identification procedure) に基づきタグ付けする方針を策定した。しかしながら、作業者の手配が進まず、タグ付けを進めることができなかった。第44回NINJALチュートリアル(2022年8月6日)にて、韓国日本語学会・韓国日語教育学会と共催で、「『分類語彙表』関連データベース」というタイトルで、単語埋め込みに基づく語義の近さの可視化についてチュートリアルを実施した。また、第17回NINJALフォーラム「語彙資源の構築と活用」(2023年2月18日:オンライン開催)にて「分類語彙表と比喩情報」というタイトルで講演を行った。
"Modern Japanese Language Book"(BCCWJ), Japanese language natural speech processing in the middle of the use of the middle of the 100 million language scale of the middle of the 100 million language scale. NWJC-BERT is a 25 Billion Language Training Program for Deep Learning BERT. BCCWJ, NWJC-BERT, and other related topics Contextualization of language, meaning of language, expression of language, expression of language, context, meaning of language, expression of language, expression of language, expression The quantitative evaluation of the basic performance of the system Semantic evaluation of quantitative basis, semantic transformation of the performance of cognitive methods to discuss In parallel, the Japanese language comparison and performance criteria are discussed. The classification of words is based on semantic differences, MIP (metaphor identification procedure), and policy decisions. The work of the industry is to be carried out in a timely manner. The 44th NINJAL Conference (August 6, 2022) was jointly urged by the Korean Japanese Language Association and the Korean Japanese Language Education Association."Classified Word List" is related to the content of the conference. The 17th chapter of NINJAL "Construction and Use of Word Resources"(February 18, 2023: Open Call) was published in "Classified Word List and Comparative Information".

项目成果

期刊论文数量(2)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
分類語彙表と比喩情報
分类词汇表和隐喻信息
  • DOI:
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    0
  • 作者:
    木村 駿野;森 大毅;加藤祥
  • 通讯作者:
    加藤祥
『分類語彙表』関連データベース
《分类词汇表》相关数据库
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    木村 駿野;森 大毅;加藤祥;浅原正幸
  • 通讯作者:
    浅原正幸
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

浅原 正幸其他文献

A Modernist Critique of Modernity: Materiality of the Invisible in British and Japanese Modern Art
现代主义对现代性的批判:英国和日本现代艺术中无形的物质性
  • DOI:
  • 发表时间:
    2019
  • 期刊:
  • 影响因子:
    0
  • 作者:
    宮地 尚子;伊藤 絵美;浅原 正幸;Yasuharu Den;金山浩司;西川亮;Fuhito Endo
  • 通讯作者:
    Fuhito Endo
Modal Particles Yo and Ne in Japanese
日语中的情态助词 Yo 和 Ne
  • DOI:
  • 发表时间:
    2020
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Keiichi Tajima;Mafuyu Kitahara;and Kiyoko Yoneyama;浅原 正幸;吉本啓・アラステア-バトラー・プラシャント-パルデシ;若狭基道;田中弥生・小磯花絵;田口善久;鋤田智彦;相良啓子;米山聖子,北原真冬,田嶋圭一;加藤 祥;Kei Yoshimoto
  • 通讯作者:
    Kei Yoshimoto
Surprisal through Word Embeddings
通过词嵌入带来惊喜
  • DOI:
    10.5715/jnlp.26.635
  • 发表时间:
    2019
  • 期刊:
  • 影响因子:
    0
  • 作者:
    村野正景;和崎光太郎;林潤平;浅原 正幸
  • 通讯作者:
    浅原 正幸
育種学研究が地域に果たす役割
育种研究在该地区发挥的作用
  • DOI:
  • 发表时间:
    2021
  • 期刊:
  • 影响因子:
    0
  • 作者:
    河合 将志;林 正治;新妻 聡;尾城 孝一;西澤 正己;山地 一禎;加藤 祥,西内 沙恵,浅原 正幸;Kishi Toshihiko;中村香子;浅原 正幸;石川隆二
  • 通讯作者:
    石川隆二
画像キャプション生成における複数形表現の統一
图像标题生成中复数表示的统一
  • DOI:
  • 发表时间:
    2017
  • 期刊:
  • 影响因子:
    0
  • 作者:
    鈴木類;古宮 嘉那子;浅原 正幸;佐々木 稔;新納 浩幸;西友佑 新納 浩幸 古宮 嘉那子 佐々木 稔,
  • 通讯作者:
    西友佑 新納 浩幸 古宮 嘉那子 佐々木 稔,

浅原 正幸的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('浅原 正幸', 18)}}的其他基金

日本語コーパスに対する単語心象性情報付与とその利用
日语语料库中添加单词图像信息及其使用
  • 批准号:
    23K21935
  • 财政年份:
    2024
  • 资助金额:
    $ 4.16万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
日本語コーパスに対する単語心象性情報付与とその利用
日语语料库中添加单词图像信息及其使用
  • 批准号:
    22H00663
  • 财政年份:
    2022
  • 资助金额:
    $ 4.16万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
テキスト中の時間表現解析に関する研究
文本时间表达分析研究
  • 批准号:
    18700146
  • 财政年份:
    2006
  • 资助金额:
    $ 4.16万
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)
統計的手法に基づく多言語形態素解析
基于统计方法的多语言形态分析
  • 批准号:
    01J02558
  • 财政年份:
    2001
  • 资助金额:
    $ 4.16万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows

相似海外基金

Bio-MATSUPER: Development of high-performance supercapacitors based on bio-based carbon materials
Bio-MATSUPER:开发基于生物基碳材料的高性能超级电容器
  • 批准号:
    EP/Z001013/1
  • 财政年份:
    2025
  • 资助金额:
    $ 4.16万
  • 项目类别:
    Fellowship
CAREER: Bridging Research & Education in Delineating Fatigue Performance & Damage Mechanisms in Metal Fused Filament Fabricated Inconel 718
职业:桥梁研究
  • 批准号:
    2338178
  • 财政年份:
    2024
  • 资助金额:
    $ 4.16万
  • 项目类别:
    Standard Grant
Planning: Artificial Intelligence Assisted High-Performance Parallel Computing for Power System Optimization
规划:人工智能辅助高性能并行计算电力系统优化
  • 批准号:
    2414141
  • 财政年份:
    2024
  • 资助金额:
    $ 4.16万
  • 项目类别:
    Standard Grant
CRII: AF: The Impact of Knowledge on the Performance of Distributed Algorithms
CRII:AF:知识对分布式算法性能的影响
  • 批准号:
    2348346
  • 财政年份:
    2024
  • 资助金额:
    $ 4.16万
  • 项目类别:
    Standard Grant
CAREER: Improving Real-world Performance of AI Biosignal Algorithms
职业:提高人工智能生物信号算法的实际性能
  • 批准号:
    2339669
  • 财政年份:
    2024
  • 资助金额:
    $ 4.16万
  • 项目类别:
    Continuing Grant
Electrolyte design for high-performance, sustainable sodium batteries
高性能、可持续钠电池的电解质设计
  • 批准号:
    DE240100480
  • 财政年份:
    2024
  • 资助金额:
    $ 4.16万
  • 项目类别:
    Discovery Early Career Researcher Award
Competence Greenwashing: The impact of ESG skills misrepresentation on corporate sustainability performance
能力“漂绿”:ESG 技能的误传对企业可持续发展绩效的影响
  • 批准号:
    24K16445
  • 财政年份:
    2024
  • 资助金额:
    $ 4.16万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
Effects of Labor Mobility on Inventory Holdings and Firm Performance: Evidence from the Inevitable Disclosure Doctrine
劳动力流动对库存持有和公司绩效的影响:不可避免披露原则的证据
  • 批准号:
    24K16474
  • 财政年份:
    2024
  • 资助金额:
    $ 4.16万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
Impact of Dynamic Capabilities, Technological Readiness and Information Exchange Capabilities on the Resilience and Performance of Circular Supply Chains
动态能力、技术准备度和信息交换能力对循环供应链的弹性和绩效的影响
  • 批准号:
    24K05087
  • 财政年份:
    2024
  • 资助金额:
    $ 4.16万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
High-performance thin film porous pyroelectric materials and composites for thermal sensing and harvesting
用于热传感和收集的高性能薄膜多孔热释电材料和复合材料
  • 批准号:
    EP/Y017412/1
  • 财政年份:
    2024
  • 资助金额:
    $ 4.16万
  • 项目类别:
    Fellowship
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了