古典漢文依存文法コーパスにもとづく係り受け構造の自動抽出

基于文言依存语法语料库的依存结构自动提取

基本信息

  • 批准号:
    20H04481
  • 负责人:
  • 金额:
    $ 11.15万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
  • 财政年份:
    2020
  • 资助国家:
    日本
  • 起止时间:
    2020-04-01 至 2023-03-31
  • 项目状态:
    已结题

项目摘要

本研究は、これまでわれわれがおこなってきた古典漢文の形態素解析および依存文法解析を、さらにもう一歩進めて、古典漢文の構文解析へとつなげることを目的とする。現在のところ、現代中国語に対しては、このような形態素解析・構文解析の研究がおこなわれているものの、古典漢文に対しては、われわれを除いてほとんど手つかずの状態である。本研究によって、古典漢文の係り受け構造を、単語と単語の間、節と節の間、さらには文と文の間にまで自動抽出できるようになれば、白文のままで放置されている大量の古典漢文テキストを、コンピュータを用いて自然言語処理できる可能性が、さらに進むと考えられる。本研究では、古典漢文に対し形態素解析と依存文法解析をおこなった上で、単語と単語の間の係り受け関係、節と節の間の係り受け関係、文と文の間の係り受け関係を、自動抽出する手法の構築をおこなう。この手法を構築するために、各レベル(単語・節・文)での係り受け関係を記述するための文法と、その文法にもとづくTreebankの構築を並行しておこない、単語・節・文の順に、係り受け関係を自動抽出する手法を完成する予定である。本年度(2021年度)は、古典中国語の言語モデルであるRoBERTa-Classical-Chinese (baseモデルおよびlargeモデル)をファインチューニングする形で、白文から文と節を切り出す手法について研究をおこない、それらの係り受け解析に挑戦した。具体的には、系列ラベリングにより文の切れ目を抽出し、同時に品詞付与と係り受け解析をおこなうことで、節レベルでの係り受け解析までは、かなりの精度でおこなえるようになった。また、これまでの成果を論文『古典中国語(漢文)Universal Dependenciesとその応用』として、情報処理学会論文誌2022年2月号に掲載した。
This study is based on the morphological analysis of classical Chinese and its dependency grammar. Analysis を, さらにもう一step into めて, classical Chinese のstructure analysis へとつなげることをpurpose とする. Now のところ, Modern Chinese に対しては, このようなmorphological analysis and composition analysis がおこなわれているものの, classical Chinese に対しては, われわれをexcept いてほとんど手つかずのstate である. This study is about the structure of classical Chinese, the structure of classical Chinese, the period of 単语 and the period of 単语と node no room, さらには文と文の间にまでautomatically extracts できるようになれば, Hakumon のままで Place されているA large number of のClassical Chinese テキストを、コンピュータを Use いて natural language processing できる possibility が, さらに enter むとtest えられる. This study focuses on classical Chinese morphological analysis and dependency grammar analysis of では, 単语と単语の间の线り生けRelationships, knots and festivals between knots and knots, relations between knots and knots, relations between knots and knots, relations between knots and knots, relations between knots and knots, relations between knots and knots, automatic extraction of techniques and techniques, and construction of knots and knots.このtechniqueをConstructionするために、Every レベル(単语・section・文)での线りReceiveけrelationsをnarrativeするためのgrammaticalと、そのgrammaticalにもとづくT reebank's construction, parallelism, parallelism, slang, festival, text, smoothness, relationship, automatic extraction, technique, and completion, predetermined decision. This year (2021)は、Classical Chinese languageのモデルであるRoBERTa-Classical-Chinese (baseモデルおよびlargeモデル)をファインチューニングするshapedで、白文から文と node を cut り出 technique に つ い て research を お こ な い, そ れ ら の system り Receive け ANALYSIS に 选戦 し た. Specific words, series ラベリングにより文の Cut れ目をdraw し, and に Product words are given and the system is received け analysis をおこなうことで, 合レベルでの行りReceived analysis までは, かなりのprecision でおこなえるようになった. The paper "Classical Chinese (Chinese) Universal Dependencies of Universal Dependencies" is published in the February 2022 issue of the Journal of the Information Processing Society.

项目成果

期刊论文数量(17)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
北京理工大学/南京農業大学(中国)
北京工业大学/南京农业大学(中国)
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
古典中国語(漢文)Universal Dependenciesとその応用
文言文(Kanbun)通用依存关系及其应用
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    安岡孝一;ウィッテルン クリスティアン;守岡知彦;池田巧;山崎直樹;二階堂善弘;鈴木慎吾;師茂樹;藤田一乘
  • 通讯作者:
    藤田一乘
「古典中国語のコーパスの研究」共同研究班ログ
“文言语料库研究”联合课题组日志
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
東呉大学(その他の国・地域(台湾))
东吴大学(其他国家/地区(台湾))
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
漢字・漢語・漢文の言語情報処理
汉字、汉字、汉字的语言信息处理
  • DOI:
  • 发表时间:
    2021
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Morita;T.;Asada;M. & Naito;E.;山田優;安岡孝一
  • 通讯作者:
    安岡孝一
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

安岡 孝一其他文献

安岡 孝一的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('安岡 孝一', 18)}}的其他基金

古典漢文依存文法コーパスから日本漢文コーパスへの展開
从文言依存语法语料库到日语汉语语料库的发展
  • 批准号:
    23K28379
  • 财政年份:
    2024
  • 资助金额:
    $ 11.15万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
古典漢文依存文法コーパスから日本漢文コーパスへの展開
从文言依存语法语料库到日语汉语语料库的发展
  • 批准号:
    23H03690
  • 财政年份:
    2023
  • 资助金额:
    $ 11.15万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
Study of Hierarchic Decipherment Model of Early Japanese Hanzi Dictionaries under Digital Humanities
数字人文下早期日语汉字词典的分层破译模型研究
  • 批准号:
    17F17301
  • 财政年份:
    2017
  • 资助金额:
    $ 11.15万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows

相似海外基金

Mixed Quantum-Classical Semiclassical Theory: Finding Reaction Paths in Open Quantum Systems
混合量子经典半经典理论:寻找开放量子系统中的反应路径
  • 批准号:
    2404809
  • 财政年份:
    2024
  • 资助金额:
    $ 11.15万
  • 项目类别:
    Standard Grant
Understanding Emission, Absorption and Energy Transfer Involving Classical and Quantum Light Interacting with Molecules
了解涉及经典光和量子光与分子相互作用的发射、吸收和能量转移
  • 批准号:
    2347622
  • 财政年份:
    2024
  • 资助金额:
    $ 11.15万
  • 项目类别:
    Standard Grant
Foundations of Classical and Quantum Verifiable Computing
经典和量子可验证计算的基础
  • 批准号:
    MR/X023583/1
  • 财政年份:
    2024
  • 资助金额:
    $ 11.15万
  • 项目类别:
    Fellowship
古典漢文依存文法コーパスから日本漢文コーパスへの展開
从文言依存语法语料库到日语汉语语料库的发展
  • 批准号:
    23K28379
  • 财政年份:
    2024
  • 资助金额:
    $ 11.15万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
Collective Quantum Thermodynamics: Quantum vs Classical
集体量子热力学:量子与经典
  • 批准号:
    MR/Y003845/1
  • 财政年份:
    2024
  • 资助金额:
    $ 11.15万
  • 项目类别:
    Fellowship
Collaborative Research: Nonlinear Dynamics and Wave Propagation through Phononic Tunneling Junctions based on Classical and Quantum Mechanical Bistable Structures
合作研究:基于经典和量子机械双稳态结构的声子隧道结的非线性动力学和波传播
  • 批准号:
    2423960
  • 财政年份:
    2024
  • 资助金额:
    $ 11.15万
  • 项目类别:
    Standard Grant
Collaborative Research: The impact of instruction on student thinking about measurement in classical and quantum mechanics experiments
合作研究:教学对学生思考经典和量子力学实验中的测量的影响
  • 批准号:
    2336135
  • 财政年份:
    2024
  • 资助金额:
    $ 11.15万
  • 项目类别:
    Standard Grant
CAREER: Symmetries and Classical Physics in Machine Learning for Science and Engineering
职业:科学与工程机器学习中的对称性和经典物理学
  • 批准号:
    2339682
  • 财政年份:
    2024
  • 资助金额:
    $ 11.15万
  • 项目类别:
    Continuing Grant
A Polytopal View of Classical Polynomials
经典多项式的多面观
  • 批准号:
    2348676
  • 财政年份:
    2024
  • 资助金额:
    $ 11.15万
  • 项目类别:
    Standard Grant
The Cultural Legacies of the British Empire: Classical Music's Colonial History (1750-1900)
大英帝国的文化遗产:古典音乐的殖民历史(1750-1900)
  • 批准号:
    MR/X03559X/1
  • 财政年份:
    2024
  • 资助金额:
    $ 11.15万
  • 项目类别:
    Fellowship
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了