従属句の分類と接続助詞の結合順位に基づく複文と重文の構文解析に関する研究

复杂句及基于从句分类和连词连词等级的复杂句句法分析研究

基本信息

  • 批准号:
    14780294
  • 负责人:
  • 金额:
    $ 0.77万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)
  • 财政年份:
    2002
  • 资助国家:
    日本
  • 起止时间:
    2002 至 2003
  • 项目状态:
    已结题

项目摘要

構文解析の解候補である複数の構文木の中から自然な解釈だと思われるような解を選び出すために,南氏の従属句の分類を細分化し,接続助詞を左右の句を繋ぐ結合演算子とみなした文法を構築した.昨年度までに接続助詞の結合順位を最適化していたため,今年度はその結合順位を組み込んだPCFGを作成し,1文の構文解析実験を行った.1.テキストコーパス中の構文木を用いて接続助詞の結合順位を最適化するアルゴリズムを開発.今年度はさらに高速化を図り,付属語一般約300語の結合順位を約3分で最適化できるようになった.従来の研究では南氏の3分類の場合,A類<A類+読点<B類<B類+読点<…という順序が用いられていたが,我々の調査によりA類<B類<…<A類+読点<B類+読点<…のように読点を後の方に並べ替えた方がよりコーパスに合致することが確認された.2.接続助詞の結合順位を組み込んだPCFGの構築.「ながら」「が」など複数の用法から複数の分類に属し得る接続助詞や,接続助詞「と」のように格助詞とまぎらわしい助詞の多義性については,周辺の手がかり語や係り受け関係にある動詞の格パターン等を用いて判別することによって対処した.3.PCFGによる1文の構文解析.従来のPCFG文法では1000文中に数文程度の割合で,まれに1文の構文解析時間が何時間もかかる場合があったが,この文法では従属句間の修飾被修飾関係がほぼ一意に決まるため,最悪の場合でも数分程度で終わるようになった.係り受けの正解率は75%と従来手法に及ばず,1文の解析精度はまだ十分ではないが,これは学習用例数が少ないためであると考えられる.この研究により求められた接続助詞の結合順位は,自然な語順による分生成や文生成時の読点付与や,発話時のポーズ位置の決定などに応用できるものと考えられる.
The structure analysis and solution candidate of the plural structure tree are divided into natural solution and solution, and the classification of the subordinate sentence is subdivided, and the auxiliary word is connected to the left sentence and the right sentence. In the past year, the combination order of the words was optimized. In this year, the combination order of the words was optimized. In the past year, the combination order of the words was optimized. In the past year, the combination order of the words was optimized. In this year, the combination order of the words was optimized. This year, the speed of the language is about 300 words, and the order of the combination is about 3 minutes. In the past, the research has been divided into three categories: Class A <Class A + Point B <Class B + Point B <...<Class A + Point B <...<Class B + Point B <...<Class A + Point B <...<Class B + Point B <...<...<Point B <...<...<....<...<...<....<....<...<....<...> "" The PCFG syntax is 1000 words, the number of words, the number of words, the words, the number of words, the The correct solution rate of the system is 75%. The accuracy of the analysis is 10%. The number of learning cases is 10%. The research on this topic is aimed at finding out the order of the combination of auxiliary words, natural language order, sub-generation, point assignment, and position determination of auxiliary words in speech.

项目成果

期刊论文数量(1)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
市丸夏樹, 飛松弘征: "接続助詞の結合順位に基づく複文の構文解析"情報処理学会自然言語処理研究会研究報告 NL-158. 2003・108. 81-86 (2003)
Natsuki Ichimaru、Hiroyuki Tobimatsu:“基于连词连词顺序的复杂句子的句法分析”日本信息处理学会自然语言处理研究小组研究报告 NL-158(2003)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

市丸 夏樹其他文献

市丸 夏樹的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('市丸 夏樹', 18)}}的其他基金

n個の名詞が連接した日本語複合名詞の解析
由n个名词连接组成的日语复合名词分析
  • 批准号:
    09780348
  • 财政年份:
    1997
  • 资助金额:
    $ 0.77万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)

相似海外基金

日本語話者にとって自然なサウンドスケープの評価尺度の策定
开发适合日语使用者的音景评估量表
  • 批准号:
    24K15612
  • 财政年份:
    2024
  • 资助金额:
    $ 0.77万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
From corpus to target data as steps for automatic assessment of L2 speech: L2 French phonological lexicon of Japanese learners
从语料库到目标数据作为 L2 语音自动评估的步骤:日语学习者的 L2 法语语音词典
  • 批准号:
    23K20100
  • 财政年份:
    2024
  • 资助金额:
    $ 0.77万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
日本語母語英語学習者の英語産出能力の発達研究
日本英语母语学习者英语产出能力的发展研究
  • 批准号:
    23K20097
  • 财政年份:
    2024
  • 资助金额:
    $ 0.77万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
医療における「やさしい日本語」の有効性検証と通訳者と協働できる教育プログラム開発
验证“简明日语”在医疗方面的有效性并开发可与口译员合作的教育计划
  • 批准号:
    23K24580
  • 财政年份:
    2024
  • 资助金额:
    $ 0.77万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
戦前期中国の日本人居留民社会発行の文化雑誌(日本語)の総目次作成
为战前中国日本居民协会出版的文化杂志(日文)制定总目录
  • 批准号:
    24K03646
  • 财政年份:
    2024
  • 资助金额:
    $ 0.77万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
標準日本語の地域的変種における中和指向型アクセント変化の動態記述
标准日语地域变种中和导向重音变化的动态描述
  • 批准号:
    24K03834
  • 财政年份:
    2024
  • 资助金额:
    $ 0.77万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
中世イロハ引き日本語辞書における見出し掲出システムについての研究
中世纪日语词典标题显示系统研究
  • 批准号:
    24K03931
  • 财政年份:
    2024
  • 资助金额:
    $ 0.77万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
日本語の文字言語化の地域性・地方格差に関する研究
日语书面语言的地域特征及地域差异研究
  • 批准号:
    24K03914
  • 财政年份:
    2024
  • 资助金额:
    $ 0.77万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
東アジア布教における言語学としての日本語ローマ字表記の研究
东亚传教工作中日语罗马化的语言学研究
  • 批准号:
    24K03921
  • 财政年份:
    2024
  • 资助金额:
    $ 0.77万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
多言語データべースに基づく日本語に対する英語の影響の比較研究
基于多语言数据库的英语对日语影响比较研究
  • 批准号:
    24K03917
  • 财政年份:
    2024
  • 资助金额:
    $ 0.77万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了