Development of a Hybrid CG Parser
混合 CG 解析器的开发
基本信息
- 批准号:21K00541
- 负责人:
- 金额:$ 2.75万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Scientific Research (C)
- 财政年份:2021
- 资助国家:日本
- 起止时间:2021-04-01 至 2024-03-31
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
本研究は、「統語変換」の概念に基づく理論言語学での研究の知見を活かして、自然言語処理研究において開発されたパーザ (具体的にはCCGパーザ) の性能を向上させることを目指すことを目的とするものである。この目的のために、CCGパーザにとって足りない情報を補うための機械学習のコンポーネントが必要となる。今年度は、昨年度作成したこのコンポーネントのための正解ラベルセットのアノテーション・データを用いて、機械学習によって未知のデータに対して正しくラベル付与ができるかを検証した。具体的には、BCCWJから抽出した例文に必要な情報を手でアノテーションしたアノテーション・データを正解セットと評価セットに分割し、固有名認識のモデルと同構成の機械学習モデル (東北大から提供されている日本語BERTモデルをfine-tuningしたもの) を用いて比較文の意味に関わる情報のラベル (比較句、対応する程度述語、比較対象の表現の三者) を予測する実験を行った。結果は言語処理学会の年次大会の論文で報告した。比較的単純な手法で、モデルが未知の文に対して目的とするアノテーション情報を実際に機械学習である程度正確に当てることができることを確認できた。この成果に基づいて、最終年度である来年度は、未知のデータを統語解析し、意味情報ラベルを予測する機械学習モデルの出力と組み合わせて論理式を出力するパイプラインを実際に構築することを目指す。
This study is based on the concept of "unified language transformation" and the understanding of theoretical linguistics, and the performance of natural speech processing research. The goal of CCG is to improve the quality of information and improve the quality of learning. This year, the annual production of the first batch of products, the correct solution of the first batch of products, the use of machine learning, the unknown problem, the correct solution of the first batch of products, the use of machine learning, the use of machine learning. Specific to BCCWJ, the necessary information for the extraction of the example, the hand to the right solution to the problem, the evaluation of the problem, the division of the inherent name recognition, the mechanical learning of the same structure (Japanese BERT The results were presented at the annual conference of the speech processing society. Compare the purity of the text, the purpose of the text, the degree of mechanical learning, and the confirmation of the text. The results are based on the final year, the future year, the unknown data, the system language analysis, the meaning information, the prediction, the mechanical learning, the output, the combination, the logical expression, the output, the construction, the target.
项目成果
期刊论文数量(4)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Toward 'parasitic scope' parsing: A case study on comparatives in Japanese
走向“寄生范围”句法分析:日语比较级的案例研究
- DOI:
- 发表时间:2023
- 期刊:
- 影响因子:0
- 作者:Duffield;Nigel;磯貝淳一;Yusuke Kubota
- 通讯作者:Yusuke Kubota
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
窪田 悠介其他文献
Crop terms in Japanese
日语中的农作物术语
- DOI:
- 发表时间:
2022 - 期刊:
- 影响因子:0
- 作者:
岡部 玲子;矢島 純;窪田 悠介;磯野 達也;中谷健太郎; 井川詩織; 島村礼子; 田川拓海; 林 弘美; 渡部直也; 于 一楽; 小野尚之; 加藤恒昭; 杉岡洋子; 曹 瑞; 高橋亮介; 外崎淑子; 畠山真一; 藤巻一真; 前田宏太郎; 由本陽子; 李 慧; 上野義雄; 漆原朗子; 岸本秀樹; ほか;Kohei Nakazawa and Akiko Yokoyama - 通讯作者:
Kohei Nakazawa and Akiko Yokoyama
「会話における『認識性』をめぐる英語の事例分析」
“对话中‘可识别性’的英语案例分析”
- DOI:
- 发表时间:
2021 - 期刊:
- 影响因子:0
- 作者:
岡部 玲子;矢島 純;窪田 悠介;磯野 達也;学谷 亮;早野薫 - 通讯作者:
早野薫
トラブル言明のフォーマットとしての「~けど」発話
表达“-but”作为表达麻烦的格式
- DOI:
- 发表时间:
2022 - 期刊:
- 影响因子:0
- 作者:
岡部 玲子;矢島 純;窪田 悠介;磯野 達也;学谷 亮;早野薫;石田聖子他;横森大輔 - 通讯作者:
横森大輔
「「テアル構文」とその周辺に関する覚書」『言語研究の楽しさと楽しみ』
《关于‘Theal Syntax’及其周边的备忘录》《语言研究的乐趣》
- DOI:
- 发表时间:
2021 - 期刊:
- 影响因子:0
- 作者:
漆原 朗子(著)岡部 玲子;矢島 純;窪田 悠介;磯野 達也(編) - 通讯作者:
磯野 達也(編)
Analyzing Japanese Syntax
分析日语语法
- DOI:
- 发表时间:
2020 - 期刊:
- 影响因子:0
- 作者:
漆原 朗子(著)岡部 玲子;矢島 純;窪田 悠介;磯野 達也(編);岸本 秀樹 - 通讯作者:
岸本 秀樹
窪田 悠介的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('窪田 悠介', 18)}}的其他基金
論理文法における日本語尺度表現の構成的意味論の構築
逻辑语法中日语音阶表达的组合语义构建
- 批准号:
10J02912 - 财政年份:2010
- 资助金额:
$ 2.75万 - 项目类别:
Grant-in-Aid for JSPS Fellows
相似海外基金
多言語かつオープンドメインな意味解析器の開発
多语言和开放领域语义分析器的开发
- 批准号:
23KJ0573 - 财政年份:2023
- 资助金额:
$ 2.75万 - 项目类别:
Grant-in-Aid for JSPS Fellows
教師なし学習と一階述語論理を用いた、自然言語の構文・意味解析システムの構築
使用无监督学习和一阶谓词逻辑构建自然语言语法/语义分析系统
- 批准号:
10J09202 - 财政年份:2010
- 资助金额:
$ 2.75万 - 项目类别:
Grant-in-Aid for JSPS Fellows
言語処理の高度化に向けた言語推論に基づく複数文の意味解析法の研究
基于语言推理的多句语义分析研究推进语言处理
- 批准号:
19650028 - 财政年份:2007
- 资助金额:
$ 2.75万 - 项目类别:
Grant-in-Aid for Challenging Exploratory Research
自然言語処理技術への応用を前提とした構文意味解析のための言語学的基礎理論の研究
句法语义分析的语言学基础理论研究及其在自然语言处理技术中的应用
- 批准号:
18652038 - 财政年份:2006
- 资助金额:
$ 2.75万 - 项目类别:
Grant-in-Aid for Exploratory Research
ニューロンの時間的発火相関モデルを利用した自然言語の意味解析と推論学習
使用时间神经元放电相关模型进行自然语言的语义分析和推理学习
- 批准号:
02J07396 - 财政年份:2002
- 资助金额:
$ 2.75万 - 项目类别:
Grant-in-Aid for JSPS Fellows
意味解析用辞書の構築における用例分析プラットホームに関する研究
构建语义分析词典的实例分析平台研究
- 批准号:
12780265 - 财政年份:2000
- 资助金额:
$ 2.75万 - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (A)
格情報を利用した並列意味解析法に関する研究
利用案例信息的并行语义分析研究
- 批准号:
06780329 - 财政年份:1994
- 资助金额:
$ 2.75万 - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (A)
完全自由木文法を用いた自然言語文の意味解析
使用完全自由的树语法对自然语言句子进行语义分析
- 批准号:
60780023 - 财政年份:1985
- 资助金额:
$ 2.75万 - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (A)
属性文法による意味解析部の形式化とコンパイラ生成系の開発
使用属性语法的语义分析部分的形式化和编译器生成系统的开发
- 批准号:
58750287 - 财政年份:1983
- 资助金额:
$ 2.75万 - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (A)














{{item.name}}会员




