n個の名詞が連接した日本語複合名詞の解析
由n个名词连接组成的日语复合名词分析
基本信息
- 批准号:09780348
- 负责人:
- 金额:$ 0.58万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Encouragement of Young Scientists (A)
- 财政年份:1997
- 资助国家:日本
- 起止时间:1997 至 1998
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
1. 派生名詞・複合名詞の文法を構築仮名漢字変換・形態素解析の高精度化のために,シソーラスと用例による手法に基づいて派生名詞・複合名詞を解析する手法を提案し,その文法を確率文脈自由文法(PCFG)で構築した.また,RWCテキストデータベースより派生名詞と複合名詞の用例を抽出し,EDR概念体系を組み込んだ大規模な文法を試作した.2. 学習用例数の増加による認識率変動の調査シソーラスと用例に基づく本手法において学習用例が少ない時には,一般に再現率が低く,かといってルールを一般化すると適合率が下がり,再現率と適合率のいずれか一方が従来手法(品詞や粗い意味分類レベルで連接可能性を判定するもの)より劣る場合がある.そこでどの程度用例を学習すれば従来手法を越えられるかを調査した.比較実験の内容は,新聞記事に対する1文単位の形態素解析において生じる全ての派生語候補に対する仮名漢字変換であり,様々な学習条件下で適合率と再現率の計測を行った.その結果,我々の手法が従来手法よりも優れた適合率・再現率を示すための条件は,一般化段数(ルールの抽象化)を1段程度に押さえ,少なくとも10万語以上の用例を学習することだと判明した.こうすれば,登録語と意味的にもっともらしい未登録語のみをうまく受理できるのである.また,充分に多くの用例(100万語以上)を学習した後では,むやみにルールを一般化するよりも,1段だけ一般化したルールを用いた場合に,適合率と再現率の両方で最も良い値が得られた.一方,複合名詞に関しては未だ単純な従来手法を越えるまでに至っていない.これは複合名詞の用例の量が十分でないためであると考えられる.今後は,さらなる用例の収集を計り,解析の高速化手法の研究が必要である.
1. Derived names: complex names, grammars, grammar, grammar, The EDR Conceptual system Group, RWC Conceptual system, uses large-scale Modulus Grammar, generates a derived name, and uses a complex name. The number of use cases is low, the general use case rate is low, the general use case rate is low, and the general use case rate is low. The rate of success, the rate of accuracy, the rate of success, the rate of success, The more you learn how to do it, the more you try to do it. In comparison to the contents of the book, the new record is based on the analysis of the elements in the text, which is based on the analysis of the elements in the text. It is necessary to calculate the coincidence rate under the condition that the name is not available. According to the results, we used the method to determine the success rate, the recombination rate showed the condition, the general number of segments (abstraction), the number of segments, and the number of use cases, the number of segments (abstract), the number of segments, and the I don't know what it means. I don't know if I didn't sign up. Full use case (more than 1 million). After learning, you can get the best results. You can get the best results in one paragraph. On the one hand, copy the name to make sure that you don't know how to do it. Here's a copy of the use case. I don't know how to use it. In the future, the use cases will be collected and analyzed in the study of "high-speed techniques".
项目成果
期刊论文数量(1)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
市丸夏樹: "PCFGによる派生語処理の比較と検討" 九州大学システム情報科学研究科 研究科報告. 4・1(印刷中). (1999)
Natsuki Ichimaru:“使用 PCFG 进行派生文字处理的比较和研究”九州大学研究生院系统与信息科学研究生院报告 4/1(出版中)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
市丸 夏樹其他文献
市丸 夏樹的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('市丸 夏樹', 18)}}的其他基金
従属句の分類と接続助詞の結合順位に基づく複文と重文の構文解析に関する研究
复杂句及基于从句分类和连词连词等级的复杂句句法分析研究
- 批准号:
14780294 - 财政年份:2002
- 资助金额:
$ 0.58万 - 项目类别:
Grant-in-Aid for Young Scientists (B)
相似海外基金
唐長『千田家文書』にみる京唐紙の流通と用例に関する研究
唐朝千田家文献中京都唐纸的流通与使用研究
- 批准号:
24K07874 - 财政年份:2024
- 资助金额:
$ 0.58万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
`Spirit Use Case 1: Pivot Door Thrust Reverser
`Spirit 用例 1:枢轴门推力反向器
- 批准号:
10088948 - 财政年份:2024
- 资助金额:
$ 0.58万 - 项目类别:
Collaborative R&D
Spirit Use Case 2: Complex cavity ventilation/ compartment pressure relief digital twin
Spirit 用例 2:复杂腔体通风/隔间压力释放数字孪生
- 批准号:
10089679 - 财政年份:2024
- 资助金额:
$ 0.58万 - 项目类别:
Collaborative R&D
フィールドデータと文献資料をつなぐ「チベット語民俗語彙=用例データベース」の構築
构建连接田野数据和文献资料的“藏族民间词汇=用法实例库”
- 批准号:
23K20409 - 财政年份:2024
- 资助金额:
$ 0.58万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
大名の国許御殿における唐紙の用例に関する研究 ー御三家と外様大名を中心に
大名国五御殿中唐纸的运用研究——以五三家和户座间大名为中心
- 批准号:
23K19169 - 财政年份:2023
- 资助金额:
$ 0.58万 - 项目类别:
Grant-in-Aid for Research Activity Start-up
Title: Moving medically certifiable AI algorithms from the Cloud and onto the Medi-OS Operating System of Medical Devices to automate, make robust and increase uptake of AI in healthcare: Use-case will be community-based spirometry.
标题:将医学认证的人工智能算法从云端转移到医疗设备的 Medi-OS 操作系统上,以实现自动化、稳健并增加人工智能在医疗保健领域的采用:用例将是基于社区的肺活量测定。
- 批准号:
10064449 - 财政年份:2023
- 资助金额:
$ 0.58万 - 项目类别:
Collaborative R&D
Improving reproducibility in experimental research by using shared data -a use case in spinal cord injury
通过使用共享数据提高实验研究的可重复性——脊髓损伤的一个用例
- 批准号:
478655 - 财政年份:2023
- 资助金额:
$ 0.58万 - 项目类别:
Operating Grants
Reverse Engineering the Extracellular Neighborhood to Support the Functional Tissue Unit: A Use Case to Restore Ovarian Function
对细胞外邻域进行逆向工程以支持功能组织单位:恢复卵巢功能的用例
- 批准号:
10530993 - 财政年份:2022
- 资助金额:
$ 0.58万 - 项目类别:
Admin. Supplement for Reverse Engineering the Extracellular Neighborhood to Support the Functional Tissue Unit: A Use Case to Restore Ovarian Function
行政。
- 批准号:
10814646 - 财政年份:2022
- 资助金额:
$ 0.58万 - 项目类别:
Use-Case Led Benchmarking for Wider Uptake of Haptics in Industrial Manipulators
以用例为主导的基准测试,以在工业机械手中更广泛地采用触觉技术
- 批准号:
10025669 - 财政年份:2022
- 资助金额:
$ 0.58万 - 项目类别:
Small Business Research Initiative