統計的手法とヒューリスティックスを融合した自然言語文の統語的曖昧さ解消法
一种结合统计方法和启发式的自然语言句子句法消歧方法
基本信息
- 批准号:11780280
- 负责人:
- 金额:$ 1.47万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Encouragement of Young Scientists (A)
- 财政年份:1999
- 资助国家:日本
- 起止时间:1999 至 2000
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
どの単語がどの関係でどの単語に係り得るか(語の共起性)が十分に分かっているならば,この情報を利用して,自然言語文の統語的曖昧さを絞り込むことができる.しかし,共起可能な語の組は膨大で,数十万文に及ぶ大規模な構文解析済み言語コーパスを用いたとしても,共起可能な語の組を十分に収集することは困難である.今年度は,判別分析の手法を拡張し,構文解析済み言語コーパスから得られる語の共起データを学習データとして,語の共起性を推定する手法を開発し,小規模な推定実験を行なった.本手法は,語の上位-下位関係から得られるヒューリスティックスなど,語の共起性に関するヒューリスティックスを取り込むことができる枠組となっている.entityを単語,説明変量を『単語αと関係fで共起可能である』という性質を表し,説明変量の値が1(共起可能),0(共起不可能)の2値であるとする.言語コーパスから,単語ωが単語αと関係fで共起したという観測結果が得られない場合,共起不可能なのではなく,共起性未定であり,この意味で,言語コーパスから得られるデータは不完全データである.共起性未定部分を個々に0あるいは1とした解候補の内,語の共起性に関するヒューリスティックスを満足する解候補に対して,その解候補の妥当性を求め,それが最大のものを解とする.妥当性は,ある語と共起する語同士および共起しない語同士は類似しているという仮定に基づき,語の特徴ベクトルを各説明変量の値(つまり,どのような共起性があるか)として,判別分析で用いられる相関比を拡張したもので定量化した.ランダムに抽出した名詞約200,格助詞・動詞の組約200に対して,両者の共起性の推定実験を行ない,良好な結果を得ている.
どの単语がどの Relationship でどの単语に线り得るか(语の合性)が十に分かっているならば,このinformationをUtilize して, the ambiguity of the natural language text さを twist り込むことができる.しかし, and the possible なlanguage のgroup は expansionで, hundreds of thousands of texts and large-scale narration analysis 済みlanguage コーパスを use いたとしても, a total of 10% possible な语の组をにCollection is difficult. This year, the method of discriminant analysis is を拡张し, and the composition analysis is コーパスからられる语 logue logue logue logue logue by by by られるる之性 を by をするるを) を开発し )を行なった. This technique is the same as the upper-lower relationship of the language. Entityを単语, Description Quantity を『単语αとrelations fで千亿る』という性をTableし, description 変quantityの値が1 (coincidence is possible), 0 (total (impossible))の2値であるとする.语コーパスから,単语ωが単语αと Relationship fで同起したという観measurement The result is not determined, the co-occurrence is impossible, the co-occurrence is undecided, the meaning is undetermined, the words are undecidedら得られるデータは incomplete データである. The common occurrence part is not determined yet,语の合性に关するヒューリスティックスを満zuするsolved candidateに対して,そのsolved candidateのappropriatenessをquestめ,それが大のものをsolved とする. Appropriateness は, ある语と公起 する语同士 および同起 しない语同士は similar しているという仮定にbasedづき, 语の特徴ベクトルをeach description 変quantity の値(つまり, どのような合性があるか)として, discriminant analysis uses いられる correlation ratio を拡张したものでquantification した.ランダムに to extract about 20 した nouns 0, case particle and verb group are about 200に対して, 両人の性的の inference 実験を行ない, good result をget ている.
项目成果
期刊论文数量(4)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
冨浦洋一 他: "不完全データに対する判別分析と語の共起性推定への応用"電子情報通信学会技術研究報告. (2001年3月予定). (2001)
Yoichi Tomiura等人:“不完整数据的判别分析及其在词共现估计中的应用”IEICE技术研究报告(预定2001年3月)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
田中省作: "共起制約を組み込んだ確率文法による名詞句の統語的曖昧さの解消"九州大学大学院システム情報科学研究科報告. 5巻・1号(未定). (2000)
Shusaku Tanaka:“使用包含共现约束的随机语法解决名词短语的句法歧义”九州大学系统与信息科学研究生院报告第 5 卷第 1 期(TBA)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
冨浦 洋一其他文献
初級ドイツ語授業におけるブレンディド・ラーニングの効果的な設計と Moodle の活用
混合式学习的有效设计和 Moodle 在德语初级课程中的使用
- DOI:
- 发表时间:
2009 - 期刊:
- 影响因子:0
- 作者:
大木充;根岸雅史;冨浦 洋一;大木充;根岸雅史;里村和秋 - 通讯作者:
里村和秋
「英語のプロフィシェンシーとは何だろう」(鎌田修、嶋田和子、迫田久美子編著『プロフィシェンシーを育てる』, pp. 54-69)
“什么是英语能力?”(《培养能力》,蒲田修、岛田和子、迫田久美子编辑,第 54-69 页)
- DOI:
- 发表时间:
2008 - 期刊:
- 影响因子:0
- 作者:
大木充;根岸雅史;冨浦 洋一;大木充;根岸雅史 - 通讯作者:
根岸雅史
機関リポジトリの言語資源としての活用 : 大学毎の部局別英語重要語彙の選定
利用机构知识库作为语言资源:各大学院系精选重要英语词汇
- DOI:
- 发表时间:
2014 - 期刊:
- 影响因子:0
- 作者:
田中 省作;冨浦 洋一;宮崎 佳典;徳見 道夫 - 通讯作者:
徳見 道夫
Influence of Teacher Factors in Teaching English in English (TEE)
英语教学(TEE)中教师因素的影响
- DOI:
- 发表时间:
2015 - 期刊:
- 影响因子:0
- 作者:
田中 省作;冨浦 洋一;宮崎 佳典;徳見 道夫;Iwai Chiaki - 通讯作者:
Iwai Chiaki
教えよう 日本語
我们来教日语吧
- DOI:
- 发表时间:
2016 - 期刊:
- 影响因子:0
- 作者:
田中 省作;冨浦 洋一;宮崎 佳典;徳見 道夫;Iwai Chiaki;河野俊之・橋本ゆかり(共著) - 通讯作者:
河野俊之・橋本ゆかり(共著)
冨浦 洋一的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('冨浦 洋一', 18)}}的其他基金
嗅球糸球体層の活性パターン画像と分子パラメタに基づく物質の匂い情報の定量化
基于嗅球肾小球层的激活模式图像和分子参数量化物质的气味信息
- 批准号:
21K19796 - 财政年份:2021
- 资助金额:
$ 1.47万 - 项目类别:
Grant-in-Aid for Challenging Research (Exploratory)
名詞句「NPのNP」の意味構造推定のための語彙知識の自動獲得
自动获取词汇知识,用于名词短语“NP of NP”的语义结构估计
- 批准号:
09780346 - 财政年份:1997
- 资助金额:
$ 1.47万 - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (A)
相似海外基金
Detailed bulk composition analysis of extrasolar objects accreted at the surface of white dwarf stars
白矮星表面吸积的太阳系外物体的详细整体成分分析
- 批准号:
RGPIN-2020-05019 - 财政年份:2022
- 资助金额:
$ 1.47万 - 项目类别:
Discovery Grants Program - Individual
Multispectral Sensor for Chemical Composition Analysis of Ultrafine Aerosols in Air Quality Assessment
用于空气质量评估中超细气溶胶化学成分分析的多光谱传感器
- 批准号:
10546675 - 财政年份:2022
- 资助金额:
$ 1.47万 - 项目类别:
Development of Advanced Instrumentaion for Body Composition Analysis
身体成分分析先进仪器的开发
- 批准号:
RGPIN-2020-05111 - 财政年份:2022
- 资助金额:
$ 1.47万 - 项目类别:
Discovery Grants Program - Individual
Multispectral Sensor for Chemical Composition Analysis of Ultrafine Aerosols in Air Quality Assessment
用于空气质量评估中超细气溶胶化学成分分析的多光谱传感器
- 批准号:
10887673 - 财政年份:2022
- 资助金额:
$ 1.47万 - 项目类别:
科学技術論文における長く複雑な文の構文解析
解析科技论文中的长而复杂的句子
- 批准号:
22K17957 - 财政年份:2022
- 资助金额:
$ 1.47万 - 项目类别:
Grant-in-Aid for Early-Career Scientists
Detailed bulk composition analysis of extrasolar objects accreted at the surface of white dwarf stars
白矮星表面吸积的太阳系外物体的详细整体成分分析
- 批准号:
RGPIN-2020-05019 - 财政年份:2021
- 资助金额:
$ 1.47万 - 项目类别:
Discovery Grants Program - Individual
Chemical composition analysis of locally made/used ceramics by neutron activation analysis to establish a high-resolution approach to the study of history of local economic development
通过中子活化分析对当地制造/使用的陶瓷进行化学成分分析,为研究当地经济发展历史建立高分辨率方法
- 批准号:
21K18379 - 财政年份:2021
- 资助金额:
$ 1.47万 - 项目类别:
Grant-in-Aid for Challenging Research (Exploratory)
Near-infrared microscopic observation and gas composition analysis of fluid inclusions for hydrothermal deposits - an application to exploration
热液矿床流体包裹体的近红外显微观察和气体成分分析——在勘探中的应用
- 批准号:
21K04960 - 财政年份:2021
- 资助金额:
$ 1.47万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
Development of Advanced Instrumentaion for Body Composition Analysis
身体成分分析先进仪器的开发
- 批准号:
RGPIN-2020-05111 - 财政年份:2021
- 资助金额:
$ 1.47万 - 项目类别:
Discovery Grants Program - Individual
Development of Advanced Instrumentaion for Body Composition Analysis
身体成分分析先进仪器的开发
- 批准号:
RGPIN-2020-05111 - 财政年份:2020
- 资助金额:
$ 1.47万 - 项目类别:
Discovery Grants Program - Individual














{{item.name}}会员




