大規模テキストデータに基づく名詞意味辞書の構築及び自然言語理解における利用
基于大规模文本数据的名词意义词典构建及其在自然语言理解中的应用
基本信息
- 批准号:12780282
- 负责人:
- 金额:$ 1.73万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Encouragement of Young Scientists (A)
- 财政年份:2000
- 资助国家:日本
- 起止时间:2000 至 2001
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
本研究では,実用的規模の言語テキストに対して,これまでよりも深いレベルの意味理解を高性能に行うことを目的として,名詞の意味・用法をより深いレベルで記述した意味辞書を,大規模テキストデータから半自動的に構築する手法の研究を行った.本年度は,大規模な名詞意味辞書の存在が本質的に必須となる言語理解の各過程において,名詞意味辞書がどの程度有効であるかを評価・検証し,さらに言語理解の精度が最適化されるように,名詞意味辞書の記述の一般化の度合を柔軟に調整する手法の研究を行なった.本年度の研究項目は次の2点である.1.テキストの語彙的結束性に基づく語の意味的曖昧性の解消の過程において,名詞意味辞書の有効性を評価・検証した.2.照応・指示・省略などの文脈理解の各過程において,名詞意味辞書の有効性を評価・検証した.まず,第1点については,統計的手法により学習された意味的曖昧性解消規則を適用する過程において,名詞意味辞書の有効性を評価・検証した.従来,統計的手法による意味的曖昧性解消の研究においては,テキスト中の単語など表層的手がかりのみに基づいて意味的曖昧性を解消していたが,本研究では,意味的曖昧性解消の手がかりとして名詞意味辞書の記述を利用することにより,曖昧性解消の性能がどの程度向上するかを評価・検証した.第2点については,複数の文からなるテキストについて,テキスト中の名詞の意味記述を名詞意味辞書から検索し,これらをネットワーク状に連結することにより,まず,テキスト全体の語彙的結束性を表現した.そして,語彙的結束性に基づく語彙的制約と談話構造上の制約を統合的に考慮することにより,照応・指示・省略の参照先を決定する文脈理解モデルを構築し,その性能を評価した.
The purpose of this study is to understand the scale of the language used in this study, and to understand the high performance of the research. Line うことをpurpose として, noun meaning・usage をより深いレベルでscribe したmeaning dictionaryを, large-scale テキストデータから Semi-automatic にConstruction する Technique の Research を row った. This year は, large-scale な noun means dictionary の existence が essential にIt is necessary to understand the various processes of language comprehension. Precision and optimization of speech understanding, noun meaning dictionary description and generalization, softness, adjustment and technique Research on the line of research. This year's research project: 2 points of the research project. 1. The finality of the vocabulary of the vocabulary is the meaning of the vocabulary. The process of resolving the ambiguity, noun means the validity of the dictionary, the evaluation of the validity of the dictionary.のContextual understanding of each process において, noun means the validity of the dictionary を Comment価・検证した.まず, the first point については, unified The method of planning is to learn the ambiguity resolution rule of the meaning of the meaning. It is applicable to the process of solving the ambiguity of the meaning of the name. The validity of the noun meaning dictionary is価・検证した.従来, the study of the ambiguity resolution of the meaning using statistical techniques においては, テキスト中の単语などThe superficial hand is the ambiguity of the meaning, the ambiguity of the meaning is resolved, and this study is the ambiguity of the meaning.かりとして noun meaning dictionary のrecording をutilization することにより, performance of ambiguity resolution がどの Degree upward するかを Comment価・検证した.The second point is については, plural の文からなるテキストについて, テキスト中の名の义词记をnoun meaning dictionary から検SO し, これらをネットワークshaped にconnection することにより, まず, テキストall vocabulary The finality of the expression is the expression of the finality of the vocabulary. The finality of the vocabulary is the restriction of the vocabulary. The restriction of the conversation structure is the integration of the consideration.ることにより, Illustration, instruction, omission, reference first, decision, contextual understanding, construction, performance, evaluation, judgment.
项目成果
期刊论文数量(48)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
小玉康広: "複数の音声認識システムの出力の共通部分を利用した確信度"日本音響学会2001年春季研究発表会講演論文集. I. (2001)
Yasuhiro Kodama:“使用多个语音识别系统输出的公共部分的信心”日本声学学会 2001 年春季会议记录 I. (2001)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
Takehito Utsuro: "Analyzing Dependencies of Japanese Subordinate Clauses based on Statistics of Scope Embedding Preference"Proceedings of the 1st Conference of the North American Chapter of the Association for Computational Linguistics. 110-117 (2000)
Takehito Utsuro:“基于范围嵌入偏好统计分析日语从句的依存关系”计算语言学协会北美分会第一届会议论文集。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
宇津呂 武仁: "ブートストラップによる低人手コスト日本語固有表現抽出"情報処理学会研究報告. 2000-NL-139. 9-16 (2000)
Takehito Utsuro:“使用 bootstrapping 进行低人力成本的日本命名实体提取”日本信息处理协会研究报告 2000-NL-139 (2000)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
宇津呂武仁: "言語コーパスをより有効に使うために"情報処理. 41・7. 787-792 (2000)
Takehito Utsuro:“更有效地使用语言语料库”信息处理41・792。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
堀内貴司: "翻訳知識獲得のための言語横断関連報道記事検索"言語処理学会第8回年次大会論文集. (2002)
Takashi Horiuchi:“获取翻译知识的跨语言相关新闻文章搜索”语言处理学会第八届年会论文集(2002)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
宇津呂 武仁其他文献
Wikipediaを知識源とする分野トピックモデルの推定と分析
以维基百科为知识源的领域主题模型估计与分析
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
牧田 健作;鈴木 浩子;小池 大地;宇津呂 武仁;河田 容英 - 通讯作者:
河田 容英
乳幼児をもつ養育者の絵本購入行動と購入絵本に対する意識と行動―インターネット調査からの検討―
婴幼儿看护者绘本购买行为及其购买绘本认知和行为——网络调查研究——
- DOI:
- 发表时间:
2018 - 期刊:
- 影响因子:0
- 作者:
笠松 美歩;上原 宏;宇津呂 武仁;齋藤 有;齋藤有 - 通讯作者:
齋藤有
時系列ニュース・ブログにおける話題同定に関する分析 --- 震災を例題として ---
时序新闻博客主题识别分析---以地震灾害为例---
- DOI:
- 发表时间:
2012 - 期刊:
- 影响因子:0
- 作者:
小池 大地;牧田 健作;宇津呂 武仁;吉岡 真治;河田 容英;福原 知宏 - 通讯作者:
福原 知宏
ウェブ検索者の情報要求観点の日中間対照分析
从网络搜索者信息请求的角度分析中日两国
- DOI:
- 发表时间:
2014 - 期刊:
- 影响因子:0
- 作者:
鄭 立儀;小池 大地;聶 添;今田 貴和;陳 磊;宇津呂 武仁;河田 容英;神門 典子. - 通讯作者:
神門 典子.
宇津呂 武仁的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('宇津呂 武仁', 18)}}的其他基金
実世界の大規模言語資源からの翻訳知識獲得に基づく機械翻訳モデルの研究
基于现实世界大规模语言资源获取翻译知识的机器翻译模型研究
- 批准号:
16700141 - 财政年份:2004
- 资助金额:
$ 1.73万 - 项目类别:
Grant-in-Aid for Young Scientists (B)
WWW上の多言語文書から翻訳知識を発見するための知的インタフェースの研究
从WWW多语言文档中发现翻译知识的智能接口研究
- 批准号:
15017245 - 财政年份:2003
- 资助金额:
$ 1.73万 - 项目类别:
Grant-in-Aid for Scientific Research on Priority Areas
言語横断情報検索および多言語情報抽出の技術を利用した翻訳知識獲得の研究
利用跨语言信息检索和多语言信息抽取技术获取翻译知识的研究
- 批准号:
14780275 - 财政年份:2002
- 资助金额:
$ 1.73万 - 项目类别:
Grant-in-Aid for Young Scientists (B)
大規模テキストデータに基づく名詞意味辞書の構築及び自然言語理解における利用
基于大规模文本数据的名词意义词典构建及其在自然语言理解中的应用
- 批准号:
11780275 - 财政年份:1999
- 资助金额:
$ 1.73万 - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (A)
統計モデルに基づく大規模テキストへの言語情報付与及びテキストからの言語知識獲得
为大规模文本添加语言信息,基于统计模型从文本中获取语言知识
- 批准号:
09780338 - 财政年份:1997
- 资助金额:
$ 1.73万 - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (A)
自然言語テキストからの語彙的知識獲得および獲得結果を利用した効率的文解析法
利用词汇知识获取和自然语言文本获取结果的高效句子分析方法
- 批准号:
07780326 - 财政年份:1995
- 资助金额:
$ 1.73万 - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (A)
相似海外基金
大規模テキストデータに基づく名詞意味辞書の構築及び自然言語理解における利用
基于大规模文本数据的名词意义词典构建及其在自然语言理解中的应用
- 批准号:
11780275 - 财政年份:1999
- 资助金额:
$ 1.73万 - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (A)
日本語の複文・重文の表現パターン記述方式とその計算機用意味辞書の構成法に関する研究
日语复句、复合句表达模式描述方法及计算机语义词典构建方法研究
- 批准号:
11878063 - 财政年份:1999
- 资助金额:
$ 1.73万 - 项目类别:
Grant-in-Aid for Exploratory Research
意味辞書作成の機械化に関する研究
语义词典创建机械化研究
- 批准号:
60580028 - 财政年份:1985
- 资助金额:
$ 1.73万 - 项目类别:
Grant-in-Aid for General Scientific Research (C)














{{item.name}}会员




