自然言語テキストからの語彙的知識獲得および獲得結果を利用した効率的文解析法

利用词汇知识获取和自然语言文本获取结果的高效句子分析方法

基本信息

  • 批准号:
    07780326
  • 负责人:
  • 金额:
    $ 0.64万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
  • 财政年份:
    1995
  • 资助国家:
    日本
  • 起止时间:
    1995 至 无数据
  • 项目状态:
    已结题

项目摘要

本研究では、自然言語テキストから語彙知識を獲得し、さらに獲得結果を実際の言語処理において効率的に利用し、処理精度を向上させる手法について研究を行なった。本年度の研究項目は次の3点である。1.実用レベルの規模のコーパスから、実用レベルの規模の数の動詞について語彙知識を獲得する。2.動詞の語彙知識獲得において、対訳テキストを利用して動詞の多義性を類別する。3.自然言語テキストから統語知識を抽出する。まず、第1点については、これまでに確立してきた動詞の語彙知識獲得手法により、日本電子化辞書の大量の構文解析済み日本語テキストから動詞の語彙知識を獲得する実験を行なった。この実験の結果、動詞の語彙知識獲得の際に多義動詞の多義性を類別しながら語彙知識を獲得するというメカニズムが、実用的規模で有効に機能することが確認できた。また、第2点については、これまでに確立してきた、動詞の語彙知識獲得ならびに多義動詞の多義性類別の半自動的手法の自動化を実現した。この手法の特徴は、単言語文においては類別することが難しい自然言語の意味的曖昧性を、英語への翻訳結果における意味分類を参照することによって類別できる点である。本研究においては、この利点を損なうことなく、手法の自動化を行なうことができた。さらに、第3点は、獲得結果を利用した効率的文解析を実現するための基礎研究として行なったもので、効率的文解析で用いる統語知識を自然言語テキストデータから抽出することを行なった。特に、構文解析済みテキストから文脈自由文法の形式の文法規則を抽出する手法を開発した。この手法においては、適用範囲が広くしかも解析精度の高い文法を抽出するために、非終端記号の統計的類似度を用いて文法を一般化するというメカニズムを実現した。
This study is based on the results of the natural language acquisition of vocabulary knowledge and the acquisition of natural language knowledge. The efficiency of processing is improved, and the accuracy of processing is improved. The method of processing is researched and performed. This year's research project has three points. 1.実用レベルのscaleのコーパスから、実用レベルのscaleのnumberのverbについてvocabulary knowledgeをgainする. 2. Acquisition of verb vocabulary knowledge, において, 対訳テキストを, utilization of verb のambiguity, category する. 3. Natural language テキストからUnified language knowledge をExtraction する.まず、The first point については、これまでにEstablishment of してきたverbのvocabulary knowledge acquisition techniques により、Japan Electronics Chemical dictionaryのa large number of composition analysis済み日本语テキストからverbのvocabulary knowledgeをgetする実験を行なった.この実験の results, verb のlexical knowledge acquisition の国际に polysemy verb のambiguity を category しながら lexicon knowledge The scale and effectiveness of the scale and effective functions obtained by the recognition system have been confirmed.また, point 2 については, これまでにestablished してきた, verb のvocabulary knowledge acquisition ならびにpolysemy verb のpolysemy category のsemi-automatic technique のautomatic を実成した.このtechniqueの特徴は、単语文においてはcategoryすることがdifficultyしいThe ambiguity of the meaning of natural languageを, English への訳 Results における means classification をreference することによってcategory できるPoint である. This research is based on the advantages and disadvantages of this study, and the techniques are automated and automated.さらに、Point 3は、A text analysis of the efficiency of obtaining results をUtilization を実 Present するためのBasic research として行なったもので、Efficient text analysis using いるsystem language knowledge をnatural language テキストデータからdraw out することを行なった. Characteristics, compositional analysis: context, free grammar, form, grammar rules, extraction, technique, and openness.この法においては、Applicable range 囲が広くしかもanalytical precision の高いgrammatical extraction するために、 The statistical similarity of non-terminal tokens is generalized using the いてgrammar and is now available.

项目成果

期刊论文数量(6)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Takehito Utsuro: "Class-based Sense Classification of Verbal Polysemy in Case Frame Acquisition from Parallel Corpora" Proceedings of the 3rd Natural Language Processing Pacific Rim Symposium. 671-677 (1995)
Takehito Utsuro:“从并行语料库获取案例框架中基于类别的言语多义词语义分类”第三届自然语言处理环太平洋研讨会论文集。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
Takehito Utsuro: "Sense Classification of Verbal Polysemy based-on Bilingual Class/Class Association" Proceedings of the 16th International Conference on Computational Linguistics. (1996)
Takehito Utsuro:《基于双语类/类关联的言语多义词义分类》第16届国际计算语言学会议论文集。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
宇津呂武仁: "類似度計算テンプレートを用いた検索質問生成による最近隣検索法の最適化" 人工知能学会研究会資料. SIG-KBS-9502. 1-8 (1995)
Takehito Utsuro:“通过使用相似性计算模板生成搜索问题来优化最近邻搜索方法”SIG-KBS-9502 学会的材料(1995)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
Andre Wlodarczyk: "Towards High Quality Computerised Linguistic Tools Processing Japanese Information" Proceedings of the 4th International Conference on Japanese Information in Science,Technology,Industry,and Business. (1995)
Andre Wlodarczyk:“迈向处理日语信息的高质量计算机化语言工具”第四届科学、技术、工业和商业日本信息国际会议论文集。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
宇津呂武仁: "対訳辞書および統計情報を用いた二言語対訳テキスト照合" コンピュータソフトウェア. 12. 414-423 (1995)
Takehito Utsuro:“使用双语词典和统计信息进行双语双语文本匹配”计算机软件 12. 414-423 (1995)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

宇津呂 武仁其他文献

Wikipediaを知識源とする分野トピックモデルの推定と分析
以维基百科为知识源的领域主题模型估计与分析
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
    牧田 健作;鈴木 浩子;小池 大地;宇津呂 武仁;河田 容英
  • 通讯作者:
    河田 容英
自然言語処理
自然语言处理
  • DOI:
  • 发表时间:
    2007
  • 期刊:
  • 影响因子:
    0
  • 作者:
    天野 真家;石崎 俊;宇津呂 武仁;成田 真澄;福本 淳一
  • 通讯作者:
    福本 淳一
乳幼児をもつ養育者の絵本購入行動と購入絵本に対する意識と行動―インターネット調査からの検討―
婴幼儿看护者绘本购买行为及其购买绘本认知和行为——网络调查研究——
  • DOI:
  • 发表时间:
    2018
  • 期刊:
  • 影响因子:
    0
  • 作者:
    笠松 美歩;上原 宏;宇津呂 武仁;齋藤 有;齋藤有
  • 通讯作者:
    齋藤有
時系列ニュース・ブログにおける話題同定に関する分析 --- 震災を例題として ---
时序新闻博客主题识别分析---以地震灾害为例---
  • DOI:
  • 发表时间:
    2012
  • 期刊:
  • 影响因子:
    0
  • 作者:
    小池 大地;牧田 健作;宇津呂 武仁;吉岡 真治;河田 容英;福原 知宏
  • 通讯作者:
    福原 知宏
ウェブ検索者の情報要求観点の日中間対照分析
从网络搜索者信息请求的角度分析中日两国
  • DOI:
  • 发表时间:
    2014
  • 期刊:
  • 影响因子:
    0
  • 作者:
    鄭 立儀;小池 大地;聶 添;今田 貴和;陳 磊;宇津呂 武仁;河田 容英;神門 典子.
  • 通讯作者:
    神門 典子.

宇津呂 武仁的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('宇津呂 武仁', 18)}}的其他基金

実世界の大規模言語資源からの翻訳知識獲得に基づく機械翻訳モデルの研究
基于现实世界大规模语言资源获取翻译知识的机器翻译模型研究
  • 批准号:
    16700141
  • 财政年份:
    2004
  • 资助金额:
    $ 0.64万
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)
WWW上の多言語文書から翻訳知識を発見するための知的インタフェースの研究
从WWW多语言文档中发现翻译知识的智能接口研究
  • 批准号:
    15017245
  • 财政年份:
    2003
  • 资助金额:
    $ 0.64万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
言語横断情報検索および多言語情報抽出の技術を利用した翻訳知識獲得の研究
利用跨语言信息检索和多语言信息抽取技术获取翻译知识的研究
  • 批准号:
    14780275
  • 财政年份:
    2002
  • 资助金额:
    $ 0.64万
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)
大規模テキストデータに基づく名詞意味辞書の構築及び自然言語理解における利用
基于大规模文本数据的名词意义词典构建及其在自然语言理解中的应用
  • 批准号:
    12780282
  • 财政年份:
    2000
  • 资助金额:
    $ 0.64万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
大規模テキストデータに基づく名詞意味辞書の構築及び自然言語理解における利用
基于大规模文本数据的名词意义词典构建及其在自然语言理解中的应用
  • 批准号:
    11780275
  • 财政年份:
    1999
  • 资助金额:
    $ 0.64万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
統計モデルに基づく大規模テキストへの言語情報付与及びテキストからの言語知識獲得
为大规模文本添加语言信息,基于统计模型从文本中获取语言知识
  • 批准号:
    09780338
  • 财政年份:
    1997
  • 资助金额:
    $ 0.64万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)

相似海外基金

ICNALE-WE22:アジア圏22か国を網羅する新しい英語学習者作文コーパスの構築と分析
ICNALE-WE22:覆盖22个亚洲国家的新型英语学习者作文语料库的构建与分析
  • 批准号:
    23K25338
  • 财政年份:
    2024
  • 资助金额:
    $ 0.64万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
大規模進化コーパスの構築・利活用によるソフトウェア自動進化の促進
通过构建和利用大规模进化语料库促进软件自动进化
  • 批准号:
    23K24823
  • 财政年份:
    2024
  • 资助金额:
    $ 0.64万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
発話行為機能タグ付きコーパスおよびコーパス連動型オンライン学習サイトの構築
构建具有言语行为功能标签的语料库和语料库链接的在线学习网站
  • 批准号:
    24K03956
  • 财政年份:
    2024
  • 资助金额:
    $ 0.64万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
日本語学習者コーパスの拡充およびコーパスを活用した習得研究
日语学习者语料库的扩展以及利用该语料库的习得研究
  • 批准号:
    24K03976
  • 财政年份:
    2024
  • 资助金额:
    $ 0.64万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
看護留学生等に必要な言語知識ー教科書コーパスと語彙テストに基づく研究・教材開発
留学生所需的语言知识等 - 基于教科书语料库和词汇测试的研究和教材开发
  • 批准号:
    24K03990
  • 财政年份:
    2024
  • 资助金额:
    $ 0.64万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
合成メディアの大規模比較評価の最適化と主観比較評価コーパスの構築
合成媒体大规模对比评价优化及主观对比评价语料库构建
  • 批准号:
    24K20792
  • 财政年份:
    2024
  • 资助金额:
    $ 0.64万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
聴解コーパスの構築による日本語学習者の聴解困難点と推測技術の実証的研究
基于听力语料库的日语学习者听力理解困难及估计技术的实证研究
  • 批准号:
    23K21941
  • 财政年份:
    2024
  • 资助金额:
    $ 0.64万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
「話題から始まる日本語教育」を支援する情報サイトの構築と話題別会話コーパスの拡充
构建支持“从主题开始的日语教育”的信息网站,扩大主题对话语料库
  • 批准号:
    23K21940
  • 财政年份:
    2024
  • 资助金额:
    $ 0.64万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
ジェスチャー情報付きコーパスの構築と統語構造に対応するジェスチャーの解明
构建包含手势信息的语料库并阐明与句法结构相对应的手势
  • 批准号:
    24K16050
  • 财政年份:
    2024
  • 资助金额:
    $ 0.64万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
マルチモーダルな視点による日本語講義動画およびコーパスの開発
多模态视角下的日语讲座视频和语料库开发
  • 批准号:
    24K03981
  • 财政年份:
    2024
  • 资助金额:
    $ 0.64万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了