統計モデルに基づく大規模テキストへの言語情報付与及びテキストからの言語知識獲得
为大规模文本添加语言信息,基于统计模型从文本中获取语言知识
基本信息
- 批准号:09780338
- 负责人:
- 金额:$ 1.28万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Encouragement of Young Scientists (A)
- 财政年份:1997
- 资助国家:日本
- 起止时间:1997 至 1998
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
本研究では,大量のテキストデータに対して豊富な言語情報を効率よく付与するという手法の研究を行った.さらに,豊富な言語情報が付与されたテキストから,様々な言語現象に関する知識を獲得する手法について研究をおこなった.本年度の研究項目は次の2点である.1. 豊富な言語情報が付与されたテキストから,様々な言語現象に関する知識を獲得する際に,それぞれの言語現象の特性に応じて,最適な言語知識獲得手法を適用し,言語知識獲得を行う.2. 獲得された大規模言語知識が,実際の言語処理の性能向上にどの程度寄与するかを理論的・実験的に評価・検証する.まず,第1点については,言語知識獲得に適用可能な代表的手法として,確率モデル学習および機械学習の二種類の手法に着目し,それぞれの言語知識の獲得に最適な手法について研究を行った.具体的には,確率モデル学習の手法が適した例題として,(1)日本語形態素解析,(2)統語解析のための動詞語彙知識の学習,の二つについて,モデルを記述する言語情報の記述の細かさを徐々に調整しながら,なるべく解析誤りを少なくする方向にモデルを自動改良していく手法を開発した.また,機械学習の手法が適した例題として,(3)日本語従属節の係り受け関係の解析,について,従属節の様々な特徴のうち,従属節間の係り受け関係の特定に最も寄与する特徴を選択的に学習することに成功した.第2点については,まず,(2)の統語解析のための動詞語彙知識の学習において,統語的曖昧性の解消の性能に関して,幾つかの対照モデルと比較して,確率モデル学習の手法により構築された最適モデルが最も優れでいることを示した.また,(3)の日本語従属節の係り受け関係の解析において,獲得された言語知識を用いてあらかじめ従属節間の係り受け関係を特定しておくことにより,文全体の係り受け解析の性能が向上することを示した.
In this study, there are a large number of people who are rich, rich, affectionate, affectionate and affectionate. I don't know, I don't know. The research project of this year will be completed at 2 o'clock this year. 1. When you are rich, you don't know what to say. You don't know what you know. You don't know what you know. It is very important to know that the performance of the international market is higher than that of the theory of the theory. Thank you, point 1. You have learned to use the methods that you may represent, to make sure that you pay attention to the two kinds of mechanical science, and that you have learned the most important techniques in research. Specific information, make sure that the specific information is correct, that is, (1) the analysis of the elements in Japan, (2) the systematic analysis of the knowledge and knowledge of the students, the notes of the words and feelings, the words and feelings of the students. There is no error in the analysis of the error. The direction of the train is not changed. It is automatically improved and the method is opened. (3) in Japan, there is an analysis of the number of recipients in Japan, and it is a special license in Japan, and it is the most successful one that has been sent to the selected users in Japan. Point 2 (2) in the system, there is a difference in the performance of the system in terms of knowledge, knowledge and knowledge. In Japan, (3) the Japanese government is responsible for the analysis of the performance of the system, and the knowledge is obtained that you can use the knowledge of the user to determine the specific performance of the recipient.
项目成果
期刊论文数量(15)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
北内 啓: "誤り駆動型の確率モデル学習による日本語形態素解析" 情報処理学会研究報告. 97-NL-124. 41-48 (1998)
Kei Kitauchi:“使用错误驱动概率模型学习的日语形态分析”日本信息处理学会研究报告 97-NL-124(1998)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
Takehito Utsuro: "Lexical Knowledge Acquisition from Corpora" Proceedings of JSPS-HITACHI Workshop on New Challenges in Natural Language Processing and its Application,-Integration of Linguistics-based and Corpus-based Approaches-. 82-87 (1998)
Takehito Utsuro:“从语料库获取词汇知识”JSPS-HITACHI 自然语言处理及其应用新挑战研讨会论文集,-基于语言学和基于语料库的方法的集成-。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
Takehito Utsuro: "Maximum Entropy Model Learning of Subcategorization Preference" Proceedings of the 5th Workshop on Very Large Corpora. 246-260 (1997)
Takehito Utsuro:“子类别偏好的最大熵模型学习”第五届超大型语料库研讨会论文集。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
宇津呂 武仁: "コーパスを用いた動詞格フレーム辞書構築のための支援環境" 自然言語処理シンポジウム「実用的な自然言語処理に向けて」論文集. (1997)
Takehito Utsuro:“使用语料库构建动词格框架字典的支持环境”自然语言处理研讨会论文集“迈向实用自然语言处理”(1997)
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
中塚 幸毅: "コーパスからの格フレーム半自動獲得のための支援環境の構築" 言語処理学会第4回年次大会論文集. 442-445 (1998)
Koki Nakatsuka:“从语料库中半自动获取案例框架的支持环境的构建”语言处理协会第四届年会记录442-445(1998)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
宇津呂 武仁其他文献
Wikipediaを知識源とする分野トピックモデルの推定と分析
以维基百科为知识源的领域主题模型估计与分析
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
牧田 健作;鈴木 浩子;小池 大地;宇津呂 武仁;河田 容英 - 通讯作者:
河田 容英
乳幼児をもつ養育者の絵本購入行動と購入絵本に対する意識と行動―インターネット調査からの検討―
婴幼儿看护者绘本购买行为及其购买绘本认知和行为——网络调查研究——
- DOI:
- 发表时间:
2018 - 期刊:
- 影响因子:0
- 作者:
笠松 美歩;上原 宏;宇津呂 武仁;齋藤 有;齋藤有 - 通讯作者:
齋藤有
時系列ニュース・ブログにおける話題同定に関する分析 --- 震災を例題として ---
时序新闻博客主题识别分析---以地震灾害为例---
- DOI:
- 发表时间:
2012 - 期刊:
- 影响因子:0
- 作者:
小池 大地;牧田 健作;宇津呂 武仁;吉岡 真治;河田 容英;福原 知宏 - 通讯作者:
福原 知宏
ウェブ検索者の情報要求観点の日中間対照分析
从网络搜索者信息请求的角度分析中日两国
- DOI:
- 发表时间:
2014 - 期刊:
- 影响因子:0
- 作者:
鄭 立儀;小池 大地;聶 添;今田 貴和;陳 磊;宇津呂 武仁;河田 容英;神門 典子. - 通讯作者:
神門 典子.
宇津呂 武仁的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('宇津呂 武仁', 18)}}的其他基金
実世界の大規模言語資源からの翻訳知識獲得に基づく機械翻訳モデルの研究
基于现实世界大规模语言资源获取翻译知识的机器翻译模型研究
- 批准号:
16700141 - 财政年份:2004
- 资助金额:
$ 1.28万 - 项目类别:
Grant-in-Aid for Young Scientists (B)
WWW上の多言語文書から翻訳知識を発見するための知的インタフェースの研究
从WWW多语言文档中发现翻译知识的智能接口研究
- 批准号:
15017245 - 财政年份:2003
- 资助金额:
$ 1.28万 - 项目类别:
Grant-in-Aid for Scientific Research on Priority Areas
言語横断情報検索および多言語情報抽出の技術を利用した翻訳知識獲得の研究
利用跨语言信息检索和多语言信息抽取技术获取翻译知识的研究
- 批准号:
14780275 - 财政年份:2002
- 资助金额:
$ 1.28万 - 项目类别:
Grant-in-Aid for Young Scientists (B)
大規模テキストデータに基づく名詞意味辞書の構築及び自然言語理解における利用
基于大规模文本数据的名词意义词典构建及其在自然语言理解中的应用
- 批准号:
12780282 - 财政年份:2000
- 资助金额:
$ 1.28万 - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (A)
大規模テキストデータに基づく名詞意味辞書の構築及び自然言語理解における利用
基于大规模文本数据的名词意义词典构建及其在自然语言理解中的应用
- 批准号:
11780275 - 财政年份:1999
- 资助金额:
$ 1.28万 - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (A)
自然言語テキストからの語彙的知識獲得および獲得結果を利用した効率的文解析法
利用词汇知识获取和自然语言文本获取结果的高效句子分析方法
- 批准号:
07780326 - 财政年份:1995
- 资助金额:
$ 1.28万 - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (A)
相似海外基金
ICNALE-WE22:アジア圏22か国を網羅する新しい英語学習者作文コーパスの構築と分析
ICNALE-WE22:覆盖22个亚洲国家的新型英语学习者作文语料库的构建与分析
- 批准号:
23K25338 - 财政年份:2024
- 资助金额:
$ 1.28万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
大規模進化コーパスの構築・利活用によるソフトウェア自動進化の促進
通过构建和利用大规模进化语料库促进软件自动进化
- 批准号:
23K24823 - 财政年份:2024
- 资助金额:
$ 1.28万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
発話行為機能タグ付きコーパスおよびコーパス連動型オンライン学習サイトの構築
构建具有言语行为功能标签的语料库和语料库链接的在线学习网站
- 批准号:
24K03956 - 财政年份:2024
- 资助金额:
$ 1.28万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
日本語学習者コーパスの拡充およびコーパスを活用した習得研究
日语学习者语料库的扩展以及利用该语料库的习得研究
- 批准号:
24K03976 - 财政年份:2024
- 资助金额:
$ 1.28万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
看護留学生等に必要な言語知識ー教科書コーパスと語彙テストに基づく研究・教材開発
留学生所需的语言知识等 - 基于教科书语料库和词汇测试的研究和教材开发
- 批准号:
24K03990 - 财政年份:2024
- 资助金额:
$ 1.28万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
合成メディアの大規模比較評価の最適化と主観比較評価コーパスの構築
合成媒体大规模对比评价优化及主观对比评价语料库构建
- 批准号:
24K20792 - 财政年份:2024
- 资助金额:
$ 1.28万 - 项目类别:
Grant-in-Aid for Early-Career Scientists
聴解コーパスの構築による日本語学習者の聴解困難点と推測技術の実証的研究
基于听力语料库的日语学习者听力理解困难及估计技术的实证研究
- 批准号:
23K21941 - 财政年份:2024
- 资助金额:
$ 1.28万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
「話題から始まる日本語教育」を支援する情報サイトの構築と話題別会話コーパスの拡充
构建支持“从主题开始的日语教育”的信息网站,扩大主题对话语料库
- 批准号:
23K21940 - 财政年份:2024
- 资助金额:
$ 1.28万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
ジェスチャー情報付きコーパスの構築と統語構造に対応するジェスチャーの解明
构建包含手势信息的语料库并阐明与句法结构相对应的手势
- 批准号:
24K16050 - 财政年份:2024
- 资助金额:
$ 1.28万 - 项目类别:
Grant-in-Aid for Early-Career Scientists
マルチモーダルな視点による日本語講義動画およびコーパスの開発
多模态视角下的日语讲座视频和语料库开发
- 批准号:
24K03981 - 财政年份:2024
- 资助金额:
$ 1.28万 - 项目类别:
Grant-in-Aid for Scientific Research (C)














{{item.name}}会员




