既存の電子化辞書と新聞記事コーパスを用いた並列知識獲得法の研究
利用现有电子词典和报纸文章语料库的并行知识获取方法研究
基本信息
- 批准号:07780336
- 负责人:
- 金额:$ 0.58万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Encouragement of Young Scientists (A)
- 财政年份:1995
- 资助国家:日本
- 起止时间:1995 至 无数据
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
本年度は、次のことを行った。1.新聞記事コーパスと大規模な概念辞書を利用した単語の類似度計算法の開発2.上記手法を用いた格フレーム獲得システムの開発3.既存の格フレームを利用した格フレーム要素獲得システムの開発4.獲得した格フレームを評価するための並列構文解析システムの開発昨年度から続けている単語の類似度計算法についての改良と、それを利用した格フレーム獲得法の提案、ならびに、そのシステム開発を行った。この手法は、新聞記事などの電子化された文書データから、単文の集合を抽出し、それから文の類似度を計算し、ある閾値を超えて類似していると判定された文を、同じ集合に入れて分類する。そして、その集合を代表する構造を、格フレームとするものである。ある文1と文2の類似性を計算するために、それぞれの文中の対応する格要素間の類似度を概念辞書とコーパスから獲得したデータを利用して計算するが、この時、20万文以上の規模を持つ品詞や概念識別などが人手で付けられたEDRコーパスと、多数の人間が開発に関わって作成された40万概念以上の規模を持つEDR概念辞書を利用した。しかし、この規模でさえ、実際の解析において利用した文の解析に必要となる知識をカバーできず、それゆえ、解析精度が50〜60%程度にしかならないことが分かった。特に、慣用表現や抽象的な表現に対して解析が失敗する傾向があり、これらを知識に表すことの難しさからあらためて認識できた。上記の手法で利用した単文は、格要素が名詞単体+助詞の構造を持つもので、かつ、動詞が文の最後に来るもの(つまり、動詞が支配する格要素への連体修飾などを含まない文)であり、また、同じ名詞を含まないものに限っていたため、実際の文章中から抽出できる実験に使用する単文は、基となる文章の量に比べて非常に少なくなった。そのため、現在、格要素が複合名詞や、文や句を含む形のものや、連体修飾形を含む形、受身や使役形を扱って単文を抽出するシステムを開発するとともに、獲得した単文から、意味ネットワークを自動構成する方法も同時に開発している。
This year, the second time, the third time. 1. Development of Similarity Calculation Method for Single Language Using Large-scale Concept Dictionary 2. Development of Similarity Calculation Method for Single Language Using Top-down Method 3. Development of Similarity Calculation Method for Single Language Using Existing Framework 3. Development of Similarity Calculation Method for Single Language Using Existing Framework 3. Development of Similarity Calculation Method for Single Language Using Existing Framework 4. Development of Similarity Calculation Method for Single Language Using Existing Framework 3. Development of Similarity Calculation Method for Single Language Using Existing Framework 3. Development of Similarity Calculation Method for Single Language Using Existing Framework 3. Development of Similarity Calculation Method for Single Language Using Existing Framework 4. Development of Similarity Calculation Method for Single Language Using Existing Framework 3. Development of Similarity Calculation Method for Single Language Using Existing Framework 3. Development of Similarity Calculation Method for Single Language Using Existing Framework 3. Development of Similarity Calculation Method for Single Language Using Existing Framework 3. Development of Similarity Calculation Method for Single Language Using Existing Framework 4. Development Method for Single Language Evaluation 5. Development Method for Single Language Analysis of Similarity Calculation Method for Single Language Analysis The system is designed to be used to obtain legal proposals, documents and documents. The method is to extract, calculate, and determine the similarity of the text and the set of text in the electronic version of the news. The structure of the system is The similarity between the elements of the text and the text is calculated. The similarity between the elements of the concept of the text is calculated. The similarity between the elements of the text is calculated. The similarity The analysis accuracy is 50 ~ 60%. Special, idiomatic performance and analysis of the tendency to failure, such as knowledge and understanding In the above note, the use of simple text, case elements, noun unit + auxiliary word structure, such as holding,, verb, text, the last to come,(, verb, control, case elements, conjunctive modifiers, including text),, noun, the same to include, the limit, the actual article, the use of simple text, the number of articles is very small than. In addition, the method of automatic formation of noun, sentence and sentence is also developed.
项目成果
期刊论文数量(4)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
T.Mine: "A Case Frame Acquisition Method with Electronic Dictionaries" RWC Technical Report(TR-95001). 1. 39-40 (1995)
T.Mine:“一种带有电子词典的案例框架采集方法”RWC技术报告(TR-95001)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
実成他: "動詞の格フレーム要素の自動獲得法" 情報処理学会九州支部研究集会論文集. 1-10 (1995)
Jitsunari等:“动词格框架要素的自动获取方法”日本信息处理学会九州分会研究会议论文集1-10(1995)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
峯他: "動詞語義の分類法" EDR電子化辞書利用シンポジウム論文集. 1. 89-96 (1995)
Mine 等人:“动词含义分类”EDR 电子词典利用研讨会论文集 1. 89-96 (1995)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
中山他: "EDRコーパスを利用した動詞の語義分類" 電子情報通信学会「言語理解とコミュニケーション研究会」研究報告. 95-321. 23-30 (1995)
Nakayama 等人:“使用 EDR 语料库进行动词语义分类”IEICE“语言理解和交流研究组”研究报告 95-321(1995)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
峯 恒憲其他文献
立ち直り支援をめぐる二つの隘路と矯正施設のリフレクティング
围绕康复支持和惩教设施反思的两个瓶颈
- DOI:
- 发表时间:
2022 - 期刊:
- 影响因子:0
- 作者:
小西宏樹;川谷卓哉;峯 恒憲;石原孝二;矢原隆行 - 通讯作者:
矢原隆行
Rubric-based Automated Japanese Short-answer Scoring and Support System Applied to QALab-3
基于Rubric的自动日语简答评分和支持系统应用于QALab-3
- DOI:
- 发表时间:
2017 - 期刊:
- 影响因子:0
- 作者:
長井 孝幸;新谷 一朗;峯 恒憲;Tsunenori Ishioka and Kohei Yamaguchi and Tsunenori Mine - 通讯作者:
Tsunenori Ishioka and Kohei Yamaguchi and Tsunenori Mine
機械学習モデル構築のためのデータ・処理共有フレームワークの提案,
提出用于构建机器学习模型的数据/处理共享框架,
- DOI:
- 发表时间:
2021 - 期刊:
- 影响因子:0
- 作者:
小西宏樹;川谷卓哉;峯 恒憲 - 通讯作者:
峯 恒憲
マルチエージェントシステムのための基盤ネットワーク構成手法
多Agent系统的基本网络配置方法
- DOI:
- 发表时间:
2007 - 期刊:
- 影响因子:0
- 作者:
木村 功作;雨宮 聡史;峯 恒憲;雨宮 真人 - 通讯作者:
雨宮 真人
路線バスプローブデータ解析によるバス遅延状況の調査と遅延要因の検討,
通过公交车探针数据分析调查公交车延误状况并研究延误原因,
- DOI:
- 发表时间:
2021 - 期刊:
- 影响因子:0
- 作者:
川谷 卓哉;峯 恒憲 - 通讯作者:
峯 恒憲
峯 恒憲的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('峯 恒憲', 18)}}的其他基金
定性的・定量的学習記録の組合わせ分析に基づく学習特性改善に関する研究
基于定性和定量学习记录结合分析的学习特征改善研究
- 批准号:
23K20734 - 财政年份:2024
- 资助金额:
$ 0.58万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
大規模な人の位置情報とSNS情報に基づく地域イベント特定に向けたオントロジ―学習
基于大规模人物位置信息和SNS信息的局部事件识别的本体学习
- 批准号:
22KF0288 - 财政年份:2023
- 资助金额:
$ 0.58万 - 项目类别:
Grant-in-Aid for JSPS Fellows
定性的・定量的学習記録の組合わせ分析に基づく学習特性改善に関する研究
基于定性和定量学习记录结合分析的学习特征改善研究
- 批准号:
21H00907 - 财政年份:2021
- 资助金额:
$ 0.58万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
電子メールでの質問・感想メッセージに対する自動応答システムに関する研究
通过电子邮件发送的问题和感想自动回复系统的研究
- 批准号:
13780291 - 财政年份:2001
- 资助金额:
$ 0.58万 - 项目类别:
Grant-in-Aid for Young Scientists (B)
対話知識の共有・再利用化を考慮した日本語質問応答システムに関する研究
考虑对话知识共享与重用的日语问答系统研究
- 批准号:
11780281 - 财政年份:1999
- 资助金额:
$ 0.58万 - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (A)
文書検索機能を持つ日本語質問応答システムの開発に関する研究
具有文档搜索功能的日语问答系统的开发研究
- 批准号:
09780347 - 财政年份:1997
- 资助金额:
$ 0.58万 - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (A)
格情報を利用した並列意味解析法に関する研究
利用案例信息的并行语义分析研究
- 批准号:
06780329 - 财政年份:1994
- 资助金额:
$ 0.58万 - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (A)














{{item.name}}会员




