テキスト情報からの固有名詞間の関係の自動抽出の研究
从文本信息中自动提取专有名词关系的研究
基本信息
- 批准号:10680379
- 负责人:
- 金额:$ 1.86万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Scientific Research (C)
- 财政年份:1998
- 资助国家:日本
- 起止时间:1998 至 1999
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
第一に、テキスト情報の特異な部分を抽出するアルゴリズムを明らかにした。プログラムでは同じようなパターンの繰り返しが多い.したがって,プログラム中に一定回数以上現れる,一定長さ以上の文字列を取り出すと,プログラムのほとんどの部分を取り出すことができる.取り出せた部分は複数回現れていることから,プログラムとして意味がある部分であるといえる.一方,取り出せない部分はプログラム中の特異な部分であると考えられる.我々はプログラムの誤り等が取り出せない部分に含まれるのではないかと考え,この部分にマークをつけるツールを作成した.本稿では特異部分を検出するアルゴリズムを説明し,コンパイラの検出できない誤りの発見に,付与されたマークが役に立つことを示した.次に、新聞記事というテキスト情報から、補完類似度による情報の抽出方法を示した.補完類似度とは,パターン認識の分野で用いられる類似の尺度関数である,新聞記事にはあらゆる品詞の語が出現するが,ある範囲の語に関する情報に注目すれば良いと考えた,そこで,固有名詞に着目し,さらに限定して地名に着目した.そして,着目した地名の階層関係を補完類似度を用いて取得することを試みた.その結果,補完類似度を用いて取得した階層関係の適合率が相互情報量を用いて取得した階層関係よりも高かったことが判明した.最後に抽出された規則を活用する目的で、SOL導出を用いたデータマイニングの一つの方法を示した.SOL導出は,特徴節発見問題を完全に解くことができる導出手続きである.データマイニングは,データベースから知識を発見する工程である.この問題に論理的な推論システムであるSOL導出のデータマイニングへの適用を行なった.そして有用度という観点で得られた結果を選別できることを示した。
First, it is clear that the unique part of the instant information can be extracted from the various databases. The most common way to change the situation is to change the way you look at it. A text string with more than a certain number of turns in the list is selected from the list, and a text string with more than a certain length is selected from the list. Take out the part of the plural return to the meaning of the part of the plural return. A party, take out the part of the party. I'm not going to make a mistake. I'm going to make a mistake. This article describes the special part of the search, the search, the error, and the service. Next, the news notes, the information, the completion of similarity, the information extraction method is shown. The similarity degree is different from that of other words. To complete the similarity, the hierarchical relationship of the place name is obtained. The result is that the similarity is obtained by using the appropriate ratio of the hierarchical relationship. Finally, SOL derivation is used to solve the problem of characteristic node discovery completely. The project of knowledge development is very important. The logic of this problem is derived from SOL. The result of the test is that the test is not effective.
项目成果
期刊论文数量(3)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
山本英子・梅村恭司: "データマイニング" 共立出版, 196 (1998)
Eiko Yamamoto 和 Kyoji Umemura:“数据挖掘”Kyoritsu Shuppan,196 (1998)
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
吉川裕之・貴島寿郎・梅村恭司: "n-gram解析手法を応用したプログラム中の欠損の検出" 情報処理学会論文誌. 39-12. 3294-3303 (1998)
Hiroyuki Yoshikawa、Toshiro Kishima 和 Kyoji Umemura:“使用 n 元语法分析方法检测程序中的缺陷”,日本信息处理学会汇刊 39-12 (1998)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
山本英子・梅村恭司: "Knowledge Discovery by Logical Resolution with Measure." Proc.of Foundations of Data Organization. 5. 89-96 (1998)
Eiko Yamamoto 和 Kyoji Umemura:“通过测量的逻辑解析来发现知识”,《数据组织基础》Proc。5. 89-96 (1998)
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
梅村 恭司其他文献
Geo-location Estimation of Tweets with Stop Words Detection
通过停用词检测对推文进行地理位置估计
- DOI:
- 发表时间:
2015 - 期刊:
- 影响因子:0
- 作者:
森國 泰平;吉田 光男;岡部 正幸;梅村 恭司 - 通讯作者:
梅村 恭司
梅村 恭司的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}