ウェブを情報源とした用語辞典の自動編集

使用网络作为信息源自动编辑术语表

基本信息

  • 批准号:
    13224055
  • 负责人:
  • 金额:
    --
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas (C)
  • 财政年份:
    2001
  • 资助国家:
    日本
  • 起止时间:
    2001 至 无数据
  • 项目状态:
    已结题

项目摘要

本年度は、主に、ウェブから関連用語を収集する方法を中心に研究を行なった。`まず、2つの用語間の関係として、10種類(同義、類似・対比、上位概念、下位概念、全体、部分、並列、用途・環境、因果、複合語)の関係を設定した。次に、テキスト中からこれらの関係にある用語対を抽出するために、10種類の関係それぞれに対して、その関係を示唆する典型的な文型を調査・整理した。これらの文型と文とを照合して、上記の関係にある用語対を自動抽出することを実現するために、構文テンプレートと呼ぶ文型の記述法を定義し、これと構文解析した文とを比較する照合器(パターンマッチャー)を作成した。関連用語を収集アルゴリズムとして、次のようなブートストラップ型のアルゴリズムを実装した。(1)初期用語集合Gを与える。(2)Gの中の用語が少なくとも1語存在するような文をウェブから収集する。(3)上記の構文テンプレートを用いて、関連用語を抽出する。(4)得られた新しい語の中から一般的な語を除去したものを用語集合Gに追加する。(5)(2)以下を繰り返す。上記の方法による関連用語収集を「生物学」の領域を対象に実験を行なった。10個の用語を初期用語集合とし、上記のループを2回実行した結果、128語の新しい用語が収集され、そのうち、97語(76%)が適切な関連用語であった。一旦、不適切な用語が用語集合に混入すると、その影響が次回のループで拡大して精度が下がるため、今後、この点を改善する必要がある。
This year's main topic is related to the collection of related terms, the method of collection, the center of research, and the conduct of research. `まず, 2つのrelations between terms, 10 types of relationships (synonyms, similarities, comparisons, superordinate concepts, inferior concepts, whole, part, parallel, usage, environment, cause and effect, compound terms). Time, テキスト中からこれらのrelations, にあるTerms, 対をdraw, 10 typesの情それぞれに対して, その Relationship をshows するTypical な文style をinvestigation and arrangement した.これらの文TYPEと文とを光合して、上记の Relationship にある语対をautomatically extract することを実appear するために、construct 文テンプレートれと文Typeのnarrative methodをDefinitionし、これとstructure analysisした文とをComparisonするphotographed combination device (パターンマッチャー)を成した. Related terms: をCollection アルゴリズムとして, 时のようなブートストラップtype のアルゴリズムを実装した. (1) The initial term set Gを and える. (2)Gの中の语が小なくとも1语existent するような文をウェブからCollect する. (3) The above-mentioned composition text "テンプレートを用いて" and related words "する". (4) Get られた新しい语の中からGeneral な语を Remove したものをTerm set GにAdd する. (5) (2) The following is a return. The method mentioned above is a collection of related terms in the field of "biology". A collection of 10 idioms in the initial stage, the results of the 2 chapters of the above mentioned idioms, and the 128 idioms The collection of new phrases, され, そのうち, and 97 idioms (76%) are appropriate and related idioms. Once the inappropriate terminology is collected, it will be mixed into it, and the impact will be affected again and again.

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

佐藤 理史其他文献

再帰反射による空中結像(AIRR)の原理と応用
逆反射航空成像(AIRR)的原理和应用
  • DOI:
  • 发表时间:
    2017
  • 期刊:
  • 影响因子:
    0
  • 作者:
    加納 隼人;佐藤 理史;松崎 拓也;山本 裕紹
  • 通讯作者:
    山本 裕紹
日本語の文の平均像を体現した文を探す (1) 文の特徴量の抽出
搜索体现日语句子平均形象的句子(1)提取句子特征
  • DOI:
  • 发表时间:
    2014
  • 期刊:
  • 影响因子:
    0
  • 作者:
    刀山 将大;佐藤 理史;近藤 秀;吉田 達平
  • 通讯作者:
    吉田 達平
エンタメ小説における会話文の発話意図分析 ―発話文表現文型辞書の改良に向けてー
娱乐小说会话句的言语意图分析——面向言语表达模式词典的改进——
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    夏目 和子;佐藤 理史
  • 通讯作者:
    佐藤 理史
ダイレクト広告コピー文の分析と自動生成
直接广告文案分析及自动生成
  • DOI:
  • 发表时间:
    2019
  • 期刊:
  • 影响因子:
    0
  • 作者:
    平良 裕汰朗;佐藤 理史;宮田 玲;今頭 伸嘉
  • 通讯作者:
    今頭 伸嘉
物語プロットデータベースのためのデータ構造の検討
叙事情节数据库数据结构的思考
  • DOI:
  • 发表时间:
    2013
  • 期刊:
  • 影响因子:
    0
  • 作者:
    松原 仁;佐藤 理史;赤石 美奈;角 薫;迎山 和司;中島 秀之;瀬名 秀明;村井源;大塚 裕子;村井源
  • 通讯作者:
    村井源

佐藤 理史的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('佐藤 理史', 18)}}的其他基金

テキストを実行可能なプログラムに変換するための基本技術の探究
探索将文本转换为可执行程序的基本技术
  • 批准号:
    22K19811
  • 财政年份:
    2022
  • 资助金额:
    --
  • 项目类别:
    Grant-in-Aid for Challenging Research (Exploratory)
話者の特徴や個性を感じさせる発話文の生成機構
一种生成话语的机制,可以让人了解说话者的特征和个性
  • 批准号:
    21H03497
  • 财政年份:
    2021
  • 资助金额:
    --
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
オンラインニュース見出しの言語構造および情報構造の解明
阐明在线新闻标题的语言和信息结构
  • 批准号:
    18650032
  • 财政年份:
    2006
  • 资助金额:
    --
  • 项目类别:
    Grant-in-Aid for Exploratory Research
実世界の関連性を投影した語彙空間の構築
建立反映现实世界关系的词汇空间
  • 批准号:
    16016249
  • 财政年份:
    2004
  • 资助金额:
    --
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
内部構造に着目した連想の分類と機械的実現法
注重内部结构的关联分类与机械实现
  • 批准号:
    15650026
  • 财政年份:
    2003
  • 资助金额:
    --
  • 项目类别:
    Grant-in-Aid for Exploratory Research
ウェブを情報源とした用語辞典の自動編集
使用网络作为信息源自动编辑术语表
  • 批准号:
    14019050
  • 财政年份:
    2002
  • 资助金额:
    --
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
ワールドワイドウェブからの用語説明の自動抽出
从万维网上自动提取术语描述
  • 批准号:
    12878058
  • 财政年份:
    2000
  • 资助金额:
    --
  • 项目类别:
    Grant-in-Aid for Exploratory Research
論文表題の一般化による科学技術論文の階層的詳細分類
通过概括论文标题对科技论文进行层次化详细分类
  • 批准号:
    10878060
  • 财政年份:
    1998
  • 资助金额:
    --
  • 项目类别:
    Grant-in-Aid for Exploratory Research
対話からの知識獲得に関する研究
对话知识获取研究
  • 批准号:
    07221208
  • 财政年份:
    1995
  • 资助金额:
    --
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
情報のダイジェスティングに関する研究
信息消化研究
  • 批准号:
    07680389
  • 财政年份:
    1995
  • 资助金额:
    --
  • 项目类别:
    Grant-in-Aid for General Scientific Research (C)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了