大規模電子化文書からの因果関係知識の自動獲得-接続標識に依存しない手法の検討-

从大规模电子文档中自动获取因果关系知识 - 不依赖于连接标记的方法的检验 -

基本信息

  • 批准号:
    05J72904
  • 负责人:
  • 金额:
    $ 0.7万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
  • 财政年份:
    2005
  • 资助国家:
    日本
  • 起止时间:
    2005 至 无数据
  • 项目状态:
    已结题

项目摘要

本研究では,大規模な電子化文書集合から因果関係知識を自動的に獲得する方法論を開発した.因果関係知識獲得の従来研究では,接続標識(「ため」や「ので」)などの手掛かり語句の存在を仮定していた.そのため,大量に存在する電子化文書データを部分的にしか利用できず,獲得できる知識の被覆率が低いという問題があった.本研究では,大量に存在する電子化文書を効果的に利用できるような,接続標識の存在を仮定しない因果関係知識の自動獲得の方法論を開発,およびそのための基礎的なデータ分析を行うことを目的とした.まず,一定量の日本語文書集合を対象として,人手で因果関係情報を注釈付け,因果関係タグ付きコーパスを作成した.そして,コーパスに付与された情報を元に,文書内での因果関係の出現特性を定量的に調査した.その結果,実世界において因果関係をもつ2つの出来事対は,文書内で共起して出現しやすいことを確認した.上記の調査結果を踏まえ,既存の確率的共起モデルに基づいて,任意の出来事対が因果関係にあるか否かを判定する確率的因果モデルを提案,構築した.提案モデルでは,大量の素の共起データ(因果関係をもつか否かが未知の共起出来事対)に加え,少量の教師信号(因果関係をもつか否かが既知の共起出来事対)の情報を混合することで,出来事対の因果性が学習される.これにより,手がかり語句をもたない共起データも有効に利用できる.新聞記事を実験データに用いた評価実験を実施した結果,提案モデルは,既存モデルより優れた性能を示すことを確認した.評価尺度の一つであるF-尺度(0から1の範囲の値をとる,値が大きいほど性能がよい)を用いて性能を評価したところ,簡単なベースラインモデルでは0.623,提案モデルでは0.678であった.具体的には,クラス変数,隠れ変数を取り込んだモデルが最もよい性能を示すことを確認した.
In this study, the computerized text of large-scale models is a collection of automatic learning methods of causality and knowledge. The causal knowledge is learned to study the problem, and then the title ("knowledge") is used to determine the existence of the sentence. In recent years, there are a large number of applications that exist in the software section of the electronic text system, which has led to a high level of knowledge about the low coverage rate of health problems. In this study, there are a large number of people who use the results of computer science and technology, and there is a correlation between causal knowledge and automatic acquisition of knowledge. in this study, there are a large number of information about the results of computer science. Please tell me that a certain amount of Japanese literature will be collected, and that the human cause and effect will be paid, and the result will be made. In the text, there is a quantitative analysis of the characteristics of the occurrence of the characteristics. The results show that the cause and effect of the world has occurred. In the text, it has been found that the cause and effect has been confirmed. In the last chapter, the results show that the existing assurance rate is not the same as that of the existing cause-and-effect rate, and that the causal error rate is not determined by the causal error rate. In the proposal, a large number of common causes (cause and effect), a small number of teaching signals (cause and effect, cause and effect, causality, causality, caus I don't know if I can make use of it. In the new record, please use the information system to apply the results, and propose to verify the results. The existing performance information will be displayed to confirm the performance. In terms of performance, performance The specific number of customers, the number of users, the number of users.

项目成果

期刊论文数量(1)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
文書内に現れる因果関係の出現特性調査
调查文档中出现的因果关系的外观特征
  • DOI:
  • 发表时间:
    2005
  • 期刊:
  • 影响因子:
    0
  • 作者:
    渋谷 岳造;小宮 剛;丸山 茂徳;乾孝司
  • 通讯作者:
    乾孝司
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

乾 孝司其他文献

テキストを対象とした評価情報の分析に関する研究動向
文本评价信息分析的研究动态
対話型意見収集システムの評価方法の検討
交互式意见收集系统评价方法的思考
隠れ変数モデルによる複数語表現の感情極性分類
使用隐变量模型进行多词表达的情感极性分类
スピンモデルによる単語の感情極性抽出
使用旋转模型提取单词的情感极性
空港計画における対話型意見収集システムの実装と課題
交互式意见收集系统在机场规划中的实施及问题

乾 孝司的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('乾 孝司', 18)}}的其他基金

メタ情報に頼らない高被覆旅行記ジオロケーション技術の開発
开发不依赖元信息的高覆盖游记地理定位技术
  • 批准号:
    21K12137
  • 财政年份:
    2021
  • 资助金额:
    $ 0.7万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)

相似海外基金

未観測交絡因子が存在する状況の下で因果関係を解明するための統計的感度分析法の開発
开发统计敏感性分析方法,以阐明存在未观察到的混杂因素时的因果关系
  • 批准号:
    24K14851
  • 财政年份:
    2024
  • 资助金额:
    $ 0.7万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
慢性ストレスによるBBBの脳バリア機能障害と脳内炎症の局在性の因果関係の解明
阐明慢性应激引起的BBB脑屏障功能障碍与脑部局部炎症之间的因果关系
  • 批准号:
    24K10711
  • 财政年份:
    2024
  • 资助金额:
    $ 0.7万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
FAM83H変異体の細胞内異所局在化とエナメル質形成不全症との因果関係解明研究
阐明FAM83H突变体细胞内异位定位与牙釉质发育不全之间因果关系的研究
  • 批准号:
    24K12893
  • 财政年份:
    2024
  • 资助金额:
    $ 0.7万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
脳動脈瘤の病態形成と病変部局所における交感神経支配との因果関係の解明
阐明脑动脉瘤发病机制与病变局部交感神经支配的因果关系
  • 批准号:
    24K19558
  • 财政年份:
    2024
  • 资助金额:
    $ 0.7万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
超大規模データから流体制御に有意な因果関係を導くデータ駆動科学的手法の構築
建立数据驱动的科学方法,从超大规模数据中得出流体控制中的重要因果关系
  • 批准号:
    24K17443
  • 财政年份:
    2024
  • 资助金额:
    $ 0.7万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
リネゾリドによる低ナトリウム血症発現の因果関係およびそのリスク因子の検討
利奈唑胺发生低钠血症的因果关系及危险因素探讨
  • 批准号:
    24H02631
  • 财政年份:
    2024
  • 资助金额:
    $ 0.7万
  • 项目类别:
    Grant-in-Aid for Encouragement of Scientists
シナプス前性の生物学的液相分離とシナプス機能の因果関係の解明
阐明突触前生物液相分离与突触功能的因果关系
  • 批准号:
    23K21348
  • 财政年份:
    2024
  • 资助金额:
    $ 0.7万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
私立大学の定員割れと経営破綻の因果関係を問い直す:時間変化する経営戦略の事例から
重新思考民办大学招生不足与企业失败的因果关系——以管理策略变迁为例
  • 批准号:
    24K16629
  • 财政年份:
    2024
  • 资助金额:
    $ 0.7万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
代数幾何の理論に基づいた力学系の変数間の因果関係についての数理科学的研究
基于代数几何理论的动力系统变量间因果关系的数学科学研究
  • 批准号:
    24K06874
  • 财政年份:
    2024
  • 资助金额:
    $ 0.7万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
術中、客観的皮膚血流計測と一次治癒の因果関係の解明
阐明客观皮肤血流量测量与手术期间初次愈合之间的因果关系
  • 批准号:
    24K19824
  • 财政年份:
    2024
  • 资助金额:
    $ 0.7万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了