Extending knowledge graph structures through deep text understanding

通过深度文本理解扩展知识图结构

基本信息

  • 批准号:
    22K12044
  • 负责人:
  • 金额:
    $ 2.75万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
  • 财政年份:
    2022
  • 资助国家:
    日本
  • 起止时间:
    2022-04-01 至 2025-03-31
  • 项目状态:
    未结题

项目摘要

Wikipediaなどの知識蓄積型コンテンツからは構造的データが知識グラフとして抽出され,検索結果の分類や種々の知識処理に活用されている.知識グラフを充実させるためには,Wikipediaやツィート,文書から新たな知識を抽出して知識グラフを拡張することが必要であり,そのためにはウェブコンテンツの構造情報やテキスト情報を統合的に分析する必要がある.本研究では,(1)少量の訓練データのもとでの多ラベル文書分類タスク, (2)学習済み言語モデルを活用したキーフレーズ抽出・生成,(3)知識グラフの構造的拡張の3つのテーマについて,テキストおよびグラフ構造の深層分析に基づく新たな情報抽出手法を開発するのが目的である.本年度は,(1)については,訓練データを全く与えない,つまりzero-shotでありかつラベル名のテキストのみと,ラベルのない文書集合のみが与えられているという厳しい条件であるclass name only classificationという問題に取り組んだ.ここでは多クラス分類問題について検討している.クラス名から連想される関連語を,prompt tuningと呼ばれる手法で予測し,これらの関連語を用いてラベルなし文書に疑似ラベルを与え,分類器をself trainingする手法により,従来手法を上回る精度を示すことができた.(2)のキーフレーズ抽出・生成は,訓練データなしの条件に対し,マスク言語モデルと生成型言語モデルの2つの手法を組み合わせた方法が有効であることを示した.(3)の知識グラフの構造的拡張は,Wikipediaのリストとカテゴリーがどのような意味的な型を持つ要素からなるかを判定する問題について,知識グラフの構造と言語モデルを組み合わせた手法の開発を行った.
The Wikipedia knowledge acquisition system has been used to extract information from the information system. The results show that there are several types of knowledge devices that can be used flexibly. The knowledge information system is full of information, and the Wikipedia information is not valid. The text is about how to extract the knowledge information. In this study, (1) a small amount of information is required to be classified into different categories, (2) to learn how to use the language to generate information, and (3) to learn how to use information to generate information. (3) knowledge and knowledge. This year, (1) in-depth analysis, in-depth analysis. This is a collection of documents. Please do not know what to do. Please do not know what to do. If you do not know how to do this, you will find that you have a problem. You may want to know the name of the problem. You may want to know the name of the file. You may want to know that the method is correct, and the prompt tuning will call you. You may want to use the code to help you. The classifier, self training, the gimmick, the gimmick, the accuracy, the accuracy Wikipedia is responsible for determining the key elements of a problem, and knowledge is required to make a decision on how to solve a problem.

项目成果

期刊论文数量(6)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Utilizing Keyphrase Generation and Semantic Similarity for Extreme Multi- Label Text Classification
利用关键短语生成和语义相似性进行极端多标签文本分类
  • DOI:
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Dai Xiangting;Mizuho Iwaihara
  • 通讯作者:
    Mizuho Iwaihara
Extractive Summarization Utilizing Keyphrases by Finetuning BERT-Based Model
通过微调基于 BERT 的模型,利用关键短语进行提取摘要
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Xiaoye Wang;Mizuho Iwaihara
  • 通讯作者:
    Mizuho Iwaihara
Unsupervised Keyphrase Generation by Utilizing Masked Words Prediction and Pseudo-label BART Finetuning
利用屏蔽词预测和伪标签 BART 微调来生成无监督关键词
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Xiaoye Wang;Mizuho Iwaihara;Yingchao Ju and Mizuho Iwaihara
  • 通讯作者:
    Yingchao Ju and Mizuho Iwaihara
Capsule Network Over Pre-Trained Language Model and User Writing Styles for Authorship Attribution on Short Texts
Mapping Wikipedia Categories and Lists to DBPedia Ontology Based on Structural and Semantic Features
基于结构和语义特征将 Wikipedia 类别和列表映射到 DBPedia 本体
  • DOI:
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Zhang Zhenyang;Wang Zhaoyi;Mizuho Iwaihara
  • 通讯作者:
    Mizuho Iwaihara
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

岩井原 瑞穂其他文献

学習によるXML文書のコンテンツベースフィルタリング
通过学习对 XML 文档进行基于内容的过滤
高等学校におけるSqueakを用いた課題解決型情報教育の実践と評価
利用Squeak解决问题的信息教育在高中的实施与评价
Discovering Action Rules that are Highly Achievable from Massive Data
从海量数据中发现高度可实现的行动规则
Ni-Nb-Zr系三元ガラス合金の過冷却液体状態での水素透過性
Ni-Nb-Zr三元玻璃合金过冷液态氢渗透率
  • DOI:
  • 发表时间:
    2005
  • 期刊:
  • 影响因子:
    0
  • 作者:
    藤岡 健史;高田 秀志;岩井原 瑞穂;福山透;Praprudee Piyaviriyakul・廣野育生・青木宙;中田崇平
  • 通讯作者:
    中田崇平
XML文書のアクセス制御におけるポリシー簡略化の定量的評価
XML文档访问控制策略简化的定量评估
  • DOI:
  • 发表时间:
    2005
  • 期刊:
  • 影响因子:
    0
  • 作者:
    王 波;チャットウィチェンチャイ ソムチャイ;岩井原 瑞穂
  • 通讯作者:
    岩井原 瑞穂

岩井原 瑞穂的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('岩井原 瑞穂', 18)}}的其他基金

情報流通におけるアクセス制御ルールを考慮したXML文書の変換
信息分发中考虑访问控制规则的XML文档转换
  • 批准号:
    16650018
  • 财政年份:
    2004
  • 资助金额:
    $ 2.75万
  • 项目类别:
    Grant-in-Aid for Exploratory Research
動的制約代数に基づく高機能電子商取引データベース
基于动态约束代数的高性能电子商务数据库
  • 批准号:
    13780246
  • 财政年份:
    2001
  • 资助金额:
    $ 2.75万
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)
動的・対話的データベースビューの研究
动态交互数据库视图研究
  • 批准号:
    11780231
  • 财政年份:
    1999
  • 资助金额:
    $ 2.75万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
プログラム・スライシングに基づくハードウェア設計記述支援環境
基于程序切片的硬件设计描述支撑环境
  • 批准号:
    09780294
  • 财政年份:
    1997
  • 资助金额:
    $ 2.75万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
ハードウェア記述言語におけるプログラム・スライシングの研究
硬件描述语言中的程序切片研究
  • 批准号:
    08780294
  • 财政年份:
    1996
  • 资助金额:
    $ 2.75万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
演繹オブジェクト指向データベースのための記憶効率のよいデータ構造
用于演绎面向对象数据库的存储高效数据结构
  • 批准号:
    07780280
  • 财政年份:
    1995
  • 资助金额:
    $ 2.75万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)

相似海外基金

新開発「RIKEN-LMS」で挑む南極深層アイスコアからの天文情報抽出
使用新开发的“RIKEN-LMS”从南极洲深层冰芯提取天文信息
  • 批准号:
    24H00255
  • 财政年份:
    2024
  • 资助金额:
    $ 2.75万
  • 项目类别:
    Grant-in-Aid for Scientific Research (A)
コストセンシティブ論文メタ情報抽出器とサイバーフィジカル論文ブラウザの開発
开发成本敏感的纸张元信息提取器和网络物理纸张浏览器
  • 批准号:
    23K25158
  • 财政年份:
    2024
  • 资助金额:
    $ 2.75万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
SIEPH: Safe Information Extraction from Patient Histories
SIEPH:从患者病史中安全提取信息
  • 批准号:
    EP/X018237/1
  • 财政年份:
    2023
  • 资助金额:
    $ 2.75万
  • 项目类别:
    Research Grant
多様性・被覆性等を考慮した代表解集合を求める情報抽出機構に関する研究
考虑多样性、覆盖度等因素获取代表性解集的信息提取机制研究
  • 批准号:
    23K11115
  • 财政年份:
    2023
  • 资助金额:
    $ 2.75万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
進化情報と塩基エディターによる酵素大規模ライブラリーの作製と活性機能情報抽出
使用进化信息和碱基编辑器创建大规模酶库并提取活性功能信息
  • 批准号:
    23KK0269
  • 财政年份:
    2023
  • 资助金额:
    $ 2.75万
  • 项目类别:
    Fund for the Promotion of Joint International Research (Fostering Joint International Research)
CAREER: Achieving Quality Information Extraction from Scientific Documents with Heterogeneous Weak Supervisions
职业:通过异构弱监督实现科学文档中的质量信息提取
  • 批准号:
    2237831
  • 财政年份:
    2023
  • 资助金额:
    $ 2.75万
  • 项目类别:
    Standard Grant
Speaking Webspeak: Maximising Information Extraction From Online Language Use, for Better Interpretation and Responses in Creative Systems
说网络语言:最大限度地从在线语言使用中提取信息,以更好地解释和响应创意系统
  • 批准号:
    2872640
  • 财政年份:
    2023
  • 资助金额:
    $ 2.75万
  • 项目类别:
    Studentship
Information extraction accumulating graph-formed knowledge with deep learning
通过深度学习积累图形化知识的信息提取
  • 批准号:
    22KJ2983
  • 财政年份:
    2023
  • 资助金额:
    $ 2.75万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
人と計算機との対話による情報抽出ノウハウの学習支援システム
通过人与计算机对话进行信息提取技术的学习支持系统
  • 批准号:
    22K18010
  • 财政年份:
    2022
  • 资助金额:
    $ 2.75万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
CAREER: Information Extraction and Integration with Applications to Healthcare Question Answering
职业:信息提取和与医疗保健问答应用程序的集成
  • 批准号:
    2145202
  • 财政年份:
    2022
  • 资助金额:
    $ 2.75万
  • 项目类别:
    Continuing Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了