データベースからの構造知識の抽出に関する研究

从数据库中提取结构知识的研究

基本信息

  • 批准号:
    04229225
  • 负责人:
  • 金额:
    $ 1.28万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
  • 财政年份:
    1992
  • 资助国家:
    日本
  • 起止时间:
    1992 至 无数据
  • 项目状态:
    已结题

项目摘要

本研究は、データベースの設計や構築に必要なデーターの論理構造をサンプルデータから抽出することを目的としている。本年度は、文書画像データからデータベースを構築する際に有効な文書のレイアウト構造の表現方式およびデータベース設計に有効な関数従属性性の学習方法に関する研究を行なった。文書画像データからのデータベース構築では、(1)画像を適切な論理単位に分割し、(2)各ブロックを分類し、(3)OCRを用いてテキスト領域をコード化し、(4)データベースの構造(スキーマ)に合わせてデータを構造化する必要がある。構造化処理では、データベースのスキーマと文書のレイアウトの構造をうまくすり合わせることが重要になる。そこで、本研究ではデータベースのスキーマと画像文書のレイアウト構造を同時に表現する方法である行列文法を考案した。行列文法は、正則文法を平面上に配置された終端記号列に対する規則を記述できるように拡張したものである。さらに分割、分類された文書画像を行列文法を用いて効率的に解析するためのアルゴリズムを示した。関数従属性は、関係データベースの最も基本的な従属性であり、関係データベース設計を始め、各種のデータベース処理を考察するうえで重要な役割を果たす。本研究では、PAC(Probably Approximately Correct)学習モデルを応用し、データベースデ近似的に成り立つ関数従属性をその部分データから学習する方法について検討した。本研究では、まず、学習アルゴリズムによって得られる関数従属性の近似度とサンプル数について考察した。そして、あるデータベースに対する関数従属性の誤差を、その関数従属性に反するタプルの数とデータベースに存在するタプルの総数との比とした場合、誤差ε以下の関数従属性を1-δ以上の確率で抽出するために必要なサンプル数は、高々(〔.SU.〕)となることを示した。
This study aims at designing and constructing the necessary logic structure of the data structure. This year, we will conduct research on the study methods of digital attributes related to the expression mode and design of document structure when constructing document image. Document image structure: (1) image division into appropriate logical units;(2) classification of each image;(3)OCR application;(4) structure of image; and (5) necessary for structure. The structural treatment is very important. This paper discusses the structure and grammar of the image. The syntax of rows and columns is arranged on the plane of the regular syntax. This is the first time that we've had a chance to divide, classify, or analyze a document. The most basic attributes of the relationship are the design of the relationship, the investigation of the processing of the relationship, and the results of the important tasks. In this study, PAC(Probably Approximately Correct) learning methods are discussed in detail. This study investigated the similarity of the relevant attributes and the number of clusters. For example, the error of the relevant number of attributes, the ratio of the total number of attributes, the error of the relevant number of attributes, the accuracy of the The first day of the month.

项目成果

期刊论文数量(6)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Atsuhiro Takasu: "A Syntactical Approach to the Database Construction Metlod form images" Proceedings of IAPR Workshop on Machine Vision Applications. 295-298 (1992)
Atsuhiro Takasu:“数据库构建方法形成图像的句法方法”IAPR 机器视觉应用研讨会论文集。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
Atsuhiro Takasu: "A Minimum Path Decompositoin of the Hasse Diagram fror Testing the Consistency of Functional Dependencies" IEICE Transaction on Information Systems. 2. 299-301 (1993)
Atsuhiro Takasu:“用于测试功能依赖性一致性的哈斯图的最小路径分解”IEICE 信息系统交易。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
Eishi Katsura: "Design Consideration for Capturing Electronic Library" Information Services and Use. 12. 99-112 (1992)
Eishi Katsura:“捕获电子图书馆的设计考虑”信息服务和使用。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
Tatsuya Akutsu: "On PAC Learnability of Functional Dependencies" Procedings of Workshop on Algovithmic Leatning Theory. 229-239 (1992)
Tatsuya Akutsu:“论 PAC 函数依赖的可学习性”算法学习理论研讨会论文集。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

高須 淳宏其他文献

学術論文からの構成要素抽出手法の改良
学术论文成分提取方法的改进
  • DOI:
  • 发表时间:
    2015
  • 期刊:
  • 影响因子:
    0
  • 作者:
    樫本 達矢;太田 学;高須 淳宏
  • 通讯作者:
    高須 淳宏
CRFによる様々な種類の学術論文からの参考文献文字列の自動抽出
使用CRF从各类学术论文中自动提取参考文献字符串
  • DOI:
  • 发表时间:
    2015
  • 期刊:
  • 影响因子:
    0
  • 作者:
    赤澤 琢朗;太田 学;高須 淳宏;安達 淳
  • 通讯作者:
    安達 淳
CRFによる学術論文からの参考文献文字列の抽出
使用 CRF 从学术论文中提取参考字符串
  • DOI:
  • 发表时间:
    2014
  • 期刊:
  • 影响因子:
    0
  • 作者:
    石本 茜;太田 学;高須 淳宏;安達 淳
  • 通讯作者:
    安達 淳
クラウド時代の新しい音声研究パラダイム
云时代语音研究新范式
  • DOI:
  • 发表时间:
    2012
  • 期刊:
  • 影响因子:
    0
  • 作者:
    石本 茜;太田 学;高須 淳宏;安達 淳;渡邉英徳,佐藤康満;秋葉友良,岩野公司,緒方淳,小川哲司,小野順貴,篠崎隆宏,篠田浩一,南條浩輝,西崎博光,西田昌史,西村竜一,原 直,堀 貴明
  • 通讯作者:
    秋葉友良,岩野公司,緒方淳,小川哲司,小野順貴,篠崎隆宏,篠田浩一,南條浩輝,西崎博光,西田昌史,西村竜一,原 直,堀 貴明
文献種類別に分類した参考文献文字列からの書誌情報抽出の一手法
一种从按文献类型分类的参考文献字符串中提取书目信息的方法
  • DOI:
  • 发表时间:
    2013
  • 期刊:
  • 影响因子:
    0
  • 作者:
    川上 尚慶;荒内 大貴;太田 学;高須 淳宏;安達 淳
  • 通讯作者:
    安達 淳

高須 淳宏的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('高須 淳宏', 18)}}的其他基金

Malicious entity detection using fine-grained DNA-inspired behavioural modelling
使用细粒度 DNA 启发的行为模型进行恶意实体检测
  • 批准号:
    21F20785
  • 财政年份:
    2021
  • 资助金额:
    $ 1.28万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
精度制御型情報統合モデルの研究
精度控制型信息集成模型研究
  • 批准号:
    19650021
  • 财政年份:
    2007
  • 资助金额:
    $ 1.28万
  • 项目类别:
    Grant-in-Aid for Exploratory Research
漆工芸に関する電子辞書の協調作成支援法の研究
漆艺相关电子词典协同创作支持方法研究
  • 批准号:
    16018225
  • 财政年份:
    2004
  • 资助金额:
    $ 1.28万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
分散情報資源の統合的利用のための確率的照合機構に関する研究
分布式信息资源综合利用的概率匹配机制研究
  • 批准号:
    09230220
  • 财政年份:
    1997
  • 资助金额:
    $ 1.28万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
分散マルチメディア電子図書館のための高機能データベースシステムの研究開発
分布式多媒体电子图书馆高性能数据库系统的研究与开发
  • 批准号:
    08244213
  • 财政年份:
    1996
  • 资助金额:
    $ 1.28万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
データベースの属性間関係に関する学習の効率化
提高学习数据库属性之间关系的效率
  • 批准号:
    06780345
  • 财政年份:
    1994
  • 资助金额:
    $ 1.28万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
データベースからの構造知識の抽出
从数据库中提取结构知识
  • 批准号:
    05213224
  • 财政年份:
    1993
  • 资助金额:
    $ 1.28万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas

相似海外基金

SHINE: The Evolution of Coronal Dimmings and Their Relationship to Eruptive Phenomena
闪耀:日冕变暗的演变及其与喷发现象的关系
  • 批准号:
    2400789
  • 财政年份:
    2025
  • 资助金额:
    $ 1.28万
  • 项目类别:
    Continuing Grant
Collaborative Research: URoL:ASC: Determining the relationship between genes and ecosystem processes to improve biogeochemical models for nutrient management
合作研究:URoL:ASC:确定基因与生态系统过程之间的关系,以改进营养管理的生物地球化学模型
  • 批准号:
    2319123
  • 财政年份:
    2024
  • 资助金额:
    $ 1.28万
  • 项目类别:
    Standard Grant
Exploration of relationship between floods, poverty, and dynamic environmental sustainability
探索洪水、贫困和动态环境可持续性之间的关系
  • 批准号:
    24K07692
  • 财政年份:
    2024
  • 资助金额:
    $ 1.28万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
CAREER: Multiscale Reduced Order Modeling and Design to Elucidate the Microstructure-Property-Performance Relationship of Hybrid Composite Materials
职业:通过多尺度降阶建模和设计来阐明混合复合材料的微观结构-性能-性能关系
  • 批准号:
    2341000
  • 财政年份:
    2024
  • 资助金额:
    $ 1.28万
  • 项目类别:
    Standard Grant
The costs and benefits of an empty nest: A longitudinal study of couples' relationship functioning when children leave the home
空巢的成本和收益:对孩子离开家时夫妻关系运作的纵向研究
  • 批准号:
    2336235
  • 财政年份:
    2024
  • 资助金额:
    $ 1.28万
  • 项目类别:
    Continuing Grant
Environmental, Social, Governance (ESG), Family Firm Structure and Main Bank Relationship: Evidences from Japan
环境、社会、治理(ESG)、家族企业结构和主要银行关系:来自日本的证据
  • 批准号:
    24K04937
  • 财政年份:
    2024
  • 资助金额:
    $ 1.28万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Narrating War in Meiji Japan: Investigating the relationship between journalism and literature via the writing of dispatched war reporters
叙述日本明治战争:从派遣战地记者的写作探寻新闻与文学的关系
  • 批准号:
    24K15983
  • 财政年份:
    2024
  • 资助金额:
    $ 1.28万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
CAREER: Elucidating the Impact of Side-Chain Topology on the Structure-Property Relationship in Bottlebrush Polymers
职业:阐明侧链拓扑对洗瓶刷聚合物结构-性能关系的影响
  • 批准号:
    2340664
  • 财政年份:
    2024
  • 资助金额:
    $ 1.28万
  • 项目类别:
    Continuing Grant
A Longitudinal Study of the Relationship between Participation in a Comprehensive Exercise Program and Academic Achievement
参加综合锻炼计划与学业成绩之间关系的纵向研究
  • 批准号:
    24K14615
  • 财政年份:
    2024
  • 资助金额:
    $ 1.28万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Applying a complex systems perspective to investigate the relationship between choreography and agent-based modeling as tools for scientific sense-making
应用复杂系统的视角来研究编排和基于代理的建模之间的关系,作为科学意义构建的工具
  • 批准号:
    2418539
  • 财政年份:
    2024
  • 资助金额:
    $ 1.28万
  • 项目类别:
    Continuing Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了