図とテキストの協調的構造解析に基づく文書画像からのハイパーメディア構造の抽出

基于图文协同结构分析的文档图像超媒体结构提取

基本信息

  • 批准号:
    06780357
  • 负责人:
  • 金额:
    $ 0.58万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
  • 财政年份:
    1994
  • 资助国家:
    日本
  • 起止时间:
    1994 至 无数据
  • 项目状态:
    已结题

项目摘要

1.参照形態の分析・分類文書のテキストから図,表,写真,テキストへの参照の形態を分析した。その結果,参照形態は,(1)直接的参照,(2)順序による参照,(3)配置による参照,(4)文脈による参照,(5)近接による参照の5種類に分類できること,またこれらを組み合わせた参照もあることが分かった。2.複数頁を対象とした文書画像理解システムの構築技術論文のハイパーメディア化には,技術論文の全頁を対象とする処理が必要である。このとき,図,表など頁内の位置が不定なものの分離抽出法,文書の全頁を対象とした論理構造の抽出法が問題となる。本研究では,(1)文学認識の結果を用いて図表のキャプションを抽出した後,キャプションの位置を手がかりに図表の本体を抽出する手法,(2)全頁に含まれる文字列を読み順にソ-トし,その結果を構文解析して論理構造を抽出する手法を開発した。また,これらの2手法に基づいて,技術論文の全頁を処理可能な文書画像理解システムを構築した。3.概念図理解システムの構築技術論文にしばしば含まれる概念図を対象に,図理解システムを構築した。本システムの特徴は,図に記述された概念,および概念間の関係という高次の情報を抽出する点にある。抽出された概念は,キーワードとして登録され,テキストとの参照構造の抽出に用いられる。4.参照構造の抽出とハイパーメディア化参照形態(1),(2),(5)を対象に,参照構造を抽出する手法を開発した。具体的には,(a)図表を図表番号に基づいてテキストとリンクする処理,(b)章,節を参照するテキストを,章,節の本体とリンクする処理,(c)著者照会文と写真を,頁領域における両者の近さに基づいてリンクする処理などを実現した また,図,表、写真の画像,本文の文字認識結果,および抽出したリンクを入力とし,HTML形式のデータを得るシステムを開発し,Mosaicなどのブラウザで表示可能とした。
1。参考格式的分析和参考格式的分析,分析从分类文档中的文本到数字,表,照片和文本。结果表明,参考表格可以分为五种类型:(1)直接引用,(2)按顺序引用,(3)通过排列引用,(4)通过上下文参考,(5)(5)通过接近性参考,并且也有一些结合这些引用。 2。为多页制造文档图像理解系统,以使技术论文过度介导,对所有页面的技术论文进行处理。目前,问题来自具有不确定位置的图形和表格等页面的单独提取方法,以及用于为文档所有页面提取逻辑结构的方法。在这项研究中,我们开发了一种使用文献识别的结果提取图表标题的方法,然后使用标题作为线索的位置提取图表的正文,以及(2)一种通过在阅读顺序中求解所有页面中包含在所有页面中的字符串并解析结果的逻辑结构中的字符串的方法。此外,基于这两种方法,构建了能够处理技术论文所有页面的文档图像理解系统。 3.构建理解系统的概念图理解系统是根据通常包含在技术论文中的概念图构建的。该系统的一个功能是提取高阶信息,例如图中描述的概念以及概念之间的关系。提取的概念被注册为关键字,用于用文本提取参考结构。 4。提取参考结构和超介导的参考结构,我们开发了一种提取参考结构的方法(1),(2),(5)。具体而言,我们通过将章节和部分与章节主体和章节的主体联系在一起,通过链接文本来输入图形,表和数据,开发了一种用于获取HTML格式数据的系统,以及(c)链接作者的查询和照片,基于页面区域两者的亲密关系。此外,我们开发了一个系统,用于通过输入图形,表,照片图像,文本识别结果和提取的链接来获取HTML格式数据,并使它们可以在Mosaic等浏览器中显示。

项目成果

期刊论文数量(8)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
黄瀬浩一: "構文・意味解析を用いた文字認識後処理法" 電子情報通信学会論文誌 D-II. J77-D-II. 2199-2209 (1994)
Koichi Kise:“使用句法和语义分析的字符识别后处理方法”电子、信息和通信工程师协会汇刊 D-II 2199-2209 (1994)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
Noriyoshi Yoneda: "A Method of Understanding Conceptual Diagrams" Proceedings of IAPR Workshop on Maclune Vision Applications. 334-337 (1994)
Noriyoshi Yoneda:“理解概念图的方法”IAPR Maclune 视觉应用研讨会论文集。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
黄瀬浩一: "印刷文書のハイパーテキスト化に関する一考察" 平成6年電気関係学会関西支部連合大会論文集. G275- (1994)
Koichi Kise:“将印刷文档转换为超文本的研究”1994 年电气工程学会关西分会会议记录 G275- (1994)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
黄瀬浩一: "幾何問題の理解と解決を目的とした図と文の統合理解" 電気学会論文誌C. 114-C. 1201-1207 (1994)
Koichi Kise:“为了理解和解决几何问题而对图表和句子的综合理解”,日本电气工程师学会汇刊 C. 114-C.1201-1207 (1994)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
秋吉裕二: "空白の構造に基づく文書画像の領域分割" 電子情報通信学会技術研究報告パターン認識・理解研究会. PRU94(PRU94-101). 31-38 (1995)
Yuji Akiyoshi:“基于空白结构的文档图像区域分割”IEICE 技术报告模式识别和理解研究组。PRU94(PRU94-101)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

黄瀬 浩一其他文献

学習補助のための視点情報に基づく文書アノテーション
基于视点信息的文档注释,用于辅助学习
  • DOI:
  • 发表时间:
    2015
  • 期刊:
  • 影响因子:
    0
  • 作者:
    大社 綾乃;Kai Kunze;Olivier Augereau;黄瀬 浩一
  • 通讯作者:
    黄瀬 浩一
英語空所補充問題の自動生成
自动生成英文填空题
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    森瀧 瑞希;湯浅 成章;Andrew W. Vargo;黄瀬 浩一
  • 通讯作者:
    黄瀬 浩一
習慣添付型マイクロラーニングの提案
习惯附着型微学习提案
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    中井 拓海;Andrew Vargo;黄瀬 浩一
  • 通讯作者:
    黄瀬 浩一
VR空間操作コマンドとしてのアイジェスチャUIの特性分析
VR空间操控命令眼部手势UI特性分析
  • DOI:
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    0
  • 作者:
    湯浅 成章;Andrew Vargo;黄瀬 浩一;夏目達也,内村裕也,Christian Arzate Cruz,柴田史久,木村朝子
  • 通讯作者:
    夏目達也,内村裕也,Christian Arzate Cruz,柴田史久,木村朝子
LLAHによるリアルタイム文書画像検索の日本語文書への拡張
使用 LLAH 将实时文档图像搜索扩展到日语文档
  • DOI:
  • 发表时间:
    2007
  • 期刊:
  • 影响因子:
    0
  • 作者:
    中居 友弘;黄瀬 浩一;岩村 雅一
  • 通讯作者:
    岩村 雅一

黄瀬 浩一的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('黄瀬 浩一', 18)}}的其他基金

「読み」を読み,読まれて知る:センシングと生成AIを用いた対話する読書の創出
阅读并通过被阅读而了解:利用感知和生成人工智能创建交互式阅读
  • 批准号:
    24K02962
  • 财政年份:
    2024
  • 资助金额:
    $ 0.58万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
Human-centered ways to connect intelligence: Japanese-German-French approach to human learning enhancement and implications through generative AI
以人为本的连接智能的方法:日本、德国、法国通过生成人工智能增强人类学习的方法及其影响
  • 批准号:
    23KK0188
  • 财政年份:
    2023
  • 资助金额:
    $ 0.58万
  • 项目类别:
    Fund for the Promotion of Joint International Research (International Collaborative Research)
International Collaborative Research on Intelligence Augmentation of Human Learning
人类学习智能增强的国际合作研究
  • 批准号:
    20KK0235
  • 财政年份:
    2020
  • 资助金额:
    $ 0.58万
  • 项目类别:
    Fund for the Promotion of Joint International Research (Fostering Joint International Research (B))
ImPen:画像の検索・位置決めと再構成による新しいペン型インタフェース
ImPen:一种新的类似笔的界面,具有图像搜索、定位和重建功能
  • 批准号:
    21650026
  • 财政年份:
    2009
  • 资助金额:
    $ 0.58万
  • 项目类别:
    Grant-in-Aid for Challenging Exploratory Research
データハイディングに基づく認識可能な印刷文書の生成と電子文書への変換
基于数据隐藏生成可识别的印刷文档并转换为电子文档
  • 批准号:
    11780312
  • 财政年份:
    1999
  • 资助金额:
    $ 0.58万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
電子図書館構築のための文書データ入力支援システムの高機能化
完善电子图书馆建设文档数据输入支持系统的功能
  • 批准号:
    09780391
  • 财政年份:
    1997
  • 资助金额:
    $ 0.58万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
文書画像の統合理解による電子図書館構築支援方式の検討
基于文档图像综合理解的电子图书馆建设支持方法的思考
  • 批准号:
    08780403
  • 财政年份:
    1996
  • 资助金额:
    $ 0.58万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
文書画像の統合理解によるハイパーテキスト化と知的検索
通过对文档图像的综合理解进行超文本转换和智能搜索
  • 批准号:
    07780372
  • 财政年份:
    1995
  • 资助金额:
    $ 0.58万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
印刷文書のハイパーテキスト化を指向した文書画像の統合理解に関する研究
旨在将印刷文档转化为超文本的文档图像综合理解研究
  • 批准号:
    05780323
  • 财政年份:
    1993
  • 资助金额:
    $ 0.58万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)

相似海外基金

Try of bidirectional substitution with visual creation ancestry and auditory creation ancestry
视觉创造系与听觉创造系双向替代的尝试
  • 批准号:
    25580045
  • 财政年份:
    2013
  • 资助金额:
    $ 0.58万
  • 项目类别:
    Grant-in-Aid for Challenging Exploratory Research
A research on Information Semiotics and Hyper-archive Platform
信息符号学与超档案平台研究
  • 批准号:
    23300092
  • 财政年份:
    2011
  • 资助金额:
    $ 0.58万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
An Experimental Study on the Structure of Hypertrails: With Focus on the Interaction with Learners' Knowledge Structure
超轨迹结构的实验研究:关注与学习者知识结构的交互
  • 批准号:
    22700828
  • 财政年份:
    2010
  • 资助金额:
    $ 0.58万
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)
A Study on the Possibility of History Hypermedia Teaching Software in School
学校历史超媒体教学软件的可能性研究
  • 批准号:
    20700633
  • 财政年份:
    2008
  • 资助金额:
    $ 0.58万
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)
イタリア人日本語学習者のための新しい日本語文法辞典の編纂
为意大利日语学习者编写的新日语语法词典
  • 批准号:
    08F08737
  • 财政年份:
    2008
  • 资助金额:
    $ 0.58万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了