電子図書館構築のための文書データ入力支援システムの高機能化
完善电子图书馆建设文档数据输入支持系统的功能
基本信息
- 批准号:09780391
- 负责人:
- 金额:$ 1.41万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Encouragement of Young Scientists (A)
- 财政年份:1997
- 资助国家:日本
- 起止时间:1997 至 1998
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
昨年度に引続き,文書画像のレイアウト解析の高機能化に関する研究を行うと共に,電子テキストを対象として,ハイパーテキストリンク自動生成について検討を行った.概要は以下の通りである.1. ポロノイ図を用いた文字列抽出法の改良昨年度に提案した文字列抽出法について,抽出に用いる特徴量や処理アルゴリズムの改良を行った.また,マンハッタンレイアウト,非マンハッタンレイアウトの文書画像50サンプル(各25サンプル)を対象として実験を行い,性能を評価した.その結果,平均処理時間約7秒(Pentium II 300MHz),文字列抽出率89.6%という結果を得,処理精度的には課題が残るものの,高速に処理可能であることがわかった.2. ブロック抽出結果を用いた文字列抽出法の検討上記手法の処理誤りの多くは,局所的な制約のみを考慮して文字列を抽出することに起因する.そこで,ブロックという大域的な領域の抽出結果を用いて,文字列抽出の誤りを訂正する処理を考案し,弛緩法に基づいて実現した.同じ機器,サンプルを用いて評価実験を行ったところ,平均処理時間52秒,文字列抽出率90.6%を得た.処理誤りの殆んどはブロック抽出誤りに起因するものであった.3. ハイパーテキストリンクの自動生成法の検討ハイパーテキストリンクをいかに生成するかは,電子図書館を実現する上で重要な問題である.予めシステム作成者がリンクを生成しておくのではなく,利用者の要求に応じてリンクが生成できれば,よりユーザフレンドリなシステムとなる.そこで本研究では,電子テキストを対象に,ユーザが興味を持つ文書の一部(例示部分)を例示すると,それに関連した部分(関連部分)を文書データベースから抽出する手法を検討した.本手法の特徴は,単語出現密度を用いて関連部分を同定する点にある.実験の結果,再現率62.9%,適合率58.8%を得,本手法の有効性を確認した.
Yesterday's annual に lead 続 き, clerical portrait の レ イ ア ウ ト parsing の high functional に masato す る を line う と に, electronic テ キ ス ト を like と seaborne し て, ハ イ パ ー テ キ ス ト リ ン ク automatically generated に つ い て 検 line for を っ た. Summary: The following goes through である.1. ポ ロ ノ イ 図 を with い た text extraction method modified yesterday proposed annual に し の た text extraction method に つ い て, out に い る, 徴 quantity や 処 Richard ア ル ゴ リ ズ ム の improved line を っ た. ま た, マ ン ハ ッ タ ン レ イ ア ウ ト, non マ ン ハ ッ タ ン レ イ ア ウ ト の documents portrait 50 サ ン プ ル (each 25 サ ン プ ル) を like と seaborne し て be 験 を line を い, performance evaluation of 価 し た. そ の as a result, the average 処 principle about 7 seconds (Pentium II 300 MHZ), text extraction rate 89.6% と い う results, を 処 principle of precision に は subject が residual る も の の, high-speed に 処 principle may で あ る こ と が わ か っ た. 2. ブ ロ ッ ク out results を い た text extraction method の 検 for written technique の 処 principle error り の more く は, bureau な restriction の み を consider し て text columns を spare す る こ と に cause す る. そ こ で, ブ ロ ッ ク と い う large domain field of な の out results を い て, text extraction の mistakenly り を correction す る 処 し を test case management, relaxation method に base づ い て be Now た. With じ machine, サ ン プ ル を with い て review 価 be 験 を line っ た と こ ろ, average 処 52 seconds, text extraction rate 90.6% を た. 処 principle error り の perilous ん ど は ブ ロ ッ ク take out false り に cause す る も の で あ っ た. 3. ハ イ パ ー テ キ ス ト リ ン ク の automatically generated method の beg ハ 検 イ パ ー テ キ ス ト リ ン ク を い か に generated す る か は, electronic 図 libraries を be presently す る で な important question on で あ る. To め シ ス テ ム made those が リ ン ク を generated し て お く の で は な く, ik の requirements に 応 じ て リ ン ク が generated で き れ ば, よ り ユ ー ザ フ レ ン ド リ な シ ス テ ム と な る. そ こ で this study で は, electronic テ キ ス ト を like に, seaborne ユ ー ザ が tumblers を hold つ documents の a (in part) を exemplify す る と, そ れ に masato even し た Part (Related part)を document デ タベ タベ タベ ス ら ら Extract する method を検 to claim た. The feature of this technique is that the frequency of the appearance of 単 words is を, and the する point にある is determined by the て related part を. The experimental results showed a reproduction rate of 62.9% and a fitness rate of 58.8%を, indicating that the efficacy of this method is を confirmed to be た.
项目成果
期刊论文数量(24)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
黄瀬浩一: "文書画像理解の目指すもの" 電子情報通信学会パターン認識・メディア理解研究会資料. 97. 55-62 (1998)
Koichi Kise:“文档图像理解的目标”IEICE 模式识别和媒体理解研究组材料。97. 55-62 (1998)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
黄瀬浩一: "画像・図と言語の統合" システム/制御/情報. 41. 416-421 (1997)
Koichi Kise:“图像/图表和语言的集成”系统/控制/信息。41. 416-421 (1997)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
岩田基: "一般図形ボロノイ図に基づく文書画像からの文字列抽出" 1998年電子情報通信学会総合大会講演論文集. (発表予定). (1998)
Hajime Iwata:“基于一般几何 Voronoi 图从文档图像中提取字符串”1998 年 IEICE 大会论文集(待提交)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
岩田基: "文書画像のレイアウトや傾きに依存しない高速文字列抽出法" 平成10年電気関係学会関西支部連合大会講演論文集. G345 (1998)
Hajime Iwata:“不依赖于文档图像的布局或倾斜的高速字符串提取方法”1998 年日本电气工程师关西分会会议记录 G345 (1998)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
岩田基: "弛緩法に基づく文書画像のレイアウト解析" 1999年電子情報通信学会総合大会講演論文集. (発表予定). (1999)
Hajime Iwata:“基于松弛方法的文档图像布局分析”1999 年 IEICE 大会论文集(预定报告)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
黄瀬 浩一其他文献
VR空間操作コマンドとしてのアイジェスチャUIの特性分析
VR空间操控命令眼部手势UI特性分析
- DOI:
- 发表时间:
2023 - 期刊:
- 影响因子:0
- 作者:
湯浅 成章;Andrew Vargo;黄瀬 浩一;夏目達也,内村裕也,Christian Arzate Cruz,柴田史久,木村朝子 - 通讯作者:
夏目達也,内村裕也,Christian Arzate Cruz,柴田史久,木村朝子
学習補助のための視点情報に基づく文書アノテーション
基于视点信息的文档注释,用于辅助学习
- DOI:
- 发表时间:
2015 - 期刊:
- 影响因子:0
- 作者:
大社 綾乃;Kai Kunze;Olivier Augereau;黄瀬 浩一 - 通讯作者:
黄瀬 浩一
個人に適した英語多肢選択問題の自動生成方法の提案
一种自动生成适合个人的英语选择题方法的提出
- DOI:
- 发表时间:
2022 - 期刊:
- 影响因子:0
- 作者:
湯浅 成章;Andrew Vargo;黄瀬 浩一 - 通讯作者:
黄瀬 浩一
黄瀬 浩一的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('黄瀬 浩一', 18)}}的其他基金
「読み」を読み,読まれて知る:センシングと生成AIを用いた対話する読書の創出
阅读并通过被阅读而了解:利用感知和生成人工智能创建交互式阅读
- 批准号:
24K02962 - 财政年份:2024
- 资助金额:
$ 1.41万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
Human-centered ways to connect intelligence: Japanese-German-French approach to human learning enhancement and implications through generative AI
以人为本的连接智能的方法:日本、德国、法国通过生成人工智能增强人类学习的方法及其影响
- 批准号:
23KK0188 - 财政年份:2023
- 资助金额:
$ 1.41万 - 项目类别:
Fund for the Promotion of Joint International Research (International Collaborative Research)
International Collaborative Research on Intelligence Augmentation of Human Learning
人类学习智能增强的国际合作研究
- 批准号:
20KK0235 - 财政年份:2020
- 资助金额:
$ 1.41万 - 项目类别:
Fund for the Promotion of Joint International Research (Fostering Joint International Research (B))
ImPen:画像の検索・位置決めと再構成による新しいペン型インタフェース
ImPen:一种新的类似笔的界面,具有图像搜索、定位和重建功能
- 批准号:
21650026 - 财政年份:2009
- 资助金额:
$ 1.41万 - 项目类别:
Grant-in-Aid for Challenging Exploratory Research
データハイディングに基づく認識可能な印刷文書の生成と電子文書への変換
基于数据隐藏生成可识别的印刷文档并转换为电子文档
- 批准号:
11780312 - 财政年份:1999
- 资助金额:
$ 1.41万 - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (A)
文書画像の統合理解による電子図書館構築支援方式の検討
基于文档图像综合理解的电子图书馆建设支持方法的思考
- 批准号:
08780403 - 财政年份:1996
- 资助金额:
$ 1.41万 - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (A)
文書画像の統合理解によるハイパーテキスト化と知的検索
通过对文档图像的综合理解进行超文本转换和智能搜索
- 批准号:
07780372 - 财政年份:1995
- 资助金额:
$ 1.41万 - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (A)
図とテキストの協調的構造解析に基づく文書画像からのハイパーメディア構造の抽出
基于图文协同结构分析的文档图像超媒体结构提取
- 批准号:
06780357 - 财政年份:1994
- 资助金额:
$ 1.41万 - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (A)
印刷文書のハイパーテキスト化を指向した文書画像の統合理解に関する研究
旨在将印刷文档转化为超文本的文档图像综合理解研究
- 批准号:
05780323 - 财政年份:1993
- 资助金额:
$ 1.41万 - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (A)














{{item.name}}会员




