XMLで表現されるマルチメディアデータの効果的検索法に関する研究
XML表达的多媒体数据的有效搜索方法研究
基本信息
- 批准号:12780309
- 负责人:
- 金额:$ 1.22万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Encouragement of Young Scientists (A)
- 财政年份:2000
- 资助国家:日本
- 起止时间:2000 至 2001
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
これまで提案されてきた文書検索は,文書全体を検索単位としてそれに含まれている文字列を特徴として扱っていた.しかし,近年,XML文書のような構造を持った文書やPDF, MPEG-7のような複数のメディアを扱った文書が多くなり,それに伴ってそれら文書を検索する際に従来の文書検索技術をそのまま適用することが難しいという問題が発生していた.本研究では,従来の文書検索のように一つの文書から一つの特徴量を抽出するのではなく,文書からは複数のさまざまな特徴量が抽出できると考え,XML文書検索の場合は文書内容とその構造から,PDFやMPEG-7文書検索の場合はその文書に含まれるそれぞれのメディアのコンテンツから特徴量を抽出し,それらを最適な単位で検索する手法を提案した.具体的には,XML文書検索の場合,XML文書の特徴量を最も忠実に抽出できる単位が存在するので,その単位を文書構造から推定する手法を確立した.また同時に,抽出された単位と利用者の入力した問合せの類似度計算の手法を提案し,その計算手法をXML文書検索に適用することで10%程度の検索精度の向上した.さらに,PDF文書検索の場合は,抽出された複数のメディアの特徴量を等価に扱わなければ双方の特徴を利用した検索が実現できないため,それら特徴量の正規化手法の提案を行った.この手法が確立されたことで,昨年度提案した複数特徴量を統合した検索手法の検索精度が最大25%程度向上した.
This is a proposal for a text search, a text search for the entire text, and a text search for a text string. In recent years, the structure of XML documents, PDF documents, MPEG-7 documents, a number of documents, and the application of document search technology have emerged. In this study, the document search from the past to the document search, document The best way to find a solution Specifically, in the case of XML document search, the characteristics of XML document are extracted from the most accurate unit, and the method of document construction is established. At the same time, the search accuracy of XML document search is improved to 10% by the method of similarity calculation of extraction unit and user. In the case of PDF document search, extract the feature quantity of the plurality of documents, and make use of the feature quantity of both documents. This method was established and the search accuracy of the search method was up to 25% at most.
项目成果
期刊论文数量(10)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Y.Suzuki et al.: "Extraction and Integration of XML Document Features on Wireless Environment"Proc.of the First International Workshop on Wireless Information Systems. (2002)
Y.Suzuki 等人:“无线环境下 XML 文档特征的提取和集成”Proc. of the First International Workshop on Wireless Information Systems。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
波多野 賢治, 渡邉 正裕 他: "情報検索技術を用いた部分文書構造の自動抽出"情報処理学会論文誌:データベース. 40・SIG3(TOD10). 47-59 (2001)
Kenji Hatano、Masahiro Watanabe 等:“使用信息检索技术自动提取部分文档结构”日本信息处理学会会刊:数据库 40・SIG3(TOD10)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
K.Hatano et al.: "Extraction of Partial XML Documents Using IR-based Structure and Contents Analysis"Proc.of the International Workshop on Data Semantics in Web Information Systems. 189-202 (2001)
K.Hatano 等人:“使用基于 IR 的结构和内容分析提取部分 XML 文档”Web 信息系统数据语义国际研讨会的会议记录。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
鈴木 優, 波多野 賢治 他: "複数のメディアで構成された電子文書の検索手法"情報処理学会論文誌:データベース. 40・SIG10(TOD11). 11-21 (2001)
Yu Suzuki、Kenji Hatano 等:“由多种媒体组成的电子文档的搜索方法”日本信息处理协会交易:数据库 40・SIG10(TOD11)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
Toshiyuki Amagasa,Minoru Nakai,Kenji Hatano,Masatoshi Yoshikawa,and Shunsuke Uemura: "Keyword Assignment to Images Using Sliding Windows"Proceedings of the 2000 ADBIS-DASFAA Symposium on Advances in Databases and Information Systems. 1-10 (2000)
Toshiyuki Amagasa、Minoru Nakai、Kenji Hatano、Masatoshi Yoshikawa 和 Shunsuke Uemura:“使用滑动窗口为图像分配关键字”2000 年 ADBIS-DASFAA 数据库和信息系统进展研讨会论文集。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
波多野 賢治其他文献
The Economic and Political Preferences of Japanese Homemakers
日本家庭主妇的经济和政治偏好
- DOI:
- 发表时间:
2023 - 期刊:
- 影响因子:0
- 作者:
木村 優介;駒水 孝裕 ;波多野 賢治;Tomoko Matsumoto; Kenneth McElwain; Kensuke Okada; Junko Kato - 通讯作者:
Tomoko Matsumoto; Kenneth McElwain; Kensuke Okada; Junko Kato
The synchronous vs. asynchronous NoC routers: an apple-to-apple comparison between synchronous and transition signaling asynchronous designs
同步与异步 NoC 路由器:同步和转换信令异步设计之间的逐个比较
- DOI:
- 发表时间:
2016 - 期刊:
- 影响因子:0
- 作者:
久米 出;中村 匡秀;波多野 賢治;柴山 悦哉;Masashi Imai; Thiem Van Chu; Kenji Kise; Tomohiro Yoneda - 通讯作者:
Masashi Imai; Thiem Van Chu; Kenji Kise; Tomohiro Yoneda
XML情報検索のための動的な索引管理手法の一提案
一种用于XML信息检索的动态索引管理方法的建议
- DOI:
- 发表时间:
2011 - 期刊:
- 影响因子:0
- 作者:
欅 惇志;宮崎 純;波多野 賢治;山本 豪志朗;加藤 博一 - 通讯作者:
加藤 博一
データの複雑性を考慮した不均衡データに対するリサンプリング手法
考虑数据复杂度的不平衡数据重采样方法
- DOI:
- 发表时间:
2020 - 期刊:
- 影响因子:0
- 作者:
笹田 大翔;馬場 睦也;木村 優介;波多野 賢治 - 通讯作者:
波多野 賢治
固有表現タグおよびPOSタグによる交換制約付きデータ拡張手法
使用命名实体标签和POS标签的具有交换约束的数据扩展方法
- DOI:
- 发表时间:
2023 - 期刊:
- 影响因子:0
- 作者:
寺本 優香;駒水 孝裕 ;波多野 賢治 - 通讯作者:
波多野 賢治
波多野 賢治的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('波多野 賢治', 18)}}的其他基金
異種データセット間におけるエンティティ同定とその活用に関する研究
异构数据集中的实体识别及其利用研究
- 批准号:
23K28383 - 财政年份:2024
- 资助金额:
$ 1.22万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
A Study on Entity Identification and Utilization in Cross-Dataset
跨数据集中的实体识别与利用研究
- 批准号:
23H03694 - 财政年份:2023
- 资助金额:
$ 1.22万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
高精度XML文書検索システムの問合せ処理高速化に関する研究
高精度XML文档检索系统查询加速处理研究
- 批准号:
16700103 - 财政年份:2004
- 资助金额:
$ 1.22万 - 项目类别:
Grant-in-Aid for Young Scientists (B)
部分着目型XML情報検索システムの開発とその利用に関する研究
偏焦点XML信息检索系统的开发与使用研究
- 批准号:
14780325 - 财政年份:2002
- 资助金额:
$ 1.22万 - 项目类别:
Grant-in-Aid for Young Scientists (B)
相似海外基金
データハイディングに基づく認識可能な印刷文書の生成と電子文書への変換
基于数据隐藏生成可识别的印刷文档并转换为电子文档
- 批准号:
11780312 - 财政年份:1999
- 资助金额:
$ 1.22万 - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (A)
Managing Technological Innovation in Electronic Document Delivery Workshop; Baltimore, MD; October 24-25, 1996
电子文件传递技术创新管理研讨会;
- 批准号:
9612167 - 财政年份:1996
- 资助金额:
$ 1.22万 - 项目类别:
Standard Grant
Research laboratory for electronic document processing
电子文档处理研究实验室
- 批准号:
156022-1994 - 财政年份:1993
- 资助金额:
$ 1.22万 - 项目类别:
Research Tools and Instruments - Category 1 (<$150,000)
A Research Program on Electronic Document-Delivery Systems For Interlibrary Loans
馆际互借电子文件传递系统研究计划
- 批准号:
7823251 - 财政年份:1979
- 资助金额:
$ 1.22万 - 项目类别:
Standard Grant