Studies on Summarization of Multimedia Contents Based on Relational Structure between Text Tables and Images

基于文本表与图像关系结构的多媒体内容摘要研究

基本信息

  • 批准号:
    13680452
  • 负责人:
  • 金额:
    $ 1.54万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
  • 财政年份:
    2001
  • 资助国家:
    日本
  • 起止时间:
    2001 至 2003
  • 项目状态:
    已结题

项目摘要

This research intends to develop a system which summarizes product (PCs) information retrieved from Web sites based on relational structure between text, tables and images, and presents products suitable for a user's request.1.Extraction of product specifications from HTML documents.We proposed a method for extracting specifications from HTML documents using TSVMs (Transductive Support Vector Machines). The elements of a feature vector are keywords with normalized TF-DF weighting. We achieved 95% recall with 99% precision.2.Characteristic-data extraction and support system for PC selection.The specifications written in HTML are converted into normal form called table structure. The quantitative attributes are extracted by comparing them with the mean or mode of all sample data, and the qualitative ones are extracted using knowledge provided manually. The recommended PCs are dynamically determined from the extracted data by a user's request and relevance feedback. Moreover, a radar chart and Japanese sentences are generated from specifications.3.Classification of images and feature extraction.We proposed a method for classifying the contents of images using weighted keywords extracted from their neighboring sentences. We achieved 79% accuracy by TF-IDF weighting. We also developed a system which eliminates the background from a PC image, and classify the color of PC using C4.5.
这项研究旨在开发一个系统,该系统根据文本,表和图像之间的关系结构总结了从网站检索的产品(PC)信息,并呈现适合用户请求的产品。1。html文档中产品规格的删除。我们提出了一种使用TSVM(TSVMS)(TransDuctive vector Machiness)从HTML文档中提取HTML文档的方法。特征向量的元素是具有标准化TF-DF加权的关键字。我们以99%的精度实现了95%的召回。2。用于选择PC选择的特征数据提取和支持系统。将HTML编写的规格转换为正常形式,称为表结构。通过将其与所有样本数据的平均值或模式进行比较,并使用提供的知识来提取定量属性。推荐的PC通过用户的请求和相关反馈从提取的数据中动态确定。此外,从规格中生成了雷达图和日语句子。3。图像的分类和特征提取。我们提出了一种使用从其相邻句子中提取的加权关键字对图像内容进行分类的方法。我们通过TF-IDF加权实现了79%的精度。我们还开发了一个系统,该系统可以从PC图像中消除背景,并使用C4.5对PC的颜色进行分类。

项目成果

期刊论文数量(30)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
林晃司, 嶋田和孝, 遠藤勉: "WWWからの性能表抽出のためのキーワード獲得と重み付け"電子情報通信学会技術研究報告Tl2002-48〜53[思考と言語]. Vol.102 No.688. 13-18 (2003)
Koji Hayashi、Kazutaka Shimada、Tsutomu Endo:“从 WWW 中提取性能表的关键字获取和加权”IEICE 技术研究报告 Tl2002-48~53 [Thinking and Language] Vol.102 No.688 (2003)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
福本篤史, 遠藤勉, 嶋田和孝: "Information Extraction from Specifications on the World Wide Web"Proceedings of PACLING2001 (Pacific Association for Computational Linguistics 2001). 109-116 (2001)
Atsushi Fukumoto、Tsutomu Endo、Kazutaka Shimada:“从万维网规范中提取信息”PACLING2001 论文集(太平洋计算语言学协会 2001 年)109-116 (2001)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
嶋田和孝, 遠藤勉他: "Information Modeling and Knowledge Bases XV"IOS Press. 333 (2004)
Kazutaka Shimada、Tsutomu Endo 等人:“信息建模和知识库 XV”IOS Press 333 (2004)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
遠藤勉: "対話支援型問題解決のための文脈情報処理"教育システム情報学会研究報告. Vol.18 No.3. 23-28 (2003)
Tsutomu Endo:“对话支持的问题解决的上下文信息处理”教育系统和信息研究学会的研究报告第 18 卷第 3 期(2003 年)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
Atsushi Fukumoto, Tsutomu Endo, Kazutaka Shimada: "Information Extraction from Specifications on the World Wide Web"Proceedings of PACLING2001 (Pacific Association for Computational Linguistics 2001). 109-116 (2001)
Atsushi Fukumoto、Tsutomu Endo、Kazutaka Shimada:“从万维网规范中提取信息”PACLING2001 论文集(太平洋计算语言学协会 2001 年)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

ENDO Tsutomu其他文献

ENDO Tsutomu的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('ENDO Tsutomu', 18)}}的其他基金

Cooperative Understanding of Speeches and Images Using Multiple Recognizer and Its Application to Multimodal Dialogue System
多识别器对语音和图像的协同理解及其在多模态对话系统中的应用
  • 批准号:
    21500143
  • 财政年份:
    2009
  • 资助金额:
    $ 1.54万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Studies on Multimodal Dialogue Control using Multimedia Corpus and Probability Model
基于多媒体语料库和概率模型的多模态对话控制研究
  • 批准号:
    18500115
  • 财政年份:
    2006
  • 资助金额:
    $ 1.54万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
An Investigation of Cooperative Understanding of Utterances and Gestures Based on Interaction in Semantics Level
基于语义层面交互的言语和手势合作理解研究
  • 批准号:
    10680388
  • 财政年份:
    1998
  • 资助金额:
    $ 1.54万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
An Implementation of Multimedia Communication in Knowledge Acquisition Process
多媒体通信在知识获取过程中的实现
  • 批准号:
    07680409
  • 财政年份:
    1995
  • 资助金额:
    $ 1.54万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)

相似国自然基金

面向社交万维网的双语知识图谱构建关键技术研究
  • 批准号:
    62006040
  • 批准年份:
    2020
  • 资助金额:
    24 万元
  • 项目类别:
    青年科学基金项目
结合描述逻辑和霍恩规则的不确定推理算法
  • 批准号:
    60903078
  • 批准年份:
    2009
  • 资助金额:
    18.0 万元
  • 项目类别:
    青年科学基金项目
Web结构和社会信息相关性模型及其计算实验方法研究
  • 批准号:
    60573166
  • 批准年份:
    2005
  • 资助金额:
    24.0 万元
  • 项目类别:
    面上项目
基于万维网服务的协同计算模型的研究
  • 批准号:
    90412002
  • 批准年份:
    2004
  • 资助金额:
    30.0 万元
  • 项目类别:
    重大研究计划
WWW多媒体内容安全模型与算法研究
  • 批准号:
    60472082
  • 批准年份:
    2004
  • 资助金额:
    24.0 万元
  • 项目类别:
    面上项目

相似海外基金

https://www-kofu.jsps.go.jp/kofu1/shinsei/shoriKanri/kadaiKanriList.do
https://www-kofu.jsps.go.jp/kofu1/shinsei/shoriKanri/kadaiKanriList.do
  • 批准号:
    22K08059
  • 财政年份:
    2022
  • 资助金额:
    $ 1.54万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
NUM - efficient, privacy-focused alternative to WWW for storing & retrieving structured data
NUM - 高效、注重隐私的 WWW 存储替代方案
  • 批准号:
    54162
  • 财政年份:
    2020
  • 资助金额:
    $ 1.54万
  • 项目类别:
    Study
Analysis of lifestyle and health texts on the WWW consisting of text and numeric data.
对 WWW 上由文本和数字数据组成的生活方式和健康文本的分析。
  • 批准号:
    18K11549
  • 财政年份:
    2018
  • 资助金额:
    $ 1.54万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
A development of an innohttps://www-kofu.jsps.go.jp/kofu1/shinsei/shoriKanri/kadaiKanriList.dovative technology to identify key odorants from complex volatile mixtures
开发了一种 innohttps://www-kofu.jsps.go.jp/kofu1/shinsei/shoriKanri/kadaiKanriList.dovative 技术,用于从复杂的挥发性混合物中识别关键气味剂
  • 批准号:
    17K19215
  • 财政年份:
    2017
  • 资助金额:
    $ 1.54万
  • 项目类别:
    Grant-in-Aid for Challenging Research (Exploratory)
Study on the development and the utilization of automatic interpretation system of Japanese ancient documents
日本古代文献自动解读系统的开发与应用研究
  • 批准号:
    16K02433
  • 财政年份:
    2016
  • 资助金额:
    $ 1.54万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了