Studies on Summarization of Multimedia Contents Based on Relational Structure between Text Tables and Images

基于文本表与图像关系结构的多媒体内容摘要研究

基本信息

  • 批准号:
    13680452
  • 负责人:
  • 金额:
    $ 1.54万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
  • 财政年份:
    2001
  • 资助国家:
    日本
  • 起止时间:
    2001 至 2003
  • 项目状态:
    已结题

项目摘要

This research intends to develop a system which summarizes product (PCs) information retrieved from Web sites based on relational structure between text, tables and images, and presents products suitable for a user's request.1.Extraction of product specifications from HTML documents.We proposed a method for extracting specifications from HTML documents using TSVMs (Transductive Support Vector Machines). The elements of a feature vector are keywords with normalized TF-DF weighting. We achieved 95% recall with 99% precision.2.Characteristic-data extraction and support system for PC selection.The specifications written in HTML are converted into normal form called table structure. The quantitative attributes are extracted by comparing them with the mean or mode of all sample data, and the qualitative ones are extracted using knowledge provided manually. The recommended PCs are dynamically determined from the extracted data by a user's request and relevance feedback. Moreover, a radar chart and Japanese sentences are generated from specifications.3.Classification of images and feature extraction.We proposed a method for classifying the contents of images using weighted keywords extracted from their neighboring sentences. We achieved 79% accuracy by TF-IDF weighting. We also developed a system which eliminates the background from a PC image, and classify the color of PC using C4.5.
本研究旨在开发一个基于文本、表格和图像之间的关系结构的产品信息汇总系统,并根据用户的要求提供产品信息。1.从HTML文档中提取产品规格说明提出了一种基于TSVM(Transductive Support Vector Machines)的HTML文档规格说明提取方法。特征向量的元素是具有归一化TF-DF加权的关键字。2.特征数据提取与PC选型支持系统将HTML格式的规格说明转换为表格结构。定量属性通过与所有样本数据的均值或众数进行比较来提取,定性属性通过人工提供的知识来提取。通过用户的请求和相关性反馈从提取的数据动态地确定推荐的PC。3.图像的分类和特征提取提出了一种利用相邻句子中提取的加权关键词对图像内容进行分类的方法。通过TF-IDF加权,我们实现了79%的准确率。我们还开发了一个系统,从PC图像中消除背景,并使用C4.5分类PC的颜色。

项目成果

期刊论文数量(30)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
林晃司, 嶋田和孝, 遠藤勉: "WWWからの性能表抽出のためのキーワード獲得と重み付け"電子情報通信学会技術研究報告Tl2002-48〜53[思考と言語]. Vol.102 No.688. 13-18 (2003)
Koji Hayashi、Kazutaka Shimada、Tsutomu Endo:“从 WWW 中提取性能表的关键字获取和加权”IEICE 技术研究报告 Tl2002-48~53 [Thinking and Language] Vol.102 No.688 (2003)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
福本篤史, 遠藤勉, 嶋田和孝: "Information Extraction from Specifications on the World Wide Web"Proceedings of PACLING2001 (Pacific Association for Computational Linguistics 2001). 109-116 (2001)
Atsushi Fukumoto、Tsutomu Endo、Kazutaka Shimada:“从万维网规范中提取信息”PACLING2001 论文集(太平洋计算语言学协会 2001 年)109-116 (2001)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
嶋田和孝, 伊藤哲郎, 遠藤勉: "Multiform Summarization from Product Specifications"Proceedings of PACLING2003(Pacific Association for Computational Linguistics 2003). 83-92 (2003)
Kazutaka Shimada、Tetsuro Ito、Tsutomu Endo:“产品规格的多形式总结”PACLING2003 论文集(太平洋计算语言学协会 2003 年)83-92 (2003)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
嶋田和孝, 遠藤勉他: "Information Modeling and Knowledge Bases XV"IOS Press. 333 (2004)
Kazutaka Shimada、Tsutomu Endo 等人:“信息建模和知识库 XV”IOS Press 333 (2004)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
Atsushi Fukumoto, Tsutomu Endo, Kazutaka Shimada: "Information Extraction from Specifications on the World Wide Web"Proceedings of PACLING2001 (Pacific Association for Computational Linguistics 2001). 109-116 (2001)
Atsushi Fukumoto、Tsutomu Endo、Kazutaka Shimada:“从万维网规范中提取信息”PACLING2001 论文集(太平洋计算语言学协会 2001 年)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

ENDO Tsutomu其他文献

ENDO Tsutomu的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('ENDO Tsutomu', 18)}}的其他基金

Cooperative Understanding of Speeches and Images Using Multiple Recognizer and Its Application to Multimodal Dialogue System
多识别器对语音和图像的协同理解及其在多模态对话系统中的应用
  • 批准号:
    21500143
  • 财政年份:
    2009
  • 资助金额:
    $ 1.54万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Studies on Multimodal Dialogue Control using Multimedia Corpus and Probability Model
基于多媒体语料库和概率模型的多模态对话控制研究
  • 批准号:
    18500115
  • 财政年份:
    2006
  • 资助金额:
    $ 1.54万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
An Investigation of Cooperative Understanding of Utterances and Gestures Based on Interaction in Semantics Level
基于语义层面交互的言语和手势合作理解研究
  • 批准号:
    10680388
  • 财政年份:
    1998
  • 资助金额:
    $ 1.54万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
An Implementation of Multimedia Communication in Knowledge Acquisition Process
多媒体通信在知识获取过程中的实现
  • 批准号:
    07680409
  • 财政年份:
    1995
  • 资助金额:
    $ 1.54万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)

相似国自然基金

WWW多媒体内容安全模型与算法研究
  • 批准号:
    60472082
  • 批准年份:
    2004
  • 资助金额:
    24.0 万元
  • 项目类别:
    面上项目
基于页-对象视图的WWW上信息集成技术的研究
  • 批准号:
    69803004
  • 批准年份:
    1998
  • 资助金额:
    12.0 万元
  • 项目类别:
    青年科学基金项目

相似海外基金

https://www-kofu.jsps.go.jp/kofu1/shinsei/shoriKanri/kadaiKanriList.do
https://www-kofu.jsps.go.jp/kofu1/shinsei/shoriKanri/kadaiKanriList.do
  • 批准号:
    22K08059
  • 财政年份:
    2022
  • 资助金额:
    $ 1.54万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
NUM - efficient, privacy-focused alternative to WWW for storing & retrieving structured data
NUM - 高效、注重隐私的 WWW 存储替代方案
  • 批准号:
    54162
  • 财政年份:
    2020
  • 资助金额:
    $ 1.54万
  • 项目类别:
    Study
Analysis of lifestyle and health texts on the WWW consisting of text and numeric data.
对 WWW 上由文本和数字数据组成的生活方式和健康文本的分析。
  • 批准号:
    18K11549
  • 财政年份:
    2018
  • 资助金额:
    $ 1.54万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
A development of an innohttps://www-kofu.jsps.go.jp/kofu1/shinsei/shoriKanri/kadaiKanriList.dovative technology to identify key odorants from complex volatile mixtures
开发了一种 innohttps://www-kofu.jsps.go.jp/kofu1/shinsei/shoriKanri/kadaiKanriList.dovative 技术,用于从复杂的挥发性混合物中识别关键气味剂
  • 批准号:
    17K19215
  • 财政年份:
    2017
  • 资助金额:
    $ 1.54万
  • 项目类别:
    Grant-in-Aid for Challenging Research (Exploratory)
Integrated Media Analysis for Medical/Health Information Matching on WWW
WWW 医疗/健康信息匹配的综合媒体分析
  • 批准号:
    15K00425
  • 财政年份:
    2015
  • 资助金额:
    $ 1.54万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Integrated Development of Japanese linguistics by WWW searching
WWW检索的日语语言学综合发展
  • 批准号:
    26370551
  • 财政年份:
    2014
  • 资助金额:
    $ 1.54万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Research and Development about Support for Safe and Secure by Visualization of WWW information using Augmented Reality
通过使用增强现实技术可视化 WWW 信息来支持安全可靠的研究和开发
  • 批准号:
    25870576
  • 财政年份:
    2013
  • 资助金额:
    $ 1.54万
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)
Groupware Performance Library for the WWW
WWW 的群件性能库
  • 批准号:
    449403-2013
  • 财政年份:
    2013
  • 资助金额:
    $ 1.54万
  • 项目类别:
    University Undergraduate Student Research Awards
RepServer: Antigen Receptor Repertoire Analysis Pipelines via the WWW
RepServer:通过 WWW 的抗原受体库分析管道
  • 批准号:
    8822801
  • 财政年份:
    2012
  • 资助金额:
    $ 1.54万
  • 项目类别:
RepServer: Antigen Receptor Repertoire Analysis Pipelines via the WWW
RepServer:通过 WWW 的抗原受体库分析管道
  • 批准号:
    8636990
  • 财政年份:
    2012
  • 资助金额:
    $ 1.54万
  • 项目类别:
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了