An Investigation of Cooperative Understanding of Utterances and Gestures Based on Interaction in Semantics Level
基于语义层面交互的言语和手势合作理解研究
基本信息
- 批准号:10680388
- 负责人:
- 金额:$ 0.7万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Scientific Research (C)
- 财政年份:1998
- 资助国家:日本
- 起止时间:1998 至 2000
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
We are developing a problem solving and knowledge acquisition system based on co-reference between drill texts and dialogue with a teacher, focusing on first-grade mathematics. This research proposed a method of cooperative understanding of utterances and gestures.(1) Contextual information processing.We defined the context of dialogue, which consists of surface and case structure of utterances, intention and attention of the speaker, situation of dialogue, and world knowledge. We then presented the algorithms of generating utterances from the system as well as interpreting responses from the teacher using contextual information.(2) Analysis of gestures and utterances.Our point of interest is the movement of the tip of teacher's pen. We developed a simple input device to detect the three-dimensional coordinates of the tip of pen, and presented the algorithms to extract features from moving points. A feature-based approach is used for gesture recognition. We then proposed a method of parsing word candidates given from speech recognition program.(3) Cooperative understanding of utterances and gestures.We defined a multi-modal semantic representation to describe the meaning of utterances and gestures, and showed how to integrate our algorithms for utterance and gesture analysis. We concluded with an evaluation of the understanding system against the design principles, which provide the basis for the integration of multi-modal information during a dialogue.(4) Generation of gestures in cooperation with utterances.Gestures such as pointing of objects on a drill text or drawing of pictures, are represented by movement of a pen, and are displayed as three-dimensional graphical data. We defined a gesture frame and gesture element as an intermediate representation, and presented algorithms of generating them from the semantic representation with the synchronized phrase..
我们正在开发一个问题解决和知识获取系统,基于练习文本和与老师对话的共同参考,重点是一年级数学。本研究提出了一种合作理解话语和手势的方法。(1)语境信息处理。我们定义了对话的语境,包括话语的表层和格结构、说话人的意图和注意力、对话情境和世界知识。然后给出了从系统中生成话语以及利用上下文信息解释教师回答的算法。(2)手势和话语分析。我们的兴趣点是教师笔尖的移动。我们开发了一种简单的输入设备来检测笔尖的三维坐标,并给出了从运动点提取特征的算法。手势识别采用基于特征的方法。(3)话语和手势的协同理解,定义了一种多模式语义表示来描述话语和手势的含义,并给出了如何将我们的算法整合到话语和手势分析中。最后,我们根据设计原则对理解系统进行了评估,这些原则为对话过程中整合多通道信息提供了基础。(4)结合话语生成手势。手势的生成通过笔的移动来表示,并以三维图形数据的形式显示。我们定义了一个手势框架和手势元素作为中间表示,并给出了从同步短语的语义表示中生成它们的算法。
项目成果
期刊论文数量(33)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
賀川経夫,阿部慎也,遠藤勉: "マルチモーダル対話システムにおける複数モダリティの統合と解釈に関する一検討"情報処理学会「マルチメディア通信と分散処理」ワークショップ論文集. 99巻・18号. 19-24 (1999)
Tsuneo Kakawa、Shinya Abe、Tsutomu Endo:“多模态对话系统中多种模态的整合和解释的研究”日本信息处理学会“多媒体通信和分布式处理”研讨会论文集,第 99 卷。 19-24 (1999)
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
賀川経夫,遠藤勉: "ペンを利用したマルチモーダル対話におけるペン動作生成の一検討"電子情報通信学会技術研究報告. IE2000-81. 23-30 (2000)
Tsuneo Kakawa、Tsutomu Endo:“使用笔进行多模式对话中笔运动生成的研究”IEICE 技术报告 23-30 (2000)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
賀川経夫 森田光雄 石橋雄二 遠藤勉: "マルチモーダル対話における発話文生成とジェスチャ生成に関する一考察"電子情報通信学会技術研究報告. PEMU99-156. 47-54 (1999)
Tsuneo Kakawa、Mitsuo Morita、Yuji Ishibashi、Tsutomu Endo:“多模态对话中的话语生成和手势生成的研究”IEICE 技术研究报告 47-54(1999)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
遠藤勉,賀川経夫,嶋田和孝: "対話支援型問題解決システムにおける発話文生成機構と文脈処理"電子情報通信学会論文誌DII. J83-D-II巻8号. 1783-1795 (2000)
Tsutomu Endo、Tsuneo Kakawa、Kazutaka Shimada:“对话支持的问题解决系统中的语音生成机制和上下文处理”IEICE Transactions J83-D-II Vol. 8. 1783-1795 (2000)
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
阿部慎也 吉岡朋美 賀川経夫 遠藤勉: "マルチモーダル対話におけるジェスチャ解析の一手法" 電気関係学会九州支部連合大会講演論文集. No.425. 205 (1998)
Shinya Abe、Tomomi Yoshioka、Tsuneo Kakawa 和 Tsutomu Endo:“多模态对话中的手势分析方法”电气工程学会九州分会会议记录第 205 期(1998 年)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
ENDO Tsutomu其他文献
ENDO Tsutomu的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('ENDO Tsutomu', 18)}}的其他基金
Cooperative Understanding of Speeches and Images Using Multiple Recognizer and Its Application to Multimodal Dialogue System
多识别器对语音和图像的协同理解及其在多模态对话系统中的应用
- 批准号:
21500143 - 财政年份:2009
- 资助金额:
$ 0.7万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
Studies on Multimodal Dialogue Control using Multimedia Corpus and Probability Model
基于多媒体语料库和概率模型的多模态对话控制研究
- 批准号:
18500115 - 财政年份:2006
- 资助金额:
$ 0.7万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
Studies on Summarization of Multimedia Contents Based on Relational Structure between Text Tables and Images
基于文本表与图像关系结构的多媒体内容摘要研究
- 批准号:
13680452 - 财政年份:2001
- 资助金额:
$ 0.7万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
An Implementation of Multimedia Communication in Knowledge Acquisition Process
多媒体通信在知识获取过程中的实现
- 批准号:
07680409 - 财政年份:1995
- 资助金额:
$ 0.7万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
相似海外基金
Multimodal, Interpretable, and Interactive Machine Learning for Multimedia
多媒体的多模式、可解释和交互式机器学习
- 批准号:
RGPIN-2020-05471 - 财政年份:2022
- 资助金额:
$ 0.7万 - 项目类别:
Discovery Grants Program - Individual
Multimodal, Interpretable, and Interactive Machine Learning for Multimedia
多媒体的多模式、可解释和交互式机器学习
- 批准号:
RGPIN-2020-05471 - 财政年份:2021
- 资助金额:
$ 0.7万 - 项目类别:
Discovery Grants Program - Individual
Multimodal, Interpretable, and Interactive Machine Learning for Multimedia
多媒体的多模式、可解释和交互式机器学习
- 批准号:
DGECR-2020-00438 - 财政年份:2020
- 资助金额:
$ 0.7万 - 项目类别:
Discovery Launch Supplement
Multimodal, Interpretable, and Interactive Machine Learning for Multimedia
多媒体的多模式、可解释和交互式机器学习
- 批准号:
RGPIN-2020-05471 - 财政年份:2020
- 资助金额:
$ 0.7万 - 项目类别:
Discovery Grants Program - Individual
A 3-D Multimodal Approach to K-8 Environmental Health Literacy
K-8 环境健康素养的 3-D 多模式方法
- 批准号:
9912414 - 财政年份:2020
- 资助金额:
$ 0.7万 - 项目类别:
Developing Information Theoretic Tools for Multimedia Multimodal Information Processing
开发多媒体多模态信息处理的信息理论工具
- 批准号:
RGPIN-2015-06240 - 财政年份:2019
- 资助金额:
$ 0.7万 - 项目类别:
Discovery Grants Program - Individual
Developing Information Theoretic Tools for Multimedia Multimodal Information Processing
开发多媒体多模态信息处理的信息理论工具
- 批准号:
RGPIN-2015-06240 - 财政年份:2018
- 资助金额:
$ 0.7万 - 项目类别:
Discovery Grants Program - Individual
Developing Information Theoretic Tools for Multimedia Multimodal Information Processing
开发多媒体多模态信息处理的信息理论工具
- 批准号:
RGPIN-2015-06240 - 财政年份:2017
- 资助金额:
$ 0.7万 - 项目类别:
Discovery Grants Program - Individual
Developing Information Theoretic Tools for Multimedia Multimodal Information Processing
开发多媒体多模态信息处理的信息理论工具
- 批准号:
RGPIN-2015-06240 - 财政年份:2016
- 资助金额:
$ 0.7万 - 项目类别:
Discovery Grants Program - Individual
Developing Information Theoretic Tools for Multimedia Multimodal Information Processing
开发多媒体多模态信息处理的信息论工具
- 批准号:
RGPIN-2015-06240 - 财政年份:2015
- 资助金额:
$ 0.7万 - 项目类别:
Discovery Grants Program - Individual














{{item.name}}会员




