音響的テクスチャに基づくロボット・インタラクションの研究
基于声纹理的机器人交互研究
基本信息
- 批准号:17650052
- 负责人:
- 金额:$ 1.86万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Exploratory Research
- 财政年份:2005
- 资助国家:日本
- 起止时间:2005 至 2006
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
昨年度開発したSIW(Sound Imitation Word)に音高やリズムなどを加えたXMLタグによる表現を、『水の音』に対して適用し、擬音語を自動生成するシステムを構築し、そのユーザインタフェースとして階層的表現法を用いたシステムを開発した。具体的な研究項目は以下の通りである。(1)水の音を表現する音響的特徴量の決定:水の音を表現する特徴量として、音声認識で用いられるMFCC(25次元)と、音楽情報処理で用いられる33種の特徴量(音量7種・音色16種)を抽出し、予備実験により、MFCCの方が適していることが分かった。(2)水の音に対して、音響類似度に基づく木構造の自動生成:得られた特徴量に対して、PCAの適用後、階層的クラスタリング手法を適用し、音響類似度に基づく階層木を得た。この階層木は、音高が感じられるか否かで大分類され、それぞれが連続音かどうかで中分類される。小分類では、物理現象を表現する音となり、直観とあっていることが判明した。(3)水の音に対して擬音語の自動付与:擬音語表現については、語基と子音から構成し、それに対して、HMM(隠れマルコフモデル)で擬音語認識を行った。(4)階層的表示における代表音の決定:階層木の各ノードに対するラベルをとして、擬音語と代表音を提示するインタフェースを作成した。擬音語ラベルは、各グループ(クラスタ)のメンバに対して付与されたもっと多い擬音語の語基とした。音響信号は、そのグループ内の距離分布における中心に最も近い音とした。このインタフェースにより、水の音に対する探索的なインタフェースがうまく構築できた。今後、本インタフェースを用い、複数のロボットSIG2,Robovie, Keepon等が、水の音を認識し、それを擬音語で表現し、さらに、人とのインタラクションによって適切な音を探索するシステムへと発展させていく。
Last year, the SIW (Sound Imitation Word) pitch system was used to display the XML sound, the water sound was used, the sound was automatically generated, and the system was used to improve the performance. The specific "research projects" are listed below. (1) it is determined that the specific volume of the sound indicator of the water device: the special volume of the water sound meter, the MFCC (25-dimensional) of the sound sensor, the 33-minute characteristic volume (7 sound levels and 16 sound colors) of the sound equipment, and the MFCC device. (2) automatic generation of sound quality and sound similarity by automatic generation: after the PCA is used, the sound similarity and sound similarity of the device are used. If you want to make a difference in terms of pitch, pitch, sound, sound, In small categories, physical images show that you have a sound, and that you are aware of what you are doing. (3) the sound of the sound is paid by itself: the sound indicates the sound of the sound, the sound of the base sound, the sound of the sound, the sound of the HMM, the sound of the sound, the sound of the sound. (4) the expression "sound" represents the decision of the tone: the word "wood" represents the sound decision, and the word "sound" represents the sound prompt to make a decision. Please pay for the sound, the sound Sound signal, sound signal I don't know. I don't know. I don't know what to do. From now on, we will use the word SIG2,Robovie, Keepon, etc., the sound of water, the sound of the sound, the expression of the sound, the sound and the sound.
项目成果
期刊论文数量(5)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Onomatree:擬音語と木構造を併用した環境音検索インターフェース
Onomatree:使用拟声词和树结构的环境声音搜索界面
- DOI:
- 发表时间:2007
- 期刊:
- 影响因子:0
- 作者:Sarker;B.K.;Yoshiyuki Nakatani;Yoshiaki Yasumura;Tetsuro Kitahara;奥乃 博;Hiroshi G.Okuno;清水 敬太
- 通讯作者:清水 敬太
音環境理解から観たロボット聴覚
声音环境理解视角下的机器人听觉
- DOI:
- 发表时间:2007
- 期刊:
- 影响因子:0
- 作者:鈴木優;波多野賢治;吉川正俊;植村俊亮;川越恭二;K.Tsukamoto;奥乃 博
- 通讯作者:奥乃 博
Instrument Identification in Polyphonic Music: Feature Weighting to Minimize Influence of Sound Overlaps
- DOI:10.1155/2007/51979
- 发表时间:2007
- 期刊:
- 影响因子:1.9
- 作者:Tetsuro Kitahara;Masataka Goto;Kazunori Komatani;T. Ogata;HIroshi G. Okuno
- 通讯作者:Tetsuro Kitahara;Masataka Goto;Kazunori Komatani;T. Ogata;HIroshi G. Okuno
Computational Auditory Scene Analysis and Its Application to Robot Audition : Five Years Experience
计算听觉场景分析及其在机器人试镜中的应用:五年经验
- DOI:
- 发表时间:2007
- 期刊:
- 影响因子:0
- 作者:Hiroshi G. Okuno
- 通讯作者:Hiroshi G. Okuno
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
奥乃 博其他文献
ロボット聴覚技術を用いた鳥類の歌行動分析の試み - 複数のマイクロホンアレイを用いた二次元リアルタイム歌定位 -
尝试利用机器人听觉技术分析鸟类的歌唱行为 - 使用多个麦克风阵列进行二维实时歌曲定位 -
- DOI:
- 发表时间:
2017 - 期刊:
- 影响因子:0
- 作者:
鈴木 麗璽;炭谷 晋司;中臺 一博;奥乃 博 - 通讯作者:
奥乃 博
複数時期のデータを用いたNAMセグメントによる個人認証
使用多个时期的数据使用 NAM 分段进行个人身份验证
- DOI:
- 发表时间:
2007 - 期刊:
- 影响因子:0
- 作者:
Sarker;B.K.;Yoshiyuki Nakatani;Yoshiaki Yasumura;Tetsuro Kitahara;奥乃 博;Hiroshi G.Okuno;清水 敬太;服部 佑哉;田口 明裕;Tetsuya Ogata;Yuya Hattori;人工知能学会(奥乃 博);小島摩里子 - 通讯作者:
小島摩里子
Study on non-audible murmur speaker verification using multiple session data
基于多会话数据的非可闻杂音说话人验证研究
- DOI:
- 发表时间:
2006 - 期刊:
- 影响因子:0
- 作者:
Sarker;B.K.;Yoshiyuki Nakatani;Yoshiaki Yasumura;Tetsuro Kitahara;奥乃 博;Hiroshi G.Okuno;清水 敬太;服部 佑哉;田口 明裕;Tetsuya Ogata;Yuya Hattori;人工知能学会(奥乃 博);小島摩里子;小島摩里子;Mariko Kojima;Mariko Kojima - 通讯作者:
Mariko Kojima
実時間超解像ロボット聴覚システムとその複数同時音声認識への応用
实时超分辨率机器人听觉系统及其在多人同时语音识别中的应用
- DOI:
- 发表时间:
2012 - 期刊:
- 影响因子:0
- 作者:
中村 圭佑;中臺 一博;奥乃 博 - 通讯作者:
奥乃 博
神経回路モデルを用いたロボットの描画運動における発達的模倣学習
使用神经回路模型进行机器人绘图动作的发育性模仿学习
- DOI:
- 发表时间:
2013 - 期刊:
- 影响因子:0
- 作者:
望月 敬太;西出 俊;奥乃 博;尾形 哲也 - 通讯作者:
尾形 哲也
奥乃 博的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('奥乃 博', 18)}}的其他基金
Issues raised by open source in the legalization of AI and Robots
开源在人工智能和机器人合法化中引发的问题
- 批准号:
22K12210 - 财政年份:2022
- 资助金额:
$ 1.86万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
ロボット聴覚の実環境理解に向けた多面的展開
机器人听觉的多方面发展以了解真实环境
- 批准号:
24240035 - 财政年份:2012
- 资助金额:
$ 1.86万 - 项目类别:
Grant-in-Aid for Scientific Research (A)
音環境理解研究のフィールド情報学への展開
声环境理解领域信息学研究的进展
- 批准号:
21650043 - 财政年份:2009
- 资助金额:
$ 1.86万 - 项目类别:
Grant-in-Aid for Challenging Exploratory Research
二分決定グラフによる全解表現に基づく数独問題の難易度の定義と問題自動生成法
基于使用二元决策图和自动问题生成方法的完整解表示的数独问题难度级别定义
- 批准号:
19650030 - 财政年份:2007
- 资助金额:
$ 1.86万 - 项目类别:
Grant-in-Aid for Exploratory Research
音響信号記号変換に基づいたセマンティックインタラクション
基于声学信号符号变换的语义交互
- 批准号:
19024042 - 财政年份:2007
- 资助金额:
$ 1.86万 - 项目类别:
Grant-in-Aid for Scientific Research on Priority Areas
音響信号記号変換に基づいたセマンティックインタラクション
基于声学信号符号变换的语义交互
- 批准号:
18049048 - 财政年份:2006
- 资助金额:
$ 1.86万 - 项目类别:
Grant-in-Aid for Scientific Research on Priority Areas
実時間視聴覚情報統合による複数の人とのマルチモーダル・インタラクションの研究
实时视听信息集成的多人多模态交互研究
- 批准号:
16016251 - 财政年份:2004
- 资助金额:
$ 1.86万 - 项目类别:
Grant-in-Aid for Scientific Research on Priority Areas
聴覚・視覚の複数レベル実時間情報統合の研究
听觉与视觉多级实时信息集成研究
- 批准号:
15017251 - 财政年份:2003
- 资助金额:
$ 1.86万 - 项目类别:
Grant-in-Aid for Scientific Research on Priority Areas
聴覚・視覚の複数レベル実時間情報統合の研究
听觉与视觉多级实时信息集成研究
- 批准号:
14019051 - 财政年份:2002
- 资助金额:
$ 1.86万 - 项目类别:
Grant-in-Aid for Scientific Research on Priority Areas
脳のモデルを用いた自己生成音抑制機能を備えた聴覚機能の研究
利用脑模型研究具有自生声音抑制功能的听觉功能
- 批准号:
13878066 - 财政年份:2001
- 资助金额:
$ 1.86万 - 项目类别:
Grant-in-Aid for Exploratory Research
相似海外基金
オンデマンドな音環境理解のための教師なしモノラル音源分離に関する研究
用于按需声环境理解的无监督单声道声源分离研究
- 批准号:
24KJ2096 - 财政年份:2024
- 资助金额:
$ 1.86万 - 项目类别:
Grant-in-Aid for JSPS Fellows
Research on cooking support using large-scale recipe data based on sound environment understanding and dialogue management technology
基于声环境理解和对话管理技术的大规模菜谱数据烹饪支持研究
- 批准号:
18K11369 - 财政年份:2018
- 资助金额:
$ 1.86万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
音環境理解研究のフィールド情報学への展開
声环境理解领域信息学研究的进展
- 批准号:
21650043 - 财政年份:2009
- 资助金额:
$ 1.86万 - 项目类别:
Grant-in-Aid for Challenging Exploratory Research