音響信号記号変換に基づいたセマンティックインタラクション
基于声学信号符号变换的语义交互
基本信息
- 批准号:18049048
- 负责人:
- 金额:$ 4.16万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Scientific Research on Priority Areas
- 财政年份:2006
- 资助国家:日本
- 起止时间:2006 至 无数据
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
情報爆発という特定領域テーマに対して、音情報、すなわち、i-explosion_soundという観点から、(1)あまり使用されていない音響信号(単音音声に加えて、混合音声や音楽や環境音から音情報を取得することによる情報爆発の促進、(2)ディジタル音響信号処理による爆発する音情報から質的複雑化の軽減、という2つの側面について取り組んだ。主な研究項目は以下の通りである。(1)混合音の認識:「三話者同時発話認識の高性能化・高速化」これまで開発してきたシステムは,音源定位(steered beamforer)、音源分離(GSS,ICA)、ミッシングマスク生成、ミッシングフィーチャ理論による音声認識から構成されており、三話者が同時に発話した後、分離・認識して、応答するまでに約8秒かかっていた。これに対して、RASP-2信号処理装置を使用したシステム再構成、Flow Designerによるシステム内のモジュールインタフェースの統一、および、GAによる多数のシステムパラメータのチューニングを行い、認識応答速度の高速化(1.9秒と約4倍の高速化)、および,認識率の向上が達成できた。(2)実環境への対応と実時間処理:上記の三話者同時発話認識では、マルチメディア実験室(5m*7m)で実際の人を用いて実験が行えるレベルまで性能が向上した。また、混合音声だけでなく、ドラム音を含むポリフォニー音楽音響信号に対しても、ドラムパターンを認識し、実時間でドラム音を編集できるオーディオプレイヤーを開発した。これにより、ロボットが音楽からビートを聴き分け、トラックできるシステムの基礎技術を確立することができた。
Intelligence explosion 発 と い う domain-specific テ ー マ に し seaborne て, sound intelligence, す な わ ち, I - explosion_sound と い う 観 point か ら, (1) あ ま り use さ れ て い な い sound signal (単 sound sounds に plus え て, mixed sound や sound joy や ambient sounds か ら sound intelligence を obtain す る こ と に よ る intelligence explosion 発 の promote, (2) デ ィ ジ タ ル sound signal 処 Richard に よ る detonation 発 す る sound intelligence か ら qualitative compound 雑 change の 軽 subtraction, と い う 2 つ の side に つ い て in り group ん だ. The main な research project な is followed by である である. (1) mixed の know tone: "three words 発 words at the same time understanding の high-performance, high speed" こ れ ま で open 発 し て き た シ ス テ ム は, sound source localization (steered Beamforer), audio source separation (GSS, ICA), ミ ッ シ ン グ マ ス ク generation, ミ ッ シ ン グ フ ィ ー チ ャ theory に よ る sounds know か ら constitute さ れ て お り, three words が also に 発 words し た, separation, after understanding し て, 応 answer す る ま で に about eight seconds か か っ て い た. <s:1> れに for て, the RASP-2 signal processing device を is reconstituted using <s:1> たシステム, Flow Within the Designer に よ る シ ス テ ム の モ ジ ュ ー ル イ ン タ フ ェ ー ス の unified, お よ び, GA に よ る most の シ ス テ ム パ ラ メ ー タ の チ ュ ー ニ ン グ を い, know 応 answer speed の high speed high speed (about 4 times の と 1.9 seconds), お よ び, understanding rate の が reach upward で き た. (2) be environment へ の 応 seaborne と be time 処 : remember の three 発 words at the same time meet the speaker's words on で は, マ ル チ メ デ ィ ア be 験 chamber (5 m * 7 m) で be interstate の person を use い て be 験 が line え る レ ベ ル ま で performance が upward し た. ま た, mixed sounds だ け で な く, ド ラ を ム notes contain む ポ リ フ ォ ニ ー sound joy sound signal に し seaborne て も, ド ラ ム パ タ ー ン を know し, be time で ド ラ ム sound compiling で を き る オ ー デ ィ オ プ レ イ ヤ ー を open 発 し た. こ れ に よ り, ロ ボ ッ ト が sound joy か ら ビ ー ト を 聴 き け, ト ラ ッ ク で き る シ ス テ ム の based technology を す る こ と が で き た.
项目成果
期刊论文数量(24)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Meaning-Game-based Centering Model with Statistical Definition of Utility of Referential Expression and Its Verification
基于意义博弈的指称表达效用统计定义的中心模型及其验证
- DOI:
- 发表时间:2007
- 期刊:
- 影响因子:0
- 作者:Naohiro Hayashibara;Makoto Takizawa;Jean-Marc Valin;神田 直之;Kazuyoshi Yoshii;Tetsuro Kitahara;山本 俊一;Kazuyoshi Yoshi;Tetsuro Kitahara;山本 俊一;奥乃 博;Shun Shiramatsu
- 通讯作者:Shun Shiramatsu
Improving Speech Recognition of Two Simultaneous Speech Signals by Integrating ICA BSS and Automatic Missing Feature
通过集成 ICA BSS 和自动丢失功能改进两个同时语音信号的语音识别
- DOI:
- 发表时间:2006
- 期刊:
- 影响因子:0
- 作者:Naohiro Hayashibara;Makoto Takizawa;Jean-Marc Valin;神田 直之;Kazuyoshi Yoshii;Tetsuro Kitahara;山本 俊一;Kazuyoshi Yoshi;Tetsuro Kitahara;山本 俊一;奥乃 博;Shun Shiramatsu;Hiroshi G. Okuno;北原 鉄朗;Tetsuro Kitahara;Hiromasa Fujihara;Ryu Takeda;Shun'ichi Yamamoto;Kazuhiro Nakadai;Hiromasa Fujihara;Ryu Takeda
- 通讯作者:Ryu Takeda
Speaker Identification under Noisy Environments by using Harmonic Structure Extraction and Reliable Frame Weighting
使用谐波结构提取和可靠的帧加权在噪声环境下识别说话人
- DOI:
- 发表时间:2006
- 期刊:
- 影响因子:0
- 作者:Naohiro Hayashibara;Makoto Takizawa;Jean-Marc Valin;神田 直之;Kazuyoshi Yoshii;Tetsuro Kitahara;山本 俊一;Kazuyoshi Yoshi;Tetsuro Kitahara;山本 俊一;奥乃 博;Shun Shiramatsu;Hiroshi G. Okuno;北原 鉄朗;Tetsuro Kitahara;Hiromasa Fujihara;Ryu Takeda;Shun'ichi Yamamoto;Kazuhiro Nakadai;Hiromasa Fujihara
- 通讯作者:Hiromasa Fujihara
多重奏を対象とした音源同定 : 混合音テンプレートを用いた音の重なりに頑健な特徴量への重みづけおよび音楽的文脈の利用
多重声源识别:使用混合声音模板和音乐背景对对声音重叠具有鲁棒性的特征进行加权
- DOI:
- 发表时间:2006
- 期刊:
- 影响因子:0
- 作者:大村吉幸;瀬田尚子;長久保晶彦;國吉康夫;北原 鉄朗 他
- 通讯作者:北原 鉄朗 他
Real-Time Tracking of Multiple Sound Sources by Integration of In-Room and Robot-Embedded Microphone Arrays
- DOI:10.1109/iros.2006.281737
- 发表时间:2006-10
- 期刊:
- 影响因子:0
- 作者:K. Nakadai;H. Nakajima;M. Murase;HIroshi G. Okuno;Yuji Hasegawa;H. Tsujino
- 通讯作者:K. Nakadai;H. Nakajima;M. Murase;HIroshi G. Okuno;Yuji Hasegawa;H. Tsujino
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
奥乃 博其他文献
ロボット聴覚技術を用いた鳥類の歌行動分析の試み - 複数のマイクロホンアレイを用いた二次元リアルタイム歌定位 -
尝试利用机器人听觉技术分析鸟类的歌唱行为 - 使用多个麦克风阵列进行二维实时歌曲定位 -
- DOI:
- 发表时间:
2017 - 期刊:
- 影响因子:0
- 作者:
鈴木 麗璽;炭谷 晋司;中臺 一博;奥乃 博 - 通讯作者:
奥乃 博
複数時期のデータを用いたNAMセグメントによる個人認証
使用多个时期的数据使用 NAM 分段进行个人身份验证
- DOI:
- 发表时间:
2007 - 期刊:
- 影响因子:0
- 作者:
Sarker;B.K.;Yoshiyuki Nakatani;Yoshiaki Yasumura;Tetsuro Kitahara;奥乃 博;Hiroshi G.Okuno;清水 敬太;服部 佑哉;田口 明裕;Tetsuya Ogata;Yuya Hattori;人工知能学会(奥乃 博);小島摩里子 - 通讯作者:
小島摩里子
Study on non-audible murmur speaker verification using multiple session data
基于多会话数据的非可闻杂音说话人验证研究
- DOI:
- 发表时间:
2006 - 期刊:
- 影响因子:0
- 作者:
Sarker;B.K.;Yoshiyuki Nakatani;Yoshiaki Yasumura;Tetsuro Kitahara;奥乃 博;Hiroshi G.Okuno;清水 敬太;服部 佑哉;田口 明裕;Tetsuya Ogata;Yuya Hattori;人工知能学会(奥乃 博);小島摩里子;小島摩里子;Mariko Kojima;Mariko Kojima - 通讯作者:
Mariko Kojima
実時間超解像ロボット聴覚システムとその複数同時音声認識への応用
实时超分辨率机器人听觉系统及其在多人同时语音识别中的应用
- DOI:
- 发表时间:
2012 - 期刊:
- 影响因子:0
- 作者:
中村 圭佑;中臺 一博;奥乃 博 - 通讯作者:
奥乃 博
神経回路モデルを用いたロボットの描画運動における発達的模倣学習
使用神经回路模型进行机器人绘图动作的发育性模仿学习
- DOI:
- 发表时间:
2013 - 期刊:
- 影响因子:0
- 作者:
望月 敬太;西出 俊;奥乃 博;尾形 哲也 - 通讯作者:
尾形 哲也
奥乃 博的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('奥乃 博', 18)}}的其他基金
Issues raised by open source in the legalization of AI and Robots
开源在人工智能和机器人合法化中引发的问题
- 批准号:
22K12210 - 财政年份:2022
- 资助金额:
$ 4.16万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
ロボット聴覚の実環境理解に向けた多面的展開
机器人听觉的多方面发展以了解真实环境
- 批准号:
24240035 - 财政年份:2012
- 资助金额:
$ 4.16万 - 项目类别:
Grant-in-Aid for Scientific Research (A)
音環境理解研究のフィールド情報学への展開
声环境理解领域信息学研究的进展
- 批准号:
21650043 - 财政年份:2009
- 资助金额:
$ 4.16万 - 项目类别:
Grant-in-Aid for Challenging Exploratory Research
二分決定グラフによる全解表現に基づく数独問題の難易度の定義と問題自動生成法
基于使用二元决策图和自动问题生成方法的完整解表示的数独问题难度级别定义
- 批准号:
19650030 - 财政年份:2007
- 资助金额:
$ 4.16万 - 项目类别:
Grant-in-Aid for Exploratory Research
音響信号記号変換に基づいたセマンティックインタラクション
基于声学信号符号变换的语义交互
- 批准号:
19024042 - 财政年份:2007
- 资助金额:
$ 4.16万 - 项目类别:
Grant-in-Aid for Scientific Research on Priority Areas
音響的テクスチャに基づくロボット・インタラクションの研究
基于声纹理的机器人交互研究
- 批准号:
17650052 - 财政年份:2005
- 资助金额:
$ 4.16万 - 项目类别:
Grant-in-Aid for Exploratory Research
実時間視聴覚情報統合による複数の人とのマルチモーダル・インタラクションの研究
实时视听信息集成的多人多模态交互研究
- 批准号:
16016251 - 财政年份:2004
- 资助金额:
$ 4.16万 - 项目类别:
Grant-in-Aid for Scientific Research on Priority Areas
聴覚・視覚の複数レベル実時間情報統合の研究
听觉与视觉多级实时信息集成研究
- 批准号:
15017251 - 财政年份:2003
- 资助金额:
$ 4.16万 - 项目类别:
Grant-in-Aid for Scientific Research on Priority Areas
聴覚・視覚の複数レベル実時間情報統合の研究
听觉与视觉多级实时信息集成研究
- 批准号:
14019051 - 财政年份:2002
- 资助金额:
$ 4.16万 - 项目类别:
Grant-in-Aid for Scientific Research on Priority Areas
脳のモデルを用いた自己生成音抑制機能を備えた聴覚機能の研究
利用脑模型研究具有自生声音抑制功能的听觉功能
- 批准号:
13878066 - 财政年份:2001
- 资助金额:
$ 4.16万 - 项目类别:
Grant-in-Aid for Exploratory Research
相似海外基金
オンデマンドな音環境理解のための教師なしモノラル音源分離に関する研究
用于按需声环境理解的无监督单声道声源分离研究
- 批准号:
24KJ2096 - 财政年份:2024
- 资助金额:
$ 4.16万 - 项目类别:
Grant-in-Aid for JSPS Fellows
音環境理解研究のフィールド情報学への展開
声环境理解领域信息学研究的进展
- 批准号:
21650043 - 财政年份:2009
- 资助金额:
$ 4.16万 - 项目类别:
Grant-in-Aid for Challenging Exploratory Research