音響信号記号変換に基づいたセマンティックインタラクション
基于声学信号符号变换的语义交互
基本信息
- 批准号:19024042
- 负责人:
- 金额:$ 8.96万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Scientific Research on Priority Areas
- 财政年份:2007
- 资助国家:日本
- 起止时间:2007 至 2008
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
(1)「音を聞き分ける」音の量的爆発促進技術 :使用環境, 設置条件に関する事前知識量を極力減らした実時間ロボット聴覚ソフトウエア「HARK」を5月から公開を始め, 11月に京都大学で, 12月には韓国KISTで無料講習会を開催した. 今年度開発したHARKの新機能は, 従来の2値マスクから連続値のソフトマスクによるミッシングフィーチャマスク自動生成法であり, 音声認識率が10%程度向上した. また, ロボットの自己生成音を抑制するICAによるセミブラインド分離法も開発し, 音楽ロボットに応用した. すなわち, ロボットが自分の出す歌声やハミングの影響を抑制し, 音楽だけを聞いて実時間でビート認識する音楽ロボットを開発した. IEEE/RSJ IROS-2008発表の2本の論文が, Award for Entertainment Robots and Systems (NTF Award) Nomination Finalist 4件中の2件に選ばれた.(2)「音を見せる」音の質的複雑さ軽減技術 :HARKと3D viewerを組み合わせた音環境可視化システムに, 既開発の俯瞰モードでの機能拡充,及び, 没入感モードでの「音アウエアネス」提示機能を開発した. 前者は, 音環境の早送り提示, 音声認識結果のカラオケ風表示, 及び, 機能の洗練化である. 後者に対しては, 音の気付きという音アウエアネスを向上させるには, 単なる高忠実音場再生ではなく, 分離合成というプロセスが不可欠であるという観点から取り組んだ. 人の動きは, ディスプレイ上に設置したステレオカメラで取得した画像データから色情報を用いた最近傍探索で認識している. 音の没入モードでの提示に分離合成というアプローチは他に例がなく, 今後の展開の可能性が示唆された.
(1)The explosion promotion technology of sound quantity: the use environment, the setting conditions, the amount of prior knowledge, the maximum reduction of the time, the opening of the HARK in May, the Kyoto University in November, and the KIST in Korea in December. HARK's new function, which was launched this year, is to increase the voice recognition rate by 10%. For example, if the sound is generated, the ICA will be able to separate the sound from the sound. The sound of the song is heard, and the sound of the song is heard. IEEE/RSJ IROS-2008 Publication of 2 of these papers, Award for Entertainment Robots and Systems (NTF Award) Nomination Finalist 2 out of 4 selected. (2)Sound quality reduction technology:HARK and 3D viewer are combined to visualize the sound environment. The function of overlooking the sound environment is developed, and the function of "sound loss" is developed. The former, sound environment early send prompt, sound recognition result The latter is opposite to the former, and the former is opposite to the latter, and the latter is opposite to the former, and the latter is opposite to the former. People move, they move. The sound of the sound into the bottom of the prompt separation synthesis and other examples, the possibility of future development is shown.
项目成果
期刊论文数量(82)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
マルチドメイン音声対話システムにおける対話履歴を利用したドメイン選択
多域口语对话系统中使用对话历史的域选择
- DOI:
- 发表时间:2007
- 期刊:
- 影响因子:0
- 作者:Haruki Nagata;Shin'ichi Toda;Hiroshi Itsumura;Kenji Koyama;Yasunori Saito;Masanori Suzuki;Noboru Takahashi;神田 直之 他
- 通讯作者:神田 直之 他
独立成分分析に基づく適応フィルタのロボット聴覚への応用
基于独立分量分析的自适应滤波器在机器人听觉中的应用
- DOI:
- 发表时间:2008
- 期刊:
- 影响因子:0
- 作者:武田龍;中臺一博;駒谷和範;尾形哲也;奥乃博
- 通讯作者:奥乃博
楽譜情報を援用した多重奏音楽音響信号の音源分離と調波・非調波統合モデルの制約付パラメータ推定の同時実現
利用乐谱信息同时实现多个音乐声信号的源分离和谐波/非谐波综合模型的约束参数估计
- DOI:
- 发表时间:2008
- 期刊:
- 影响因子:0
- 作者:糸山 克寿;後藤 真孝;駒谷 和範;尾形 哲也、奥乃 博
- 通讯作者:尾形 哲也、奥乃 博
移動型および静止型マイクロホンアレイ統合による複数移動音源追跡
通过移动和固定麦克风阵列集成进行多移动声源跟踪
- DOI:
- 发表时间:2007
- 期刊:
- 影响因子:0
- 作者:中臺 一博;中島 弘史;村瀬 昌満;奥乃 博;長谷川 雄二;辻野 広司
- 通讯作者:辻野 広司
Evaluation of Two Simultaneous Continous Speech Recognition with ICA BSS and MTF-based ASR
使用 ICA BSS 和基于 MTF 的 ASR 进行两个同时连续语音识别的评估
- DOI:
- 发表时间:2007
- 期刊:
- 影响因子:0
- 作者:Ryu Takeda;Shun' ichi Yamamoto;Kazunori Komatani;Tetsuya Ogata;Hiroshi G. Okuno
- 通讯作者:Hiroshi G. Okuno
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
奥乃 博其他文献
ロボット聴覚技術を用いた鳥類の歌行動分析の試み - 複数のマイクロホンアレイを用いた二次元リアルタイム歌定位 -
尝试利用机器人听觉技术分析鸟类的歌唱行为 - 使用多个麦克风阵列进行二维实时歌曲定位 -
- DOI:
- 发表时间:
2017 - 期刊:
- 影响因子:0
- 作者:
鈴木 麗璽;炭谷 晋司;中臺 一博;奥乃 博 - 通讯作者:
奥乃 博
複数時期のデータを用いたNAMセグメントによる個人認証
使用多个时期的数据使用 NAM 分段进行个人身份验证
- DOI:
- 发表时间:
2007 - 期刊:
- 影响因子:0
- 作者:
Sarker;B.K.;Yoshiyuki Nakatani;Yoshiaki Yasumura;Tetsuro Kitahara;奥乃 博;Hiroshi G.Okuno;清水 敬太;服部 佑哉;田口 明裕;Tetsuya Ogata;Yuya Hattori;人工知能学会(奥乃 博);小島摩里子 - 通讯作者:
小島摩里子
Study on non-audible murmur speaker verification using multiple session data
基于多会话数据的非可闻杂音说话人验证研究
- DOI:
- 发表时间:
2006 - 期刊:
- 影响因子:0
- 作者:
Sarker;B.K.;Yoshiyuki Nakatani;Yoshiaki Yasumura;Tetsuro Kitahara;奥乃 博;Hiroshi G.Okuno;清水 敬太;服部 佑哉;田口 明裕;Tetsuya Ogata;Yuya Hattori;人工知能学会(奥乃 博);小島摩里子;小島摩里子;Mariko Kojima;Mariko Kojima - 通讯作者:
Mariko Kojima
実時間超解像ロボット聴覚システムとその複数同時音声認識への応用
实时超分辨率机器人听觉系统及其在多人同时语音识别中的应用
- DOI:
- 发表时间:
2012 - 期刊:
- 影响因子:0
- 作者:
中村 圭佑;中臺 一博;奥乃 博 - 通讯作者:
奥乃 博
神経回路モデルを用いたロボットの描画運動における発達的模倣学習
使用神经回路模型进行机器人绘图动作的发育性模仿学习
- DOI:
- 发表时间:
2013 - 期刊:
- 影响因子:0
- 作者:
望月 敬太;西出 俊;奥乃 博;尾形 哲也 - 通讯作者:
尾形 哲也
奥乃 博的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('奥乃 博', 18)}}的其他基金
Issues raised by open source in the legalization of AI and Robots
开源在人工智能和机器人合法化中引发的问题
- 批准号:
22K12210 - 财政年份:2022
- 资助金额:
$ 8.96万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
ロボット聴覚の実環境理解に向けた多面的展開
机器人听觉的多方面发展以了解真实环境
- 批准号:
24240035 - 财政年份:2012
- 资助金额:
$ 8.96万 - 项目类别:
Grant-in-Aid for Scientific Research (A)
音環境理解研究のフィールド情報学への展開
声环境理解领域信息学研究的进展
- 批准号:
21650043 - 财政年份:2009
- 资助金额:
$ 8.96万 - 项目类别:
Grant-in-Aid for Challenging Exploratory Research
二分決定グラフによる全解表現に基づく数独問題の難易度の定義と問題自動生成法
基于使用二元决策图和自动问题生成方法的完整解表示的数独问题难度级别定义
- 批准号:
19650030 - 财政年份:2007
- 资助金额:
$ 8.96万 - 项目类别:
Grant-in-Aid for Exploratory Research
音響信号記号変換に基づいたセマンティックインタラクション
基于声学信号符号变换的语义交互
- 批准号:
18049048 - 财政年份:2006
- 资助金额:
$ 8.96万 - 项目类别:
Grant-in-Aid for Scientific Research on Priority Areas
音響的テクスチャに基づくロボット・インタラクションの研究
基于声纹理的机器人交互研究
- 批准号:
17650052 - 财政年份:2005
- 资助金额:
$ 8.96万 - 项目类别:
Grant-in-Aid for Exploratory Research
実時間視聴覚情報統合による複数の人とのマルチモーダル・インタラクションの研究
实时视听信息集成的多人多模态交互研究
- 批准号:
16016251 - 财政年份:2004
- 资助金额:
$ 8.96万 - 项目类别:
Grant-in-Aid for Scientific Research on Priority Areas
聴覚・視覚の複数レベル実時間情報統合の研究
听觉与视觉多级实时信息集成研究
- 批准号:
15017251 - 财政年份:2003
- 资助金额:
$ 8.96万 - 项目类别:
Grant-in-Aid for Scientific Research on Priority Areas
聴覚・視覚の複数レベル実時間情報統合の研究
听觉与视觉多级实时信息集成研究
- 批准号:
14019051 - 财政年份:2002
- 资助金额:
$ 8.96万 - 项目类别:
Grant-in-Aid for Scientific Research on Priority Areas
脳のモデルを用いた自己生成音抑制機能を備えた聴覚機能の研究
利用脑模型研究具有自生声音抑制功能的听觉功能
- 批准号:
13878066 - 财政年份:2001
- 资助金额:
$ 8.96万 - 项目类别:
Grant-in-Aid for Exploratory Research
相似海外基金
音響信号記号変換に基づいたセマンティックインタラクション
基于声学信号符号变换的语义交互
- 批准号:
18049048 - 财政年份:2006
- 资助金额:
$ 8.96万 - 项目类别:
Grant-in-Aid for Scientific Research on Priority Areas