フォーム型Web情報サービス享受のためのマルチモーダル対話インタフェースの研究
享受基于表单的网络信息服务的多模态对话界面研究
基本信息
- 批准号:13224049
- 负责人:
- 金额:--
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Scientific Research on Priority Areas (C)
- 财政年份:2001
- 资助国家:日本
- 起止时间:2001 至 无数据
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
一般に,ウェブブラウザを操作する場合,マウスなどによって操作可能なGraphical User Interface(GUI)が用いられる.しかし近年,携帯端末やPDA(携帯情報端末機器)など,マウスなどが不向きな環境からをアクセス可能となっている.ここでは,従来から検討されている音声操作インタフェースに加え,任意文字列の入力を可能にした音声入力インタフェースが有用になる.そこで,情報検索におけるWWWブラウザのフォーム入力に対し任意文字列の入力を行うための音声インタフェースについて検討した.自由な音節系列を認識するために,One-pass Viterbi法により連続音節認識を行う.日本語の文字列を入力対象とする場合,何の制約もなく自由に音節の接続を許す必要はなく,例えばHTMLを詳細に解析し,認識対象が絞り込める場合(例えば氏名入力であることがわかる場合),その情報を言語モデルとして用いることも考えられる.これを仮定して,まず氏名の情報をbigram言語モデルとして導入した.その結果,用いない場合の75.1%から78.3%に音節認識率が向上した.しかし,音節系列すべてが正しく認識できる率は認識結果の上位5位までをみても34.8%と不十分な結果であった.そこで,系列の認識結果の上位N位から,音節ごとに5-bestりストを作成してユーザに提示し,ユーザに,ペンタッチなどによって選択させる,音節選択インタフェースを構築した。これは,あるフォームの入力の際に別のウィンドウが開き,ユーザに音声入力をさせ,その認識結果から作成した音節毎の5-bestリストを表示してユーザに選択させるものである.これにより,音声入力と簡単なペンによる選択によって、入力可能となる率は71.2%となった.
In general, it is possible to operate the Graphical User Interface(GUI) when it is not operational. In recent years, portable terminals and PDAs (portable information terminal machines) have become more and more popular in the environment. This is the first time that a text string has been inserted into a text string. In this case, information search for WWW is not allowed. It is allowed to enter any text string. It is allowed to enter any text string. Free syllable series recognition,One-pass Viterbi method syllable recognition line When Japanese text columns are used as powerful objects, there is no need to restrict the freedom of syllable connection. For example, HTML is analyzed in detail, and when the cognitive object is confused (for example, when the name of the Japanese text is used as powerful as possible), there is no need to restrict the freedom of syllable connection. The name of the person is a bigram. As a result, 75.1% and 78.3% of syllable recognition rates were higher than those in the previous cases. 34.8% of the syllable series are positive, 34.8% are negative, 34.8% are negative. The upper N position of the recognition result of the series is divided into 5-best syllables, which are divided into 4 parts. For this reason, the 5-best syllable of the syllable is selected from the 5-best syllable of the syllable. For example, the sound input force is 71.2% of the total input force.
项目成果
期刊论文数量(1)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
押川洋徳: "ウェブブラウザにおける任意文字列入力を目的とした音声入力インタフェース"日本音響学会2002年春季研究発表会講演論文集. 217-218 (2002)
Hironori Oshikawa:“在网络浏览器中输入任意字符串的语音输入接口”日本声学学会 2002 年春季研究会议记录 217-218 (2002)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
北岡 教英其他文献
深層学習によるボトルネック特徴量を用いたマルチモーダル音声認識
使用深度学习使用瓶颈特征进行多模态语音识别
- DOI:
- 发表时间:
2015 - 期刊:
- 影响因子:0
- 作者:
田村 哲嗣;二宮 宏史;北岡 教英;大須賀 晋;入部 百合絵;武田 一哉;速水 悟 - 通讯作者:
速水 悟
ROSを利用したリアルタイム制御が可能な音声対話システムの構築
利用ROS构建可实时控制的语音对话系统
- DOI:
- 发表时间:
2021 - 期刊:
- 影响因子:0
- 作者:
西村 良太;森 貴大;北岡 教英 - 通讯作者:
北岡 教英
残響下音声認識評価基盤(CENSREC-4)の構築
混响语音识别评估平台(CENSREC-4)的构建
- DOI:
- 发表时间:
2008 - 期刊:
- 影响因子:0
- 作者:
西浦 敬信;中山 雅人;傳田 遊亀;北岡 教英;山本 一公;山田 武志;藤本 雅清;柘植 覚;宮島 千代美;滝口 哲也;田村 哲嗣;小川 哲司;松田 繁樹;黒岩 眞吾;武田 一哉;中村 哲 - 通讯作者:
中村 哲
講義音声ドキュメンのコンテンツ化と視聴システム
讲座音频文档内容创建及查看系统
- DOI:
- 发表时间:
2008 - 期刊:
- 影响因子:0
- 作者:
中川 聖一;富樫 慎吾;山口 優;藤井 康寿;北岡 教英 - 通讯作者:
北岡 教英
北岡 教英的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('北岡 教英', 18)}}的其他基金
高齢者を対象とした永続的に利用できるマルチモーダル対話システム基盤技術の構築
建立老年人永久使用的多模态对话系统基础技术
- 批准号:
23H00493 - 财政年份:2023
- 资助金额:
-- - 项目类别:
Grant-in-Aid for Scientific Research (A)
人間の感覚と整合する音声特徴空間の構築
符合人类感官的音频特征空间构建
- 批准号:
22K19793 - 财政年份:2022
- 资助金额:
-- - 项目类别:
Grant-in-Aid for Challenging Research (Exploratory)
タイミングに着目した協調的音声インタラクション分析とハンズフリー対話システム構築
协作语音交互分析,重点关注免提对话系统的计时和构建
- 批准号:
18049040 - 财政年份:2006
- 资助金额:
-- - 项目类别:
Grant-in-Aid for Scientific Research on Priority Areas
協調的音声対話の相槌・話者交替タイミング分析とそれに基づく応答生成法の研究
协作口语对话的合作/说话人变换时序分析及基于其的响应生成方法研究
- 批准号:
16016244 - 财政年份:2004
- 资助金额:
-- - 项目类别:
Grant-in-Aid for Scientific Research on Priority Areas
音声対話における誤り訂正発話の検出と頑健な対話システムの研究
口语对话中纠错话语的检测和鲁棒对话系统的研究
- 批准号:
16700173 - 财政年份:2004
- 资助金额:
-- - 项目类别:
Grant-in-Aid for Young Scientists (B)
ヒューマンフレンドリなマルチモーダル対話インタフェースを用いたWeb情報検索
使用人性化的多模式对话界面进行网络信息检索
- 批准号:
15017246 - 财政年份:2003
- 资助金额:
-- - 项目类别:
Grant-in-Aid for Scientific Research on Priority Areas
フォーム型Web情報サービス享受のためのマルチモーダル対話インタフェースの研究
享受基于表单的网络信息服务的多模态对话界面研究
- 批准号:
14019046 - 财政年份:2002
- 资助金额:
-- - 项目类别:
Grant-in-Aid for Scientific Research on Priority Areas
相似海外基金
脊椎疾患に対する画像・臨床データ・カルテ記載を統合したマルチモーダルなAI予後予測
整合脊柱疾病图像、临床数据和病历描述的多模态 AI 预后预测
- 批准号:
24K12366 - 财政年份:2024
- 资助金额:
-- - 项目类别:
Grant-in-Aid for Scientific Research (C)
形状理解のためのマルチモーダル学習による、敵対的摂動に頑健な画像認識モデル開発
使用多模态学习进行形状理解,开发对对抗性扰动具有鲁棒性的图像识别模型
- 批准号:
24KJ0716 - 财政年份:2024
- 资助金额:
-- - 项目类别:
Grant-in-Aid for JSPS Fellows
心眼脳連関に着目したマルチモーダル解析での循環器病・認知症個別化リスク層別法開発
利用关注心-眼-脑联系的多模态分析开发心血管疾病和痴呆症的个体化风险分层方法
- 批准号:
24K11184 - 财政年份:2024
- 资助金额:
-- - 项目类别:
Grant-in-Aid for Scientific Research (C)
統合的に説明可能なマーケティング向けマルチモーダル深層学習モデルの開発
开发可以综合解释的多模态深度学习营销模型
- 批准号:
24K16472 - 财政年份:2024
- 资助金额:
-- - 项目类别:
Grant-in-Aid for Early-Career Scientists
マルチモーダル動的界面計測による高濃度ナノセルロース成型体の超潤滑機構の解明
通过多模态动态界面测量阐明高浓度纳米纤维素成型体的超润滑机制
- 批准号:
24K17195 - 财政年份:2024
- 资助金额:
-- - 项目类别:
Grant-in-Aid for Early-Career Scientists
マルチモーダルMRIの自動解析による画像バイオマーカー探索:脳の健康状態の可視化
使用多模态 MRI 自动分析进行图像生物标志物搜索:大脑健康状态的可视化
- 批准号:
24K20730 - 财政年份:2024
- 资助金额:
-- - 项目类别:
Grant-in-Aid for Early-Career Scientists
個別化治療を支援するマルチモーダル簡易センサシステムの創製
创建支持个体化治疗的多模式简单传感器系统
- 批准号:
24K03269 - 财政年份:2024
- 资助金额:
-- - 项目类别:
Grant-in-Aid for Scientific Research (B)
脳腫瘍モデルマウスにおける覚醒下超偏極MRIとPETのマルチモーダル評価基盤の構築
脑肿瘤模型小鼠清醒超极化MRI和PET多模态评价平台的构建
- 批准号:
24K02411 - 财政年份:2024
- 资助金额:
-- - 项目类别:
Grant-in-Aid for Scientific Research (B)
視聴傾向とマルチモーダル特徴量に基づく講義アーカイブの適応的視聴体験拡張
基于观看趋势和多模态特征的讲座档案自适应观看体验增强
- 批准号:
23K28196 - 财政年份:2024
- 资助金额:
-- - 项目类别:
Grant-in-Aid for Scientific Research (B)
歩行動画と医療画像から歩行障害の原因疾患を推定するマルチモーダルAI
多模态人工智能根据步态视频和医学图像估计步态障碍的原因
- 批准号:
24KJ1559 - 财政年份:2024
- 资助金额:
-- - 项目类别:
Grant-in-Aid for JSPS Fellows














{{item.name}}会员




