セマンティックディジタルアーカイブのための音声・映像・言語の統合的処理
音频、视频、语言一体化处理,实现语义数字档案
基本信息
- 批准号:15630003
- 负责人:
- 金额:$ 2.18万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Scientific Research (C)
- 财政年份:2003
- 资助国家:日本
- 起止时间:2003 至 无数据
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
特定領域申請のための計画をすすめた。中川は、6月に開催された特定領域研究「韻律と音声処理」の会合および7月に開催された情報処理学会音声言語情報処理研究会の席上で、研究計画を披露し、多くの方から意見を求めた。その検討結果と各大学での研究計画設定のための会合を経て、平成15年8月5,6日に代表者、分担者15名で各自の研究状況、世界的観点から各自の研究の位置づけ、これからの研究内容に対する意見交換を行った。これにより、以下の3研究項目と8研究計画班を決定した。さらに、9月4日、9月19日、10月25日に本領域申請のための打ち合わせ会議を行うなど、活発な情報交換および意見のとりまとめを行ってきた。●研究項目A01:セマンティックアーカイブ構築のためのセンシング・インデキシング・アノテーション講義・講演、会議・ミーティング、テレビ放送、Web上の映像などの膨大なマルチメディア情報を内容まで立ち入って高度に利用できるように、情報を有効に観測し(センシング)、インデックスや注釈(アノテーション)を付ける(半)自動化手法を研究する。●研究項目A02:セマンティックアーカイブの検索・要約・質問応答セマンティックデジタルアーカイブからユーザにとって必要な情報を音声やテキスト及び映像などの統合処理により検索し要約する手法、および全世界の百科事典の塊のような膨大なアーカイブに質問し答えを見出す手法を研究する。●研究項目A03:セマンティックアーカイブの活用のためのコンテンツ生成・適応セマンティックアーカイブをコンテンツの集合と考え、これらを有機的に結合して、ユーザに適した新しいコンテンツを生成する手法、および多様なユーザが多様な情報端末から手軽にアーカイブを利用できる手法を研究する。
Apply for application in a specific field. In June, Nakagawa began to urge people to conduct research in specific fields. In July, they began to urge the academy to express their feelings and feelings at the conference, to study the plan to disclose information, and to ask for opinions from multiple parties. The results show that the research program settings of each university will meet each other, 15 representatives and contributors in Pingcheng on August 5, 6, 15, their respective research status, the location of their own research sites in the world, and the exchange of opinions on the contents of the study. The following 3 research projects and 8 research projects will be decided by the research program class. On September 4, September 19 and October 25, this field applies for approval to hold meetings and exchange opinions and opinions on September 4, September 19 and October 25. Research project A01: research project A01:
项目成果
期刊论文数量(10)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
宇津呂武仁: "複数の大語彙連続音声認識モデルの出力の共通部分を用いた高信頼度部分の推定"電子情報通信学会論文誌. Vol.J86DII, No.7. 974-987 (2003)
Takehito Utsuro:“使用多个大词汇量连续语音识别模型的输出的公共部分来估计高可靠性部分”,电子信息和通信工程师协会学报,第 J86DII 卷,第 974-987 期(2003 年)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
Chiori Hori: "A Statistical Approach to Automatic Speech Summarization"Journal on Applied Signal Processing. Vol.23, No.2. 128-139 (2003)
Chiori Hori:“自动语音摘要的统计方法”应用信号处理杂志。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
Takashi Masuyama: "Two Step POS Selection for SVM based Text Categorization"IEICE Transaction of Special Issue on Information Processing Technology for Web Utilization. Vol.87, No.2(to appear). 373-379 (2004)
Takashi Masuyama:“基于 SVM 的文本分类的两步 POS 选择”IEICE 交易关于网络利用信息处理技术的特刊。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
Tatsuya Kawahara: "Automatic Indexing of Lecture Presentations using Unsupervised Learning of Presumed Discourse Markers"IEEE Trans.Audio & Speech Processing. (accepted for publication).
Tatsuya Kawahara:“使用假定话语标记的无监督学习自动索引讲座演示”IEEE Trans.Audio
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
新田直子: "放送型スポーツ映像の意味内容獲得のためのストーリー分割法"電子情報通信学会論文誌(D-II). Vol.86DII, No.8. 1222-1233 (2003)
Naoko Nitta:“获取广播体育视频语义内容的故事分割方法”,电子、信息和通信工程师学会会刊(D-II),第 86 卷,第 1222-1233 期(2003 年)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
中川 聖一其他文献
A Study of Speaker Identification Using Phoneme-lnformation
利用音素信息识别说话人的研究
- DOI:
- 发表时间:
2008 - 期刊:
- 影响因子:0
- 作者:
中川 聖一;富樫 慎吾;山口 優;藤井 康寿;北岡 教英;Katsuyuki Obayashi - 通讯作者:
Katsuyuki Obayashi
講義音声ドキュメンのコンテンツ化と視聴システム
讲座音频文档内容创建及查看系统
- DOI:
- 发表时间:
2008 - 期刊:
- 影响因子:0
- 作者:
中川 聖一;富樫 慎吾;山口 優;藤井 康寿;北岡 教英 - 通讯作者:
北岡 教英
中川 聖一的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('中川 聖一', 18)}}的其他基金
実世界環境下における遠隔発話の音声認識と話者認識およびインデックス化に関する研究
现实环境中的语音识别、说话人识别和远程语音索引研究
- 批准号:
19650040 - 财政年份:2007
- 资助金额:
$ 2.18万 - 项目类别:
Grant-in-Aid for Challenging Exploratory Research
音声言語処理技術と学習者モデルを用いた語学学習システムの研究
利用口语处理技术和学习者模型的语言学习系统研究
- 批准号:
12040104 - 财政年份:2000
- 资助金额:
$ 2.18万 - 项目类别:
Grant-in-Aid for Scientific Research on Priority Areas
外国語コミュニケーション能力の総合的な養成研究
外语交际能力综合训练研究
- 批准号:
12040103 - 财政年份:2000
- 资助金额:
$ 2.18万 - 项目类别:
Grant-in-Aid for Scientific Research on Priority Areas
音声・言語・画像情報の統合化による概念の獲得に関する研究
整合语音、语言、图像信息的概念获取研究
- 批准号:
05213209 - 财政年份:1993
- 资助金额:
$ 2.18万 - 项目类别:
Grant-in-Aid for Scientific Research on Priority Areas
音声・言語・画像情報の統合化による概念の獲得に関する研究
整合语音、语言、图像信息的概念获取研究
- 批准号:
04229209 - 财政年份:1992
- 资助金额:
$ 2.18万 - 项目类别:
Grant-in-Aid for Scientific Research on Priority Areas
音声・言語・画像情報の統合化による概念の獲得に関する研究
整合音频、语言、图像信息的概念获取研究
- 批准号:
03245209 - 财政年份:1991
- 资助金额:
$ 2.18万 - 项目类别:
Grant-in-Aid for Scientific Research on Priority Areas
音声情報と画像情報の統合化による概念の獲得に関する研究
音频与图像信息融合的概念获取研究
- 批准号:
02805045 - 财政年份:1990
- 资助金额:
$ 2.18万 - 项目类别:
Grant-in-Aid for General Scientific Research (C)
音声・画像の視聴覚情報のシンボル記述化による自然言語文法の帰納的学習法の研究
利用音频、图像等视听信息的符号描述进行自然语言语法归纳学习方法研究
- 批准号:
01550284 - 财政年份:1989
- 资助金额:
$ 2.18万 - 项目类别:
Grant-in-Aid for General Scientific Research (C)
高精度音声認識手法による音声の超極低ビットテキストファイル化・知的符号化合成方式
利用高精度语音识别方法将语音转换为超低比特文本文件及智能编码合成方法
- 批准号:
63550272 - 财政年份:1988
- 资助金额:
$ 2.18万 - 项目类别:
Grant-in-Aid for General Scientific Research (C)
音節セグメントの同定に基づく音声の超極低ビット符号化合成方式の研究
基于音节段识别的语音超低比特编码合成方法研究
- 批准号:
62550243 - 财政年份:1987
- 资助金额:
$ 2.18万 - 项目类别:
Grant-in-Aid for General Scientific Research (C)
相似海外基金
自然画像・音声の即時認知と感性評価を決定する視聴覚テクスチャ空間の構築
构建决定自然图像和声音的即时识别和情感评价的视听纹理空间
- 批准号:
23K25751 - 财政年份:2024
- 资助金额:
$ 2.18万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
画像認識と音声認識の複合AIによる災害状況認識ユニットの基礎研究
图像识别与语音识别相结合的AI灾情识别单元基础研究
- 批准号:
23K23017 - 财政年份:2024
- 资助金额:
$ 2.18万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
画像・音声認識と料理データベースによる食事記録システム開発、及び疫学研究での応用
基于图像/语音识别和烹饪数据库的用餐记录系统的开发及其在流行病学研究中的应用
- 批准号:
23K20170 - 财政年份:2024
- 资助金额:
$ 2.18万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
顔画像から声を再現するクロスモーダルボイスクローニング音声合成技術の研究
从面部图像再现声音的跨模态克隆语音合成技术研究
- 批准号:
24K02959 - 财政年份:2024
- 资助金额:
$ 2.18万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
自然画像・音声の即時認知と感性評価を決定する視聴覚テクスチャ空間の構築
构建决定自然图像和声音的即时识别和情感评价的视听纹理空间
- 批准号:
23H01054 - 财政年份:2023
- 资助金额:
$ 2.18万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
画像認識と音声認識の複合AIによる災害状況認識ユニットの基礎研究
图像识别与语音识别相结合的AI灾情识别单元基础研究
- 批准号:
22H01749 - 财政年份:2022
- 资助金额:
$ 2.18万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
画像と音声の相補的利用を導入した被災者探索用UAVの開発
开发图像和声音相辅相成的搜寻灾民无人机
- 批准号:
21K04592 - 财政年份:2021
- 资助金额:
$ 2.18万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
画像・音声認識と料理データベースによる食事記録システム開発、及び疫学研究での応用
基于图像/语音识别和烹饪数据库的用餐记录系统的开发及其在流行病学研究中的应用
- 批准号:
20H01615 - 财政年份:2020
- 资助金额:
$ 2.18万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
Social Media, Violence, and Social Isolation Among At-Risk Adolescents: Exploring Ground Truth
高危青少年中的社交媒体、暴力和社会孤立:探索真相
- 批准号:
10265597 - 财政年份:2020
- 资助金额:
$ 2.18万 - 项目类别:
Social Media, Violence, and Social Isolation Among At-Risk Adolescents: Exploring Ground Truth
高危青少年中的社交媒体、暴力和社会孤立:探索真相
- 批准号:
10461047 - 财政年份:2020
- 资助金额:
$ 2.18万 - 项目类别: