ReBabel - deep learning cross-lingual vocal characteristic matching with automated lip-sync
ReBabel - 深度学习跨语言声音特征与自动唇形同步匹配
基本信息
- 批准号:10014754
- 负责人:
- 金额:$ 32.65万
- 依托单位:
- 依托单位国家:英国
- 项目类别:Collaborative R&D
- 财政年份:2022
- 资助国家:英国
- 起止时间:2022 至 无数据
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
At £2.1bn/annum (2019) and 5.9% CAGR (Marketwatch.com) there is growing demand for foreign-language production, driven by brand globalisation, streaming services (Netflix/Amazon Prime), social platforms (YouTube/Twitch) and the ubiquity of smart phones. Europe accounts for ~22% of the global dubbing industry.However, while audience data and surveys both show a preference for dubbed content over subtitles, the use of cross-lingual dubbing is limited by high costs and long production times. Other challenges include:* The difficulty of adapting scripts and the need for multiple takes so Voice Actors (VAs) can match lip-synch. Poor lip-synch is unappealing and sometimes comical.* Casting. Ideally a close match to the original actor is sought but is constrained by time and costs that may even result in a "best-fit" approach and/or reusing VAs.* Aesthetic incoherence arising from a voice/body mismatch.* Time bottlenecks when VAs associated with multiple stars have limited availability.Producers must therefore balance the additional cost of a dub and the potential for increased sales against offering subtitles only.**Vision for the project**In this project we will build on our Speech-Synthesis/Deep Learning (DL) expertise to create ReBabel, an innovative and unique new cross-lingual dubbing tool that lowers costs, improves quality and addresses the challenges via key innovations:1. Cross-lingual voice-morphing: Changing a foreign-language performance to sound like it was given by the original performer. Our unique technology enables speech-to-speech synthesis (transforming one voice to another in a different language) by utilising our unique neural network model that transforms speech into concepts and back. Our conceptual abstractions convey both literal textual meaning/information, as well as the paralinguistics (sometimes called vocalics) information that can modify meaning, give nuance, and convey emotion and can be edited to apply the desired transformations.2. Audio-LipSync: AI-driven manual/automatic re-synchronising of the audio to match the lip movements in the video. This will involve direct modification of the audio channel to match the lips of the actor, while conveying the vocal message/content/performance that is expected.ReBabel will form a module within our in-development Voice Studio suite that will initially offer "Photoshop for Voice" to professional production companies before eventual consumer/prosumer versions.**Key objectives*** Development of a fast, accurate and high-quality Machine Learning (ML) model and supporting data structures.* Implementation of DL for key international languages to enable voice/video lip-sync.* Testing and validation of model results.* Achieving a low bar for user's technical knowledge (usability).
在21亿英镑/年(2019年)和5.9%的复合年增长率(Marketwatch.com)下,对外语制作的需求不断增长,这是由品牌全球化,流媒体服务(Netflix/亚马逊Prime),社交平台(YouTube/Twitch)和智能手机的普及所推动的。欧洲约占全球配音行业的22%。然而,尽管观众数据和调查都显示配音内容比字幕更受欢迎,但跨语言配音的使用受到成本高和制作时间长的限制。其他挑战包括:* 改编脚本的难度和需要多次拍摄,以便配音演员(VA)可以匹配对口型。糟糕的对口型很不吸引人,有时还很滑稽。铸造理想情况下,寻求与原始参与者的密切匹配,但受到时间和成本的限制,甚至可能导致“最适合”的方法和/或重复使用VA。声音/身体不匹配导致的美学不连贯。当与多位明星相关的VA的可用性有限时,时间瓶颈。因此,制片人必须平衡配音的额外成本和增加销售的潜力,而不是只提供字幕。**项目愿景 ** 在此项目中,我们将利用语音合成/深度学习(DL)专业知识,创建ReBabel,这是一种创新且独特的跨语言配音工具,可通过关键创新降低成本,提高质量并应对挑战:1.跨语言变声:改变外语表演,使其听起来像是原表演者的声音。我们独特的技术通过利用我们独特的神经网络模型将语音转换为概念并返回,从而实现语音到语音合成(将一种语音转换为另一种不同语言的语音)。我们的概念抽象既传达了文字的文本意义/信息,也传达了可以修改意义、赋予细微差别和传达情感的非语言学(有时称为声乐)信息,并且可以进行编辑以应用所需的转换。Audio-LipSync:人工智能驱动的手动/自动音频重新同步,以匹配视频中的嘴唇运动。这将涉及直接修改音频通道以匹配演员的嘴唇,同时传达预期的声音信息/内容/表演。ReBabel将在我们正在开发的Voice Studio套件中形成一个模块,最初将在最终的消费者/专业消费者版本之前向专业制作公司提供“Photoshop for Voice”。**关键目标 * 开发快速、准确和高质量的机器学习(ML)模型和支持数据结构。为主要国际语言实施DL,以实现语音/视频对口型。模型结果的测试和验证。实现用户技术知识(可用性)的低标准。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
其他文献
吉治仁志 他: "トランスジェニックマウスによるTIMP-1の線維化促進機序"最新医学. 55. 1781-1787 (2000)
Hitoshi Yoshiji 等:“转基因小鼠中 TIMP-1 的促纤维化机制”现代医学 55. 1781-1787 (2000)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
LiDAR Implementations for Autonomous Vehicle Applications
- DOI:
- 发表时间:
2021 - 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
吉治仁志 他: "イラスト医学&サイエンスシリーズ血管の分子医学"羊土社(渋谷正史編). 125 (2000)
Hitoshi Yoshiji 等人:“血管医学与科学系列分子医学图解”Yodosha(涉谷正志编辑)125(2000)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
Effect of manidipine hydrochloride,a calcium antagonist,on isoproterenol-induced left ventricular hypertrophy: "Yoshiyama,M.,Takeuchi,K.,Kim,S.,Hanatani,A.,Omura,T.,Toda,I.,Akioka,K.,Teragaki,M.,Iwao,H.and Yoshikawa,J." Jpn Circ J. 62(1). 47-52 (1998)
钙拮抗剂盐酸马尼地平对异丙肾上腺素引起的左心室肥厚的影响:“Yoshiyama,M.,Takeuchi,K.,Kim,S.,Hanatani,A.,Omura,T.,Toda,I.,Akioka,
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('', 18)}}的其他基金
An implantable biosensor microsystem for real-time measurement of circulating biomarkers
用于实时测量循环生物标志物的植入式生物传感器微系统
- 批准号:
2901954 - 财政年份:2028
- 资助金额:
$ 32.65万 - 项目类别:
Studentship
Exploiting the polysaccharide breakdown capacity of the human gut microbiome to develop environmentally sustainable dishwashing solutions
利用人类肠道微生物群的多糖分解能力来开发环境可持续的洗碗解决方案
- 批准号:
2896097 - 财政年份:2027
- 资助金额:
$ 32.65万 - 项目类别:
Studentship
A Robot that Swims Through Granular Materials
可以在颗粒材料中游动的机器人
- 批准号:
2780268 - 财政年份:2027
- 资助金额:
$ 32.65万 - 项目类别:
Studentship
Likelihood and impact of severe space weather events on the resilience of nuclear power and safeguards monitoring.
严重空间天气事件对核电和保障监督的恢复力的可能性和影响。
- 批准号:
2908918 - 财政年份:2027
- 资助金额:
$ 32.65万 - 项目类别:
Studentship
Proton, alpha and gamma irradiation assisted stress corrosion cracking: understanding the fuel-stainless steel interface
质子、α 和 γ 辐照辅助应力腐蚀开裂:了解燃料-不锈钢界面
- 批准号:
2908693 - 财政年份:2027
- 资助金额:
$ 32.65万 - 项目类别:
Studentship
Field Assisted Sintering of Nuclear Fuel Simulants
核燃料模拟物的现场辅助烧结
- 批准号:
2908917 - 财政年份:2027
- 资助金额:
$ 32.65万 - 项目类别:
Studentship
Assessment of new fatigue capable titanium alloys for aerospace applications
评估用于航空航天应用的新型抗疲劳钛合金
- 批准号:
2879438 - 财政年份:2027
- 资助金额:
$ 32.65万 - 项目类别:
Studentship
Developing a 3D printed skin model using a Dextran - Collagen hydrogel to analyse the cellular and epigenetic effects of interleukin-17 inhibitors in
使用右旋糖酐-胶原蛋白水凝胶开发 3D 打印皮肤模型,以分析白细胞介素 17 抑制剂的细胞和表观遗传效应
- 批准号:
2890513 - 财政年份:2027
- 资助金额:
$ 32.65万 - 项目类别:
Studentship
CDT year 1 so TBC in Oct 2024
CDT 第 1 年,预计 2024 年 10 月
- 批准号:
2879865 - 财政年份:2027
- 资助金额:
$ 32.65万 - 项目类别:
Studentship
Understanding the interplay between the gut microbiome, behavior and urbanisation in wild birds
了解野生鸟类肠道微生物组、行为和城市化之间的相互作用
- 批准号:
2876993 - 财政年份:2027
- 资助金额:
$ 32.65万 - 项目类别:
Studentship
相似国自然基金
基于深穿透拉曼光谱的安全光照剂量的深层病灶无创检测与深度预测
- 批准号:82372016
- 批准年份:2023
- 资助金额:48.00 万元
- 项目类别:面上项目
GREB1突变介导雌激素受体信号通路导致深部浸润型子宫内膜异位症的分子遗传机制研究
- 批准号:82371652
- 批准年份:2023
- 资助金额:45.00 万元
- 项目类别:面上项目
基于Deep Unrolling的高分辨近红外二区荧光分子断层成像方法研究
- 批准号:12271434
- 批准年份:2022
- 资助金额:46 万元
- 项目类别:面上项目
基于深度森林(Deep Forest)模型的表面增强拉曼光谱分析方法研究
- 批准号:2020A151501709
- 批准年份:2020
- 资助金额:10.0 万元
- 项目类别:省市级项目
面向Deep Web的数据整合关键技术研究
- 批准号:61872168
- 批准年份:2018
- 资助金额:62.0 万元
- 项目类别:面上项目
基于Deep-learning的三江源区冰川监测动态识别技术研究
- 批准号:51769027
- 批准年份:2017
- 资助金额:38.0 万元
- 项目类别:地区科学基金项目
基于异构医学影像数据的深度挖掘技术及中枢神经系统重大疾病的精准预测
- 批准号:61672236
- 批准年份:2016
- 资助金额:64.0 万元
- 项目类别:面上项目
具有时序处理能力的Spiking-Deep Learning(脉冲深度学习)方法研究
- 批准号:61573081
- 批准年份:2015
- 资助金额:64.0 万元
- 项目类别:面上项目
基于语义计算的海量Deep Web知识探索机制研究
- 批准号:61272411
- 批准年份:2012
- 资助金额:80.0 万元
- 项目类别:面上项目
Deep Web数据集成查询结果抽取与整合关键技术研究
- 批准号:61100167
- 批准年份:2011
- 资助金额:20.0 万元
- 项目类别:青年科学基金项目
相似海外基金
CAREER: Adaptive Deep Learning Systems Towards Edge Intelligence
职业:迈向边缘智能的自适应深度学习系统
- 批准号:
2338512 - 财政年份:2024
- 资助金额:
$ 32.65万 - 项目类别:
Continuing Grant
CRII: OAC: A Compressor-Assisted Collective Communication Framework for GPU-Based Large-Scale Deep Learning
CRII:OAC:基于 GPU 的大规模深度学习的压缩器辅助集体通信框架
- 批准号:
2348465 - 财政年份:2024
- 资助金额:
$ 32.65万 - 项目类别:
Standard Grant
Deep Learningを活用した超音波ガイドによる安全な静脈穿刺法の開発
利用深度学习的超声引导开发安全静脉穿刺方法
- 批准号:
24K13362 - 财政年份:2024
- 资助金额:
$ 32.65万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
MFB: Better Homologous Folding using Computational Linguistics and Deep Learning
MFB:使用计算语言学和深度学习更好的同源折叠
- 批准号:
2330737 - 财政年份:2024
- 资助金额:
$ 32.65万 - 项目类别:
Standard Grant
深層学習(Deep learning)による骨転移検出AIモデルの開発と臨床応用
深度学习骨转移检测AI模型开发及临床应用
- 批准号:
24K18754 - 财政年份:2024
- 资助金额:
$ 32.65万 - 项目类别:
Grant-in-Aid for Early-Career Scientists
Deep Learningを活用した安静時心電図からの非侵襲的冠動脈疾患予測
使用深度学习通过静息心电图进行无创冠状动脉疾病预测
- 批准号:
24K19024 - 财政年份:2024
- 资助金额:
$ 32.65万 - 项目类别:
Grant-in-Aid for Early-Career Scientists
DMS-EPSRC: Asymptotic Analysis of Online Training Algorithms in Machine Learning: Recurrent, Graphical, and Deep Neural Networks
DMS-EPSRC:机器学习中在线训练算法的渐近分析:循环、图形和深度神经网络
- 批准号:
EP/Y029089/1 - 财政年份:2024
- 资助金额:
$ 32.65万 - 项目类别:
Research Grant
Navigating Chemical Space with Natural Language Processing and Deep Learning
利用自然语言处理和深度学习驾驭化学空间
- 批准号:
EP/Y004167/1 - 财政年份:2024
- 资助金额:
$ 32.65万 - 项目类别:
Research Grant
Developing and Visualising a Retrieval-Augmented Deep Learning Model for Population Health Management
开发和可视化用于人口健康管理的检索增强深度学习模型
- 批准号:
2905946 - 财政年份:2024
- 资助金额:
$ 32.65万 - 项目类别:
Studentship
Deep Learning with Limited Data for Battery Materials Design
电池材料设计中数据有限的深度学习
- 批准号:
EP/Y000552/1 - 财政年份:2024
- 资助金额:
$ 32.65万 - 项目类别:
Research Grant