テキストレベルの手話-日本語ニューラル機械翻訳のための手話表現形式の検討
文本级手语的手语表达格式研究——日语神经机器翻译
基本信息
- 批准号:22K12147
- 负责人:
- 金额:$ 1.25万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Scientific Research (C)
- 财政年份:2022
- 资助国家:日本
- 起止时间:2022-04-01 至 2025-03-31
- 项目状态:未结题
- 来源:
- 关键词:
项目摘要
本研究では手話翻訳の問題から手話動作認識の問題を切り離して手話-日本語間の言語的な変換処理に研究の焦点をあてるために,手話文に含まれる単語とその語形変化,非手指要素による文法標識などが正しく認識されたものと仮定して,テキスト形式の手話文を原言語文とした手話から日本語へのニューラル機械翻訳(NMT)を考え,NMTに適した手話のテキスト表現形式やベクトル表現形式などについて検討する。書記体系を持たない手話にはNMTに利用可能な言語データがほとんど存在しないため,当該年度は主に対訳データの収集とデータ拡張手法の検討を行った。手話の学習教材と日本語-手話辞典から対訳文と対訳フレーズを合計約13700件収集し,訓練・検証・テスト用データセットを作成した。手話のテキスト表現としては基本的にJJS表記法を用いた。手話単語を表す日本語の語句(手話単語名)は教材によってまちまちであるため,基本的に『日本語-手話辞典』における手話イラスト名を用い,辞書にない単語やパントマイム的な表現には適宜名前を付けた。データ拡張手法としては,類義語・対義語の置換による方法と,日本語単言語データから疑似手話文を生成する手法を試み,拡張前後の翻訳精度を比較した。類義語・対義語の置換による疑似対訳文の生成では,単語置換による不自然な日本語文を除外するためにMLM Scoringを用い,一定のスコアが得られた文だけを訓練データとして用いた。実験の結果,同義語置換より対義語置換によるデータ拡張の方が良い結果が得られた。日本語単言語コーパスを利用した疑似対訳文の生成では,日本語文中の助詞の削除と用言の終止形への変換などの簡単な処理により疑似手話文を生成し,得られた疑似対訳データを訓練データに加えて翻訳実験を行ったところ,言語資源が少ない現状では逆翻訳による疑似対訳文生成手法よりも良い結果が得られることが確認できた。
This study focuses on the problems of hand-speech translation, the recognition of hand-speech movements, the study of hand-speech-Japanese speech transformation, the study of hand-speech translation, the study of hand-speech-Japanese speech transformation, the study of hand-speech-Japanese speech transformation, the study of non-finger elements, the study of grammatical markers, the study of hand-speech-Japanese speech transformation, the study of hand-speech-Japanese mechanical translation (NMT), NMT is suitable for the expression of mobile phone and mobile phone. The scandal system is based on the NMT's ability to use speech to communicate with the public. The Japanese language dictionary contains about 13700 pieces of training materials. The basic JJS notation is used in the performance of the manual. Japanese language expressions (Japanese language names) are used in teaching materials, basic Japanese language dictionaries are used in Japanese language expressions, and dictionary expressions are used in appropriate names. The method of translation of similar words and phrases is compared with the method of translation of similar words and phrases The language is not natural, except for the Japanese language. As a result, synonyms are replaced by synonyms. Japanese language translation is used to generate suspected text. Japanese language translation is used to delete auxiliary words. Japanese language translation is used to generate suspected text. Japanese language translation is used to generate suspected text.
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
松本 忠博其他文献
動作特徴ベクトルの導入によるSignWriting表記の手話単語の類似度定義の改良と評価
引入运动特征向量对手语手语词语相似度定义的改进与评估
- DOI:
- 发表时间:
2019 - 期刊:
- 影响因子:0
- 作者:
岡田 紳太郎;松本 忠博;加藤 三保子 - 通讯作者:
加藤 三保子
多クラス分類によるSignWriting表記手話単語の辞書検索
使用多类分类对 SignWriting 手语单词进行字典搜索
- DOI:
- 发表时间:
2020 - 期刊:
- 影响因子:0
- 作者:
石橋 陽典;松本 忠博;加藤 三保子 - 通讯作者:
加藤 三保子
松本 忠博的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
相似海外基金
潜在拡散モデルを用いたニューラル機械翻訳の研究
基于潜在扩散模型的神经机器翻译研究
- 批准号:
24K15071 - 财政年份:2024
- 资助金额:
$ 1.25万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
主辞駆動句構造文法に基づくニューラル機械翻訳の高度化
基于头部驱动短语结构语法的神经机器翻译的复杂性
- 批准号:
22KJ2286 - 财政年份:2023
- 资助金额:
$ 1.25万 - 项目类别:
Grant-in-Aid for JSPS Fellows
翻訳文の難易度を多段階で指定可能なニューラル機械翻訳
神经机器翻译,允许您指定多个级别的翻译句子的难度级别
- 批准号:
22K12177 - 财政年份:2022
- 资助金额:
$ 1.25万 - 项目类别:
Grant-in-Aid for Scientific Research (C)