ゼロショットキャプション生成法の開発
零镜头字幕生成方法的开发
基本信息
- 批准号:21K17811
- 负责人:
- 金额:$ 1.58万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Early-Career Scientists
- 财政年份:2021
- 资助国家:日本
- 起止时间:2021-04-01 至 2024-03-31
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
本研究課題は, 機械翻訳を介さず目的言語のキャプションを生成する方法 (ゼロショットキャプション生成法) の開発に取り組む. ゼロショットテキスト生成の関連研究が発表されたことを受け, 本年度は開発していたモデルの見直しおよび実装を行なった. また, 新たに評価用データが公開されたため, 現在それらを用いて検証を行なっている. 開発したゼロショットキャプション生成法は, 近年活発に研究されている画像と言語を用いた事前学習モデル (vision and language pre-training models) と (多言語のテキストデータで学習された) 大規模言語モデル (large language models) を活用することで実現している.現在, モデルの実装は完了しており, 検証を行なっている段階である. 当初の想定よりも時間を要していることから, 検証が完了しておらず, 現状の実験においては, 開発したゼロショットキャプション生成法は十分な性能を得られていない. まだ分析段階ではあるが, これは大規模言語モデルが当初期待していた通りの振る舞いをしていないことが原因だと思われる. これを踏まえて, 来年度は, 大規模言語モデルの振る舞いを考慮し, (教師情報ではない) 補助情報を有効活用することでゼロショットキャプション生成を実現する. 応用タスクの選定は完了しているため, ベンチマークデータにおいて, 開発した方法の有効性が確認でき次第, 応用タスクでの検証に取り組む. 他の言語生成タスクと同様に, キャプション生成においても, ハルシネーション (hallucination) が問題となっていることが報告されている. この観点からも分析を行いたい.
This research topic is to develop a method for generating target speech by mechanical translation. The research on the relationship between the development and the implementation of the project was carried out during the year. The new evaluation system is open to the public, and now it is open to the public. In recent years, research has been actively carried out on the development of image and speech pre-training models and the use of large-scale language models. Now, it's over, and it's over. When the initial idea is determined, the time is required, the test is completed, the status quo is implemented, and the development method is very effective. The analysis of the level of the stage is not the same as that of the large-scale speech, but it is the same as that of the original expectation. In the coming year, large scale speech is considered, and (teacher information) subsidy information is used. In order to confirm the effectiveness of the development method, the selection of the test method is completed, and the test method is selected. His speech is generated in the same way as the speech, and the speech is generated in the same way. This is the first time I've seen it.
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
重藤 優太郎其他文献
ベクトルのスパース化を用いたk近傍法におけるハブの軽減
使用向量稀疏化的 k 最近邻方法中的集线器缓解
- DOI:
- 发表时间:
2014 - 期刊:
- 影响因子:0
- 作者:
重藤 優太郎;新保 仁;松本 裕治 - 通讯作者:
松本 裕治
重藤 優太郎的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('重藤 優太郎', 18)}}的其他基金
計算効率の良い自己教師あり学習法の開発
计算高效的自监督学习方法的开发
- 批准号:
24K20842 - 财政年份:2024
- 资助金额:
$ 1.58万 - 项目类别:
Grant-in-Aid for Early-Career Scientists
相似海外基金
舌粘膜のマルチレイヤーイメージングとコンピュータビジョンによる疾病徴候描出の試み
尝试使用舌粘膜多层成像和计算机视觉来描述疾病症状
- 批准号:
24K13230 - 财政年份:2024
- 资助金额:
$ 1.58万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
多様な環境に適用可能なコンピュータビジョンと無線通信のクロスモーダルセンシング
适用于多种环境的计算机视觉和无线通信的跨模态传感
- 批准号:
23K24831 - 财政年份:2024
- 资助金额:
$ 1.58万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
コンピュータビジョンを用いた外科医の意思決定支援システムの実用化に向けた開発研究
研究和开发旨在利用计算机视觉为外科医生提供决策支持系统的实际应用
- 批准号:
23K24412 - 财政年份:2024
- 资助金额:
$ 1.58万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
コンピュータビジョンでのマルチレベル計測による既存橋梁のデータ同化性能解析
使用计算机视觉进行多级测量对现有桥梁进行数据同化性能分析
- 批准号:
23K26181 - 财政年份:2024
- 资助金额:
$ 1.58万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
Photogrammetry through co-design of data-driven 3D estimation and imaging systems
通过数据驱动的 3D 估计和成像系统的共同设计进行摄影测量
- 批准号:
23H05491 - 财政年份:2023
- 资助金额:
$ 1.58万 - 项目类别:
Grant-in-Aid for Scientific Research (S)
Developing a Home Care Assistive System for Understanding Intentions and Minds of Elderly People
开发家庭护理辅助系统以了解长者的意图和想法
- 批准号:
23K17006 - 财政年份:2023
- 资助金额:
$ 1.58万 - 项目类别:
Grant-in-Aid for Early-Career Scientists
Procedural Text Generation from Instructional Videos
从教学视频生成程序文本
- 批准号:
22KJ1666 - 财政年份:2023
- 资助金额:
$ 1.58万 - 项目类别:
Grant-in-Aid for JSPS Fellows
光の広波長域情報を複合的に活用した海中環境における形状推定
使用综合光波长信息估计水下环境中的形状
- 批准号:
23K16911 - 财政年份:2023
- 资助金额:
$ 1.58万 - 项目类别:
Grant-in-Aid for Early-Career Scientists
画像認識モデルの特性に適応可能な劣化画像補正手法
适应图像识别模型特点的退化图像校正方法
- 批准号:
23K19997 - 财政年份:2023
- 资助金额:
$ 1.58万 - 项目类别:
Grant-in-Aid for Research Activity Start-up
専門知に基づいて画像を理解し説明する対話型AIの実現
实现基于专业知识理解和解释图像的对话式AI
- 批准号:
23H00482 - 财政年份:2023
- 资助金额:
$ 1.58万 - 项目类别:
Grant-in-Aid for Scientific Research (A)