階層型視覚的コモンセンスを考慮した動画質問応答
考虑分层视觉常识的视频问答
基本信息
- 批准号:22KJ2914
- 负责人:
- 金额:$ 1.09万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for JSPS Fellows
- 财政年份:2023
- 资助国家:日本
- 起止时间:2023-03-08 至 2024-03-31
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
本研究課題の幼児の一人称視点動画からの視覚的コモンセンス獲得において、2022年度開始時は幼児の一人称視点動画の詳細な分析を行った。しかしながら、幼児の一人称視点動画は撮影条件や視点などが統一されておらず、機械学習の文脈において未来予測をすることは非常に困難であることが明らかとなった。そこで、近年深層学習において技術的転換点となったTransformerを用いてインタラクションを伴う行動計画タスク自体から初期的視覚的コモンセンスを創発させることができないかに取り組んだ。Transformerの自己注意機構を可視化した結果として、視覚的コモンセンスのPやFについての初期的視覚コモンセンスの獲得の傾向は見られたが、CとIとUについての創発は見られなかった。それゆえ、タスク自体の見直しを行うことにした。次に取り組んだタスクとして物理現象を伴うパズルであるPHYREを用いて、視覚的コモンセンスFPICU全ての創発を行うエージェントを開発することに取り組んだ。FPICUを全て創発させるために、FPICUを統一的に考慮する定式化を数学的に行い、実験を行った。しかしながら、因果性であるCの学習が困難を極め、Cの関連する技術であるVAEや統計的因果推論についてのサーベイを行った。結果として、2022年度はタスクの2度の見直しとFPICUの学習困難性のために論文出版を行うことはできなかった。しかしながら、近年登場したChatGPTがIとUを備えている可能性があり、ChatGPTを活用して視覚的コモンセンスを統一的に考慮するための初期的実験を開始した。
This research project aims to obtain detailed analysis of one-person viewpoint animation for children from the beginning of 2022. The one-person viewpoint animation of young children is very difficult to predict the future in the context of mechanical learning. In recent years, the transformation point of deep learning technology and the application of Transformer are accompanied by action plan, which is the initial stage of self-vision. Transformers pay attention to their own mechanisms, such as visualization of results, visual observation of initial visual observation of the tendency to acquire visual observation of results, visual observation of initial visual observation of results,それゆえ、タスク自体の见直しを行うことにした。The second group of physical phenomena is associated with the use of PHYRE and the development of FPICU. FPICU's overall development, FPICU's unified consideration, formalization, and implementation C. Difficulty in learning C. Relevance D. Technical C. Statistical C. Inference The results show that in 2022, the two degrees of learning difficulties in FPICU were published. ChatGPT has been introduced in recent years, and the possibility of using ChatGPT has been considered.
项目成果
期刊论文数量(5)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
視覚情報に用いたタスク指向型対話における人間の返答に対する間違い指摘の検討
利用视觉信息指出任务导向对话中人类反应错误的研究
- DOI:
- 发表时间:2023
- 期刊:
- 影响因子:0
- 作者:Kazuki Kohyama;Takahiro Tsukahara;Keiichi Tamai;Masaki Sano;荒川深映(この発表者と綱島は共同第一著者);大島遼祐(この発表者と綱島は共同著者)
- 通讯作者:大島遼祐(この発表者と綱島は共同著者)
複数解像度で画像を生成可能な拡散確率モデル
可以生成多种分辨率图像的扩散随机模型
- DOI:
- 发表时间:2023
- 期刊:
- 影响因子:0
- 作者:Kazuki Kohyama;Takahiro Tsukahara;Keiichi Tamai;Masaki Sano;荒川深映(この発表者と綱島は共同第一著者)
- 通讯作者:荒川深映(この発表者と綱島は共同第一著者)
視覚情報に基づくタスク指向型対話における人間の返答に対する間違い指摘の検討
基于视觉信息的任务导向对话中人类反应错误的指出研究
- DOI:
- 发表时间:2023
- 期刊:
- 影响因子:0
- 作者:Kazuki Kohyama;Takahiro Tsukahara;Keiichi Tamai;Masaki Sano;荒川深映(この発表者と綱島は共同第一著者);大島遼祐(この発表者と綱島は共同著者);大島遼祐(この発表者と綱島は共同著者)
- 通讯作者:大島遼祐(この発表者と綱島は共同著者)
Memory Efficient Diffusion Probabilistic Models via Patch-based Generation
- DOI:10.48550/arxiv.2304.07087
- 发表时间:2023-04
- 期刊:
- 影响因子:0
- 作者:Shinei Arakawa;Hideki Tsunashima;Daichi Horita;Keitaro Tanaka;S. Morishima
- 通讯作者:Shinei Arakawa;Hideki Tsunashima;Daichi Horita;Keitaro Tanaka;S. Morishima
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
綱島 秀樹其他文献
綱島 秀樹的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
相似海外基金
常識と化した知見の再検証が明らかにするリグニン系芳香族代謝制御の全貌
通过重新审视已成为常识的知识,揭示了基于木质素的芳香代谢控制的全貌
- 批准号:
24KJ1181 - 财政年份:2024
- 资助金额:
$ 1.09万 - 项目类别:
Grant-in-Aid for JSPS Fellows
物理世界の常識を利用したユーザ認証:利便性と安全性を両立する革新的認証技術
使用物理世界常识进行用户认证:平衡便利性和安全性的创新认证技术
- 批准号:
23K28084 - 财政年份:2024
- 资助金额:
$ 1.09万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
常識の社会的認識論:常識が確からしいのはいかにして因果的に生成されるときか
常识的社会认识论:常识在因果关系中产生的可能性如何。
- 批准号:
24K15883 - 财政年份:2024
- 资助金额:
$ 1.09万 - 项目类别:
Grant-in-Aid for Early-Career Scientists
言語で記述された常識と実世界の観察を統合するロボットのための知識推論システム
集成了用语言编写的常识和现实世界观察的机器人知识推理系统
- 批准号:
23K24910 - 财政年份:2024
- 资助金额:
$ 1.09万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
スコットランド常識学派からプラグマティズムへ―英米思想における常識哲学の研究
从苏格兰常识学派到实用主义:英美思想中的常识哲学研究
- 批准号:
23K20064 - 财政年份:2024
- 资助金额:
$ 1.09万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
常識的見解の重圧による母親の育児困難さと問題視される育児に陥るプロセスの検討
审视母亲因常识观念的压力而面临的育儿困境以及陷入育儿问题的过程
- 批准号:
24K05793 - 财政年份:2024
- 资助金额:
$ 1.09万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
常識推論タスク CommonGen のための文の非常識度合いの推定と常識的文への再生成
估计句子的荒谬程度并将其重新生成常识句子,用于常识推理任务 CommonGen
- 批准号:
23K11212 - 财政年份:2023
- 资助金额:
$ 1.09万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
話者内部状態と常識を考慮した解釈可能な対話システムの構築
构建考虑说话者内心状态和常识的可解释对话系统
- 批准号:
22KJ1897 - 财政年份:2023
- 资助金额:
$ 1.09万 - 项目类别:
Grant-in-Aid for JSPS Fellows
"Common Sense" and flexible learning in AI agents: Do current AI agents possess the "basic skills" necessary for them to enter the workforce?
AI智能体的“常识”和灵活学习:当前的AI智能体是否具备进入劳动力市场所需的“基本技能”?
- 批准号:
2884814 - 财政年份:2023
- 资助金额:
$ 1.09万 - 项目类别:
Studentship
物理世界の常識を利用したユーザ認証:利便性と安全性を両立する革新的認証技術
使用物理世界常识进行用户认证:平衡便利性和安全性的创新认证技术
- 批准号:
23H03394 - 财政年份:2023
- 资助金额:
$ 1.09万 - 项目类别:
Grant-in-Aid for Scientific Research (B)














{{item.name}}会员




