Automated Manga Transcription System for the Visually Impaired that Utilizes Emotions and Scenes

利用情感和场景为视障人士提供自动漫画转录系统

基本信息

  • 批准号:
    22K12939
  • 负责人:
  • 金额:
    $ 2.66万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
  • 财政年份:
    2022
  • 资助国家:
    日本
  • 起止时间:
    2022-04-01 至 2025-03-31
  • 项目状态:
    未结题

项目摘要

本研究の目的は視覚障害者のたまのマンガ自動音訳システムの構築である。2019年、日本では「読書バリアフリー法」が成立した。この法律は、視覚障害者や読書が困難な人々が快適に読書をする環境を整えるものである。社会的マイノリティでも、学習機会を失ってはならない。日本では、出版物の1/3はマンガであると言われており、人々の話題になることが多いが、視覚障害者のためのマンガ音訳は非常に少ない。これまで絵や写真といったビジュアル表現を音訳することは、自動化することが困難であった。どらくらいの情報を翻訳するかは、翻訳者の能力に依存していた。近年、ディープラーニングの精度が飛躍的に向上し、安定した精度で写真や絵の識別が可能になったマンガの自動音訳システムにより、これまで数が少なかった共通する体験を持つことは障害者の社会的孤立を防ぐことが期待できる。令和4年度は①マンガ音訳における適切な情報量の検討と、②吹き出しとコマの順位付け基本的な読み上げ順のルール作りを行い、読み上げシステムの構築に取り組んだ。自動音訳するにあたり、図と文字の情報量からマンガを4分類し、本システムを構築するにあたり扱いやすい作品を検討した。文字数が少ない漫画は、絵の魅力で見せる漫画が多く、絵から読み取る情報が多くなる。このようなマンガ表現は、テキストを中心に自動翻訳システムを構築しようとする本研究の方針と異なるため除外し進めることを確認した。吹き出しとコマの順位づけについては、マンガの学術研究使用を目的に公開されているデータセットであるManga109のアノテーションデータを活用し座標軸から読みとるシステムを開発した。
The purpose of this study is to construct a system for visual impairment. In 2019, Japan's anti-book law was established. The law, the law. The society is full of opportunities for learning. Japan, publications 1/3 This is the first time I've ever seen a picture of you. The ability of a person to change information depends on the ability of the person to change information. In recent years, the accuracy of the photo shoot has improved greatly, and the accuracy of the photo shoot has been stabilized. The identification of the photo shoot has been possible. The number of the photo shoot has been reduced. The isolation of the common society has been expected. In the fourth year of this year, we will discuss the appropriate amount of information, the basic information and the construction of the system. The amount of information in the text is divided into four categories: The number of characters is less, the charm is more, the information is more. This study is based on the analysis of the results of the study. In order to open up the scientific research and use of Manga109, the coordinate axis is opened up.

项目成果

期刊论文数量(1)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Automated Manga Transcription System for the Visually Impaired Focusing on Speech balloons and Scenes
针对视障人士的自动漫画转录系统专注于语音气球和场景
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Hiroshi Arai;Yuko Shimomura;Shuichi Seto;Hiroyuki Kawabe
  • 通讯作者:
    Hiroyuki Kawabe
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

新井 浩其他文献

IT活用型デマンド交通ーコンビニクルの紹介ー
IT化需求交通-便利店介绍-
  • DOI:
  • 发表时间:
    2012
  • 期刊:
  • 影响因子:
    0
  • 作者:
    杉森 公一;新井 浩;川邊 弘之;下村 有子;瀬戸 就一;Kazuhisa Seta;Hideki Nagatsuka and N. Balakrishnan;大和裕幸
  • 通讯作者:
    大和裕幸

新井 浩的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

相似海外基金

"Mimicking Human Head Sound Responses": Towards an Anatomically Accurate Head Prototype for Bone Conduction Crosstalk Cancellation Analysis with Humans
“模仿人类头部声音反应”:构建解剖学上准确的头部原型,用于人类骨传导串扰消除分析
  • 批准号:
    24K20786
  • 财政年份:
    2024
  • 资助金额:
    $ 2.66万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
中世モンゴル語の音訳漢字分類辞典作成に関する研究
中世纪蒙古文音译汉字分类词典创建研究
  • 批准号:
    24K03897
  • 财政年份:
    2024
  • 资助金额:
    $ 2.66万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
SBIR Phase II: A Manufacturing Monitoring System Using Sound Spectrograms and Artificial Intelligence
SBIR 第二阶段:使用声谱图和人工智能的制造监控系统
  • 批准号:
    2335395
  • 财政年份:
    2024
  • 资助金额:
    $ 2.66万
  • 项目类别:
    Cooperative Agreement
Capturing Oceanic Submesoscales, Stirring and Mixing with Sound and Simulations
通过声音和模拟捕捉海洋亚尺度、搅拌和混合
  • 批准号:
    EP/Y014693/1
  • 财政年份:
    2024
  • 资助金额:
    $ 2.66万
  • 项目类别:
    Research Grant
Capturing Oceanic Submesoscales, Stirring, and Mixing with Sound and Simulations
通过声音和模拟捕捉海洋亚尺度、搅拌和混合
  • 批准号:
    MR/X035611/1
  • 财政年份:
    2024
  • 资助金额:
    $ 2.66万
  • 项目类别:
    Fellowship
Uncovering the Functional Effects of Neurotrophins in the Auditory Brainstem
揭示神经营养素对听觉脑干的功能影响
  • 批准号:
    10823506
  • 财政年份:
    2024
  • 资助金额:
    $ 2.66万
  • 项目类别:
Sonorous Landscapes: Using sound and creative design methods to capture and communicate biodiversity in an urban forest
响亮的景观:使用声音和创造性的设计方法来捕捉和传达城市森林中的生物多样性
  • 批准号:
    AH/Z50547X/1
  • 财政年份:
    2024
  • 资助金额:
    $ 2.66万
  • 项目类别:
    Research Grant
DRIVEN BY SOUND
由声音驱动
  • 批准号:
    10059986
  • 财政年份:
    2023
  • 资助金额:
    $ 2.66万
  • 项目类别:
    BEIS-Funded Programmes
Development of data-driven multiple sound spot synthesis technology based on deep generative neural network models
基于深度生成神经网络模型的数据驱动多声点合成技术开发
  • 批准号:
    23K11177
  • 财政年份:
    2023
  • 资助金额:
    $ 2.66万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Measurement of physiological load in online learning and verification of the effect of creating a background sound environment
在线学习生理负荷测量及背景音环境营造效果验证
  • 批准号:
    23K11370
  • 财政年份:
    2023
  • 资助金额:
    $ 2.66万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了