少量の実データに基づく画像内文字認識及びその応用
基于少量真实数据的图像字符识别及其应用
基本信息
- 批准号:22KJ0905
- 负责人:
- 金额:$ 1.47万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for JSPS Fellows
- 财政年份:2023
- 资助国家:日本
- 起止时间:2023-03-08 至 2024-03-31
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
目的「少量の実データに基づく画像内文字認識及びその応用」に合う研究を順調に進めた。まず、計画通りに、合成データで作り難い、難しいデータの例として「漫画内のオノマトペテキスト」に注目し、それらを集めたデータセットを作成して公開した。オノマトペテキストは、合成で作り難い分、少量の実データを上手く活用して認識する必要があり、それに役立ついくつかの手法を適用して、精度を改善した。その内容を、7月には国内の最大級画像処理学会MIRUにて発表し、MIRUインタラクティブ発表賞を頂いた。また、10月に画像処理系のトップ国際学会ECCVでも発表した。その後、研究課題の目的「少量の実データの有効活用」に繋がる別の研究として、少量の文字画像(character image)を有効活用する研究を行っている。具体的には、複数の文字画像を組み合わせて、一つの疑似単語画像(word image)を作る研究を勧めている。文字画像が多ければ多いほど、文字画像を組み合わせるパターンは膨大な数になるため、文字画像を組み合わせることで、膨大な量の「疑似単語画像」を得られる。我々はこの組み合わせで作った「疑似単語画像」が、少量の単語画像を補うのに有効的であることを示した。今現在トップ国際会議ICCVに提出して、結果を待っている。今後は、この研究の改善や拡張を行う予定である。
Objective: To study the relationship between Chinese characters recognition and Chinese characters use in basic images. In addition, it is difficult to create a "comic book" and "comic book". To improve the accuracy of the method, we must first understand the necessity of using the method. In July, MIRU, the largest image processing society in China, launched its first exhibition. In October, the International Society for Image Processing (ECCV) launched its report. The purpose of this research project is to conduct research on the effective use of a small number of characters. Specific words, plural words and images are grouped together, and a suspected word image is studied. Text portrait is composed of multiple characters, text portrait is composed of multiple characters. I am a member of the group and I am a member of the group. The ICCV is now presented and the results are awaited. Future research and improvement
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
COO: Comic Onomatopoeia Dataset for Recognizing Arbitrary or Truncated Texts
- DOI:10.48550/arxiv.2207.04675
- 发表时间:2022-07
- 期刊:
- 影响因子:0
- 作者:Jeonghun Baek;Yusuke Matsui;K. Aizawa
- 通讯作者:Jeonghun Baek;Yusuke Matsui;K. Aizawa
COO: Comic Onomatopoeia Dataset for Recognizing Arbitrary Text
COO:用于识别任意文本的漫画拟声词数据集
- DOI:
- 发表时间:2022
- 期刊:
- 影响因子:0
- 作者:Jeonghun Baek;Yusuke Matsui;Kiyoharu Aizawa
- 通讯作者:Kiyoharu Aizawa
COO: きわめて 不規則なテキストを 含む漫画オノマトペデータセット
COO:具有高度不规则文本的漫画拟声词数据集
- DOI:
- 发表时间:2023
- 期刊:
- 影响因子:0
- 作者:Jeonghun Baek;Yusuke Matsui;Kiyoharu Aizawa
- 通讯作者:Kiyoharu Aizawa
What If We Only Use Real Datasets for Scene Text Recognition?
如果我们只使用真实数据集进行场景文本识别会怎么样?
- DOI:
- 发表时间:2022
- 期刊:
- 影响因子:0
- 作者:Jeonghun Baek;Yusuke Matsui;Kiyoharu Aizawa;Jeonghun Baek
- 通讯作者:Jeonghun Baek
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
白 定勳其他文献
Human-Inspired Robot Design of Hardware and Software
仿人机器人软硬件设计
- DOI:
- 发表时间:
2014 - 期刊:
- 影响因子:0
- 作者:
熊谷 和実;白 定勳;水内 郁夫;水内 郁夫;Ikuo Mizuuchi - 通讯作者:
Ikuo Mizuuchi
白 定勳的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}