Development of a Support System for the Reprinting of Oieryu Kuzushiji (Edo Period Official Handwriting) Documents by Integrating Visual and Linguistic Information
通过整合视觉和语言信息开发重印江户时代官方手写文献的支持系统
基本信息
- 批准号:22K18149
- 负责人:
- 金额:$ 2.91万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Early-Career Scientists
- 财政年份:2022
- 资助国家:日本
- 起止时间:2022-04-01 至 2025-03-31
- 项目状态:未结题
- 来源:
- 关键词:
项目摘要
この研究では、御家流と呼ばれる江戸期の公的な文書などに使用する書体で書かれた日記(業務文書)の翻刻を支援するシステムを開発する。最近は、IIIFという標準規格に基づいた歴史文化系画像が公開されており、これらの画像を使った人文学研究のためのAI-OCR(光学文字認識)技術で自動翻刻が試みられている。例えば、現行のAI-OCRアプリ「miwo」は、AI-OCR技術によりくずし字で書かれた文書などの画像を読み取り、楷書体の文字に翻刻するアプリの中でも実用的なものだが、漢字が95%以上を占める江戸期の日記に対しては、文字位置の判定は高精度に行う一方で、文字の判定は10%~50%程度に留まる。これは、AI-OCRに用いる学習データの量と種類が不足しているためである。現在利用可能なくずし字データは、人文学オープンデータ共同利用センター(CODH)から配布されているものがあるが、これらのデータは主に文学作品で変体仮名の多用される古典籍画像から、専門家によって手作業でアノテーションされたものである。他方、くずし字の解読がある程度の訓練を要するものである以上、不特定多数によるクラウドソーシングのような方法は品質保証が難しく非現実的である。しかし、最終的には専門家によるデータの確認も必要である。このような状況下でくずし字用のAI-OCRの質を高めるには、人と技術をうまく活用する手法を確立することで、多様な文書に用いられていた御家流くずし字字形の学習データを増やす仕組みを確立することが重要となる。今年度は、くずし字の読み解きに興味のある市民と希少な専門家の技術を効率的に生かす翻刻支援システムにより正解データを増やせる環境を構築した。専用作業サイトを実装して2名に実際にサイトを利用して御家流くずし字のアノテーションデータを修正し、正解データに仕上げることが可能になった。
This research is aimed at developing the support system for the translation of books and journals (business documents). Recently, IIIF standard specifications, historical and cultural system portraits, open to the public, make humanities research and AI-OCR (optical character recognition) technology, automatic translation, trial and error For example, the current AI-OCR technology is used to determine the position of characters with high accuracy, and the determination of characters is 10% to 50%. The amount of learning is insufficient. Now, it is possible to use the word CODH and the humanities to jointly use the word CODH. Other aspects, such as the understanding of the word, the training of the necessary level, the lack of specific majority, the quality of the training method, and the difficulty of the implementation. The ultimate goal is to identify the needs of the family. The quality of the word is high, the technology is high, and the word is high. This year, the public wants to build an environment that supports the development of technology. For example, if you want to use the service, you can use the service to correct the problem and correct the problem.
项目成果
期刊论文数量(4)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
[A4] Construction of a Database Aimed at Complementing Information by Presenting Time Series of Scattered Regional Business Records in the Edo period
[A4]通过呈现江户时代分散的地区商业记录的时间序列来构建旨在补充信息的数据库
- DOI:10.24506/jsda.6.s3_s131
- 发表时间:2022
- 期刊:
- 影响因子:0
- 作者:吉賀 夏子;伊藤 昭弘
- 通讯作者:伊藤 昭弘
多様なくずし字画像に対応するアノテーションデータセット収集システムの試作
支持多种葛藤图像的注释数据集收集系统的原型制作
- DOI:
- 发表时间:2023
- 期刊:
- 影响因子:0
- 作者:吉賀 夏子;橋本 雄太
- 通讯作者:橋本 雄太
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
吉賀 夏子其他文献
南宋・陸四郎筆 羅漢図(藤田美術館蔵)
南宋 陆四郎罗汉图(藤田美术馆藏)
- DOI:
- 发表时间:
2021 - 期刊:
- 影响因子:0
- 作者:
吉賀 夏子;堀 良彰;只木 進一;永崎 研宣;伊藤 昭弘;稲場圭信;村上祐子;北澤菜月 - 通讯作者:
北澤菜月
GlyphWikiによる観智院本『類聚名義抄』字形の再現とその改善
GlyphWiki 再现并改进了 Kanchiin 书籍“Ruiju Meigisho”的字符形状
- DOI:
- 发表时间:
2022 - 期刊:
- 影响因子:0
- 作者:
吉賀 夏子;堀 良彰;只木 進一;永崎 研宣;伊藤 昭弘;池田証壽・李媛・劉冠偉・鄭門鎬 - 通讯作者:
池田証壽・李媛・劉冠偉・鄭門鎬
五代・北宋期における熾盛光道場本尊図像の形成と伝播―温州白象塔星宿神塑像をめぐって―
五朝北宋青神岗道场主要形象的形成与传播——以温州白象塔、星神塑像为例
- DOI:
- 发表时间:
2021 - 期刊:
- 影响因子:0
- 作者:
吉賀 夏子;堀 良彰;只木 進一;永崎 研宣;伊藤 昭弘;稲場圭信;村上祐子;北澤菜月;稲場圭信;大谷卓史;谷口耕生 - 通讯作者:
谷口耕生
ja The Japan Architect 危機がデザイン する都市
zh 日本建筑师 一座由危机设计的城市
- DOI:
- 发表时间:
2021 - 期刊:
- 影响因子:0
- 作者:
王庭輝;岸田拓也;中鹿亘;Ichiro Inoue;水沼友宏;吉賀 夏子;福岡孝則 - 通讯作者:
福岡孝則
吉賀 夏子的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
相似海外基金
形状理解のためのマルチモーダル学習による、敵対的摂動に頑健な画像認識モデル開発
使用多模态学习进行形状理解,开发对对抗性扰动具有鲁棒性的图像识别模型
- 批准号:
24KJ0716 - 财政年份:2024
- 资助金额:
$ 2.91万 - 项目类别:
Grant-in-Aid for JSPS Fellows
マルチモーダル学習による視覚障害者の歩行特徴抽出と移動支援装置の研究開発
利用多模态学习研究开发视障人士行走特征提取及行动支持装置
- 批准号:
23K11977 - 财政年份:2023
- 资助金额:
$ 2.91万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
マルチモーダル学習による半導体用薄板複合ガラス基板のレーザー貫通孔加工
使用多模态学习对半导体薄复合玻璃基板进行激光通孔加工
- 批准号:
22K03855 - 财政年份:2022
- 资助金额:
$ 2.91万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
深層学習による緑内障視野進行の予測及び、反教師学習付きマルチモーダル学習への拡張
使用深度学习预测青光眼视野进展并扩展到无监督学习的多模态学习
- 批准号:
19K18835 - 财政年份:2019
- 资助金额:
$ 2.91万 - 项目类别:
Grant-in-Aid for Early-Career Scientists