Construction of a Tongan language corpus and examination of the role of minority language corpora in comprehensive linguistic research
汤加语语料库的构建及少数民族语言语料库在综合语言学研究中的作用探讨
基本信息
- 批准号:19H01260
- 负责人:
- 金额:$ 7.16万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Scientific Research (B)
- 财政年份:2019
- 资助国家:日本
- 起止时间:2019-04-01 至 2024-03-31
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
令和3年度は、前年度末に開始したテキストデータの収集及び電子ファイル化をさらに進め、異なるソース(教会のニューズレター、政府の広報)から合わせて17万語相当のテキストデータの電子化を完了した。この作業はトンガ語母語話者が担当し、出典元の表記にタイプミスがないか、特ににGlottal stop、長母音、定性アクセントの表記が抜け落ちている箇所がないかを中心にチェックし、必要な箇所に訂正を施した上で、これらのトンガ語表記をテキストファイル用の表記(アンダースコア、スラッシュ)に変換するという流れで進めた。続いて、完成した電子データと出典元との内容を照合してダブルチェックを行い、重複したファイルがないか、特殊文字の表記が正しいかを確認しつつ、入力作業に向けてファイルの最終調整を行った。前年度までに予定されていた作業に遅れが出ていたため、データ入力に用いるウェブインターフェイスの機能について、より効率的に入力が進められるよう、当初計画していた一文ずつの入力ではなく、ファイルごとの一括入力ができるように変更した。しかしながら、この変更を含んだウェブインターフェイスの納期が開発請負者の都合により遅れたため、令和4年1月までに開始する予定であった入力作業を開始するには至らなかった。一方で、インターフェイスの検索機能に関する検討を重ね、検索結果で前後の文脈がわかるような表示がされるようするなど、検索結果から出典元のデータを閲覧できるようにする等、より効率的にコーパスを利用するために必要な要件をまとめた。
Make at the end of the year before and 3 annual は, に began し た テ キ ス ト デ ー タ の 収 set and び electronic フ ァ イ ル change を さ ら に into め, different な る ソ ー ス (church の ニ ュ ー ズ レ タ ー, government の hiroo) か ら close わ せ て 170000 language の テ キ ス ト デ ー タ の finished electronic を し た. <s:1> <s:1> assignment ト ト ガ ガ native speakers が responsible for <s:1>, allustrinear <s:1> notation にタ プ プ スがな スがな にタ にタ, special ににGlottal Stop, long vowels, qualitative ア ク セ ン ト の mark whatever が sorting け fall ち て い る a が by な い か を center に チ ェ ッ ク し, に な a needed corrections を し た で, こ れ ら の ト ン ガ sign language submission を テ キ ス ト フ ァ イ ル sign with の submission (ア ン ダ ー ス コ ア, ス ラ ッ シ ュ) に variations in す る と い う flow れ で into め た. 続 い て, complete し た electronic デ ー タ と make yuan と の content を as close し て ダ ブ ル チ ェ ッ ク を い, repeat し た フ ァ イ ル が な い か, special sign text の submission が is し い か を confirm し つ つ, homework に into force to け て フ ァ イ ル の line final adjustment を っ た. Before the annual ま で に designated さ れ て い た homework に 遅 れ が out て い た た め, デ ー タ に into force with い る ウ ェ ブ イ ン タ ー フ ェ イ ス の function に つ い て, よ り sharper rate に が into force into め ら れ る よ う, original plan し て い た penny ず つ の で into force は な く, フ ァ イ ル ご と の a enclosed が into force で き る よ う に - more し た. し か し な が ら, こ の - contains more を ん だ ウ ェ ブ イ ン タ ー フ ェ イ ス の satisfied が open 発 please the loser の all match に よ り 遅 れ た た め, and 4 years in January ま で に began す る designated で あ っ た homework を start into force す る に は to ら な か っ た. Party で, イ ン タ ー フ ェ イ ス の 検 line function に masato す る beg を 検 ね, 検 cable results before and after で の context が わ か る よ う な said が さ れ る よ う す る な ど, 検 results か ら make yuan の デ ー タ を read 覧 で き る よ う に す る, よ り working rate of に コ ー パ ス を using す る た め に な necessary elements を ま と め た.
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
大塚 祐子其他文献
大塚 祐子的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('大塚 祐子', 18)}}的其他基金
Creation of naturalistic child language corpora of Tongan as a mother tongue and Tongan as a heritage language
创建汤加语作为母语和汤加语作为遗产语言的自然主义儿童语言语料库
- 批准号:
23K17507 - 财政年份:2023
- 资助金额:
$ 7.16万 - 项目类别:
Grant-in-Aid for Challenging Research (Exploratory)
トンガ語幼児発話コーパス構築と母語獲得研究への活用及び少数言語継承への影響の考察
汤加婴儿语音语料库的构建、在母语习得研究中的应用及其对少数民族语言传承的影响思考
- 批准号:
19K21634 - 财政年份:2019
- 资助金额:
$ 7.16万 - 项目类别:
Grant-in-Aid for Challenging Research (Exploratory)
相似海外基金
ICNALE-WE22:アジア圏22か国を網羅する新しい英語学習者作文コーパスの構築と分析
ICNALE-WE22:覆盖22个亚洲国家的新型英语学习者作文语料库的构建与分析
- 批准号:
23K25338 - 财政年份:2024
- 资助金额:
$ 7.16万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
大規模進化コーパスの構築・利活用によるソフトウェア自動進化の促進
通过构建和利用大规模进化语料库促进软件自动进化
- 批准号:
23K24823 - 财政年份:2024
- 资助金额:
$ 7.16万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
発話行為機能タグ付きコーパスおよびコーパス連動型オンライン学習サイトの構築
构建具有言语行为功能标签的语料库和语料库链接的在线学习网站
- 批准号:
24K03956 - 财政年份:2024
- 资助金额:
$ 7.16万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
日本語学習者コーパスの拡充およびコーパスを活用した習得研究
日语学习者语料库的扩展以及利用该语料库的习得研究
- 批准号:
24K03976 - 财政年份:2024
- 资助金额:
$ 7.16万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
看護留学生等に必要な言語知識ー教科書コーパスと語彙テストに基づく研究・教材開発
留学生所需的语言知识等 - 基于教科书语料库和词汇测试的研究和教材开发
- 批准号:
24K03990 - 财政年份:2024
- 资助金额:
$ 7.16万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
合成メディアの大規模比較評価の最適化と主観比較評価コーパスの構築
合成媒体大规模对比评价优化及主观对比评价语料库构建
- 批准号:
24K20792 - 财政年份:2024
- 资助金额:
$ 7.16万 - 项目类别:
Grant-in-Aid for Early-Career Scientists
聴解コーパスの構築による日本語学習者の聴解困難点と推測技術の実証的研究
基于听力语料库的日语学习者听力理解困难及估计技术的实证研究
- 批准号:
23K21941 - 财政年份:2024
- 资助金额:
$ 7.16万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
「話題から始まる日本語教育」を支援する情報サイトの構築と話題別会話コーパスの拡充
构建支持“从主题开始的日语教育”的信息网站,扩大主题对话语料库
- 批准号:
23K21940 - 财政年份:2024
- 资助金额:
$ 7.16万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
マルチモーダルな視点による日本語講義動画およびコーパスの開発
多模态视角下的日语讲座视频和语料库开发
- 批准号:
24K03981 - 财政年份:2024
- 资助金额:
$ 7.16万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
ジェスチャー情報付きコーパスの構築と統語構造に対応するジェスチャーの解明
构建包含手势信息的语料库并阐明与句法结构相对应的手势
- 批准号:
24K16050 - 财政年份:2024
- 资助金额:
$ 7.16万 - 项目类别:
Grant-in-Aid for Early-Career Scientists