中世スペイン語のコーパス文献学研究

中世纪西班牙语语料库语言学研究

基本信息

  • 批准号:
    13J03408
  • 负责人:
  • 金额:
    $ 0.77万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
  • 财政年份:
    2013
  • 资助国家:
    日本
  • 起止时间:
    2013-04-01 至 2015-03-31
  • 项目状态:
    已结题

项目摘要

本研究の目的は、中世スペイン語古文書コーパスCODEA(Corpus de Documentos Espanholes Anteriores a 1700)に含まれる作成年代不詳文書の年代推定法の開発である。年代推定は、単語の出現頻度等の言語的特徴を手掛かりにして行う。本年度は、数理的手法を用いた年代推定法の開発に取り組んだ。年度前半は、機械学習、ベイズ統計、確率的言語モデル、情報検索の基礎を学んだ。また、6月にマドリードで開催された文献学講習会に参加し、スペイン語文献学の基礎を学んだ。年度後半は、複数の分類器(ナイーブベイズ、k近傍法、Ngramモデル)を実装し、実験を行った。コーパスに含まれる文書数はパラメータの推定には不十分なので、カーネル平滑化によりスパースネスの緩和・欠損値補充を行った。各分類器の精度は、作成年代が既知の文書に対する推定誤差により評価した。実験の結果、実年代と推定年代との絶対値誤差平均を約17年に抑えることができた。これは昨年度に比べ、約4年の改善である。本研究の年代推定法により、年代不詳の中世スペイン語古文書の作成年代を比較的小さな誤差で推定することが可能となった。同様の方法で、文書の作成場所の推定も可能になると考えられる。また、この年代推定法は使用言語に依存しないため、他言語の古文書にも応用可能である。研究成果は、国内学会(3件)と国際学会(1件)で口頭発表した。
The purpose of this study is to develop a dating method for documents with unknown dates, including CODEA (Corpus de Documentos Espanholes Anteriores a 1700). The characteristics of speech such as age estimation and frequency of appearance of words are hung from the hand. This year, the mathematical method was used to develop the method of age estimation. The first half of the year, mechanical learning, statistics, accurate speech, information search and basic learning In June 2010, the Chinese Academy of Sciences held a seminar on philology to promote the study of the basics of philology. In the second half of the year, the number of classifiers (, k near method, Ngram) is implemented. The number of documents included in the package is estimated to be less than 10%, and the number of documents included in the package is smoothed. The accuracy of each classifier is evaluated based on the estimated error of the known documents. The average error of the estimated time is about 17 years. This is the first time in about 4 years that we have improved. The method of date estimation in this study may be used to estimate the small error in the comparison of the dates of the ancient Chinese books. The method of the same kind, the presumption of the place where the document was made, may be examined. The method of dating is based on the use of language, and the use of language in ancient books is possible. The research results were presented orally to the domestic society (3) and the international society (1).

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
中世スペイン語公証文書における定型句の時代・地域変異
中世纪西班牙公证文件中固定短语的时代和地区差异
  • DOI:
  • 发表时间:
    2013
  • 期刊:
  • 影响因子:
    0
  • 作者:
    水内祐介;相島慎一;大内田研宙;服部正見;宮崎哲之;水元一博;田中雅夫;小田義直;山中 真人;川崎 義史
  • 通讯作者:
    川崎 義史
Adscripcion dialectal de documentos notariales
公证文件方言附件
  • DOI:
  • 发表时间:
    2013
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Kawasaki;Yoshifumi
  • 通讯作者:
    Yoshifumi
Datacio/n crono-geogra/fica de documentos notariales medievales: Parte II
Datacio/n crono-geogra/fica de documentos notariales middlees: 第二部分
  • DOI:
  • 发表时间:
    2014
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Mizuuchi Y;Yamamoto H;Nakamura K;Shirahane K;Souzaki M;Tanaka M;Oda Y.;栗田喜久;Sihan Zhao;Yoshifumi Kawasaki
  • 通讯作者:
    Yoshifumi Kawasaki
Datación crono-geográfica de documentos medievales
中世纪时期地理文献数据
  • DOI:
  • 发表时间:
    2014
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Kawasaki;Yoshifumi
  • 通讯作者:
    Yoshifumi
中世スペイン語における否定語と斜格代名詞の語順の通時変異:que lo non pueda vender ~ que non lo pueda vender
中世纪西班牙语中否定词和倾斜代词词序的历时变化: que lo non pueda vender ~ que non lo pueda vender
  • DOI:
  • 发表时间:
    2014
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Mizuuchi Y;Yamamoto H;Nakamura K;Shirahane K;Souzaki M;Tanaka M;Oda Y.;栗田喜久;Sihan Zhao;Yoshifumi Kawasaki;Sihan Zhao;川崎義史
  • 通讯作者:
    川崎義史
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

川崎 義史其他文献

川崎 義史的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('川崎 義史', 18)}}的其他基金

Application of computational linguistic techniques to Medieval and Modern Spanish texts
计算语言技术在中世纪和现代西班牙语文本中的应用
  • 批准号:
    23K12152
  • 财政年份:
    2023
  • 资助金额:
    $ 0.77万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
深層学習を用いたスペイン語の通時的研究
使用深度学习进行西班牙语的历时研究
  • 批准号:
    18K12361
  • 财政年份:
    2018
  • 资助金额:
    $ 0.77万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
中世スペイン語諸方言・写本の系統学研究
中世纪西班牙方言和手稿的家谱研究
  • 批准号:
    15J04335
  • 财政年份:
    2015
  • 资助金额:
    $ 0.77万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows

相似海外基金

コーパス言語学と実験言語学の統合:敬語の確率的構文交替を事例に
整合语料库语言学和实验语言学:敬语概率句法交替的案例研究
  • 批准号:
    22K00507
  • 财政年份:
    2022
  • 资助金额:
    $ 0.77万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
英語史における言語変化の速度感:コーパス言語学と言語使用者の意識の視座から
英语史上语言变迁的速度:从语料库语言学和语言使用者意识的​​角度
  • 批准号:
    22K00602
  • 财政年份:
    2022
  • 资助金额:
    $ 0.77万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Research on the Memory of Repatriation in Postwar Japanese Literature: With Special Emphasis on New Developments in English-Language Studies
战后日本文学中的遣返记忆研究——以英语研究的新进展为重点
  • 批准号:
    19K23041
  • 财政年份:
    2019
  • 资助金额:
    $ 0.77万
  • 项目类别:
    Grant-in-Aid for Research Activity Start-up
Basic Research for the Development of "Language Education" Linking Japanese and Foreign Language Activities/Foreign Language Studies
日语与外语活动/外语研究相结合的“语言教育”的发展基础研究
  • 批准号:
    19K23296
  • 财政年份:
    2019
  • 资助金额:
    $ 0.77万
  • 项目类别:
    Grant-in-Aid for Research Activity Start-up
コーパス言語学を用いた数式の分析に基づく数式の意味解釈
基于语料库语言学数学表达式分析的数学表达式语义解释
  • 批准号:
    14J02758
  • 财政年份:
    2014
  • 资助金额:
    $ 0.77万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
On the Reliability and Validity of the Use of Corpus Data as Evidence for I-Language Studies
论使用语料库数据作为 I 语言研究证据的可靠性和有效性
  • 批准号:
    25370549
  • 财政年份:
    2013
  • 资助金额:
    $ 0.77万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Basic research for the language studies based on language view in the Japanese textbooks
基于日语教科书语言观的语言研究基础研究
  • 批准号:
    24730731
  • 财政年份:
    2012
  • 资助金额:
    $ 0.77万
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)
18,19世紀におけるドイツ語語順のコーパス言語学的・社会言語学的研究
18、19世纪德语词序语料库语言学和社会语言学研究
  • 批准号:
    15720088
  • 财政年份:
    2003
  • 资助金额:
    $ 0.77万
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)
コーパス言語学に基づくイギリスの上院判例における語法の歴史的研究
基于语料库语言学的英国上议院案件使用历史研究
  • 批准号:
    15652025
  • 财政年份:
    2003
  • 资助金额:
    $ 0.77万
  • 项目类别:
    Grant-in-Aid for Exploratory Research
コーパス言語学的手法に基づくディケンズの文体研究のためのデータベース構築と応用
基于语料库语言学方法研究狄更斯风格的数据库构建及应用
  • 批准号:
    10710229
  • 财政年份:
    1998
  • 资助金额:
    $ 0.77万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了