On the Objectivity and Reliability of Corpus Data for Linguistic Research

论语言学研究语料数据的客观性和可靠性

基本信息

  • 批准号:
    22520494
  • 负责人:
  • 金额:
    $ 1.16万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
  • 财政年份:
    2010
  • 资助国家:
    日本
  • 起止时间:
    2010 至 2012
  • 项目状态:
    已结题

项目摘要

With the sizes of corpora increasingly large and with the development and spread of “user-friendly” environments, corpora are now widely used in linguistic research, but these “user-friendly” environments, in spite of their usefulness, also make corpora and corpus studies a kind of “black box”; as a result, users often pay attention only to the output of software while disregarding the input and the process and not examining whether the output can be interpreted as appropriate data for their studies. For the improvement of corpus-based research, I conducted the following surveys: i) I first examined basic data shown in several articles-when errors were detected, I inferred the processes and the causes of the errors, then classified them; ii) from the standpoint of viewing a grammar as a part of the internal state of a speaker, I examined what kinds of information about what aspects of the grammar can be obtained from corpora publicly available now; and iii) I also examined, among other issues, problems concerning representativeness of corpora and corpus data, the reliability and validity of statistical scores such as t-score and MI, and the ambiguity of the term “collocation.”
随着语料库规模的日益庞大和“用户友好”环境的发展和推广,语料库在语言学研究中得到了广泛的应用,但这些“用户友好”环境虽然有其实用性,但也使语料库和语料库研究成为一种“黑箱”;因此,在一个实施例中,用户经常只关注软件的输出,而忽略输入和过程,并且不检查输出是否可以被适当地解释他们的研究数据。为了改进基于语料库的研究,我进行了以下几个方面的研究:i)首先,我检查了几篇文章中的基本数据,当发现错误时,我推断错误的过程和原因,然后对错误进行分类; ii)从将语法视为说话者的内部状态的一部分的观点来看,我研究了从现在公开的语料库中可以获得哪些语法方面的信息;以及iii)我还研究了与语料库和语料库数据的代表性有关的问题,统计得分的可靠性和有效性,如t-得分和MI,以及术语“搭配”的模糊性。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
MI-score, t-scoreと"コロケーション"
MI-score、t-score 和“搭配”
  • DOI:
  • 发表时间:
    2011
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Toshiki Osada;Akinori Uesugi;大名力
  • 通讯作者:
    大名力
学習英文法を見直したい
我想回顾一下我学习的英语语法
  • DOI:
  • 发表时间:
    2012
  • 期刊:
  • 影响因子:
    0
  • 作者:
    大津由紀雄;ほか
  • 通讯作者:
    ほか
コーパスから得やすい情報、得にくい情報-統語論、構文研究を中心に
语料库中容易获取的信息和难以获取的信息——重点关注句法和句法研究
  • DOI:
  • 发表时间:
    2010
  • 期刊:
  • 影响因子:
    0
  • 作者:
    曹紅?;仁科喜久子;金善美;大名力
  • 通讯作者:
    大名力
“コロケーション”と共起性の指標の信頼性と妥当性について
关于“搭配”和共现指标的信度和效度
  • DOI:
  • 发表时间:
    2012
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Yoko Iyeiri (家入葉子);Jennifer Smith;Irma Taavitsainen;Stefan Diemer;Daisuke Suzuki;Mitsumi Uchida;Akiyuki Jimura;John Newman;Sylwester Lodej.;大名力;家入葉子他(共著);大名力
  • 通讯作者:
    大名力
コーパス検索の落とし穴
语料库搜索的陷阱
  • DOI:
  • 发表时间:
    2010
  • 期刊:
  • 影响因子:
    0
  • 作者:
    曹紅〓;仁科喜久子;遊佐典昭;大名力;矢吹清人;村岡貫子;Hideko Shimizu・Takako Sakai;渡辺秀樹;松田謙次郎;Osada Toshiki;金善美;大名力
  • 通讯作者:
    大名力
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

OHNA Tsutomu其他文献

OHNA Tsutomu的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('OHNA Tsutomu', 18)}}的其他基金

The Application of Linguistic Theories and Information Processing Techniques to the Design of English Corpus Search Systems for EFL Learners
语言学理论和信息处理技术在英语学习者英语语料库搜索系统设计中的应用
  • 批准号:
    18520431
  • 财政年份:
    2006
  • 资助金额:
    $ 1.16万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
A Lexico-Grammatical Investigation of Contemporary English : A Corpus-Based Approach
当代英语的词汇语法研究:基于语料库的方法
  • 批准号:
    13410132
  • 财政年份:
    2001
  • 资助金额:
    $ 1.16万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)

相似海外基金

古典漢文依存文法コーパスから日本漢文コーパスへの展開
从文言依存语法语料库到日语汉语语料库的发展
  • 批准号:
    23K28379
  • 财政年份:
    2024
  • 资助金额:
    $ 1.16万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
マレー・インドネシア語における文法習得難易度解明のための容認性コーパス開発
开发可接受性语料库以阐明习得马来语/印尼语语法的难度
  • 批准号:
    23K25336
  • 财政年份:
    2024
  • 资助金额:
    $ 1.16万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
Acceptability corpus development for investigating the difficulty of grammar acquisition in Malay/Indonesian
用于调查马来语/印尼语语法习得难度的可接受性语料库开发
  • 批准号:
    23H00639
  • 财政年份:
    2023
  • 资助金额:
    $ 1.16万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
古典漢文依存文法コーパスから日本漢文コーパスへの展開
从文言依存语法语料库到日语汉语语料库的发展
  • 批准号:
    23H03690
  • 财政年份:
    2023
  • 资助金额:
    $ 1.16万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
外国ルーツ高校生の日本語作文の実態調査と日本語教育のための語彙・文法の基礎研究
外籍高中生日语作文调查及日语教育词汇语法基础研究
  • 批准号:
    23K12219
  • 财政年份:
    2023
  • 资助金额:
    $ 1.16万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
中国語・日本語「学習者・母語対訳」作文コーパスの構築と母語転移に基づく文法研究
基于母语迁移的汉日“学习者/母语翻译”作文语料​​库构建及语法研究
  • 批准号:
    21K13069
  • 财政年份:
    2021
  • 资助金额:
    $ 1.16万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
The Interface between Grammaticalization and Construction Grammar: Grammaticalization and Construction Grammar: With Special Reference to the Development of the Interpretative Progressive in English
语法化与构式语法的交汇:语法化与构式语法:特别参考英语解释进行体的发展
  • 批准号:
    21K00481
  • 财政年份:
    2021
  • 资助金额:
    $ 1.16万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Development of an English corpus with visualized interrelationships among sentences in the framework of dependency grammar
在依存语法框架下开发具有可视化句子相互关系的英语语料库
  • 批准号:
    20K00583
  • 财政年份:
    2020
  • 资助金额:
    $ 1.16万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
データ駆動型学習を取り入れた文法教育に関する基礎的研究
结合数据驱动学习的语法教育基础研究
  • 批准号:
    20K00704
  • 财政年份:
    2020
  • 资助金额:
    $ 1.16万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
古典漢文依存文法コーパスにもとづく係り受け構造の自動抽出
基于文言依存语法语料库的依存结构自动提取
  • 批准号:
    20H04481
  • 财政年份:
    2020
  • 资助金额:
    $ 1.16万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了