Collaborative Proposal: Using the Web as a Corpus for Empirical Linguistic Research

合作提案:使用网络作为实证语言学研究的语料库

基本信息

  • 批准号:
    0112429
  • 负责人:
  • 金额:
    $ 16.2万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2001
  • 资助国家:
    美国
  • 起止时间:
    2001-09-01 至 2003-08-31
  • 项目状态:
    已结题

项目摘要

This project will develop tools that make it possible to retrieve naturally occurring sentences from the World Wide Web on the basis of lexical content and syntactic structure, providing linguists with an immediate, easily accessible source of raw linguistic data. The PIs will investigate specific linguistic hypotheses at the lexical semantics/syntax interface as an illustrative application of these tools. At a high level, the planned work constitutes an important step toward a new paradigm for linguistic research. Rather than relying entirely on introspective data generated by the linguist who is trying to (dis)prove a particular hypothesis, Web-enabled linguistics research will draw on the methodology and the tools developed by the PIs to supply naturally occurring data on which theories can rest. With regard to specific linguistic questions, the goal is to provide an explanation of the rules and constraints that govern three transitivity alternations (Middle, Unaccusative, Unspecified Object Deletion), and the PIs expect data made available by their tools to shed light on the "grey" area between competence and performance, that is, the linguistic behavior that seems to fall outside of rule-governed behavior. Although naturally occurring data are not accorded great emphasis in generative syntax, the use of text corpora has a tradition in the greater linguistic enterprise. An explosive new phenomenon in the world of naturally occurring text, the World Wide Web is an essentially untapped resource that embodies the rich and dynamic nature of language, presenting a data resource of unparalleled size and diversity
该项目将开发工具,使之能够根据词汇内容和句法结构从万维网上检索自然出现的句子,为语言学家提供一个即时、容易获得的原始语言数据来源。PI将在词汇语义/句法界面调查特定的语言假设,作为这些工具的说明性应用。在更高的层面上,计划中的工作是朝着语言学研究的新范式迈出的重要一步。网络语言学研究不会完全依赖试图证明某个特定假设的语言学家产生的内省数据,而是利用个人投资机构开发的方法和工具来提供自然产生的数据,作为理论的基础。对于具体的语言问题,目标是解释支配三种及物性交替的规则和限制(中式、非宾语、未指定宾语删除),而PI期望通过他们的工具提供的数据来阐明能力和表现之间的灰色地带,即似乎超出规则控制的行为的语言行为。虽然自然产生的数据在生成句法中没有得到很大的重视,但在更大的语言事业中,使用文本语料库是有传统的。万维网是自然文本世界中一个爆炸性的新现象,它本质上是一种尚未开发的资源,体现了语言的丰富和动态本质,呈现了无与伦比的大小和多样性的数据资源

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Christiane Fellbaum其他文献

Erratum to: Large, huge or gigantic? Identifying and encoding intensity relations among adjectives in WordNet
  • DOI:
    10.1007/s10579-013-9235-2
  • 发表时间:
    2013-06-02
  • 期刊:
  • 影响因子:
    1.800
  • 作者:
    Vera Sheinman;Christiane Fellbaum;Isaac Julien;Peter Schulam;Takenobu Tokunaga
  • 通讯作者:
    Takenobu Tokunaga
Idiome in einem Digitalen Lexikalischen System
Human and Automatic Interpretation of Romanian Noun Compounds
罗马尼亚语名词复合词的人工和自动解释
  • DOI:
    10.48550/arxiv.2403.06360
  • 发表时间:
    2024
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Ioana Marinescu;Christiane Fellbaum
  • 通讯作者:
    Christiane Fellbaum

Christiane Fellbaum的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Christiane Fellbaum', 18)}}的其他基金

CI-P: Collaborative Research: LexLink: Aligning WordNet, FrameNet, PropBank and VerbNet
CI-P:协作研究:LexLink:对齐 WordNet、FrameNet、PropBank 和 VerbNet
  • 批准号:
    1205473
  • 财政年份:
    2012
  • 资助金额:
    $ 16.2万
  • 项目类别:
    Standard Grant
A Workshop on Restructuring Adjectives in WordNet
WordNet 中形容词重组研讨会
  • 批准号:
    1139844
  • 财政年份:
    2011
  • 资助金额:
    $ 16.2万
  • 项目类别:
    Standard Grant
CI-ADDO-EN: A Second-Generation Architecture for WordNet
CI-ADDO-EN:WordNet 的第二代架构
  • 批准号:
    0855157
  • 财政年份:
    2009
  • 资助金额:
    $ 16.2万
  • 项目类别:
    Standard Grant
RI: Collaborative Proposal: Complementary Lexical Resources: Towards an Alignment of WordNet and FrameNet
RI:协作提案:补充词汇资源:实现 WordNet 和 FrameNet 的协调
  • 批准号:
    0705199
  • 财政年份:
    2007
  • 资助金额:
    $ 16.2万
  • 项目类别:
    Standard Grant
Collaborative Research: CRI: An Open Linguistic Infrastructure for American English
合作研究:CRI:美式英语的开放语言基础设施
  • 批准号:
    0551531
  • 财政年份:
    2006
  • 资助金额:
    $ 16.2万
  • 项目类别:
    Standard Grant
Constructing an Enhanced Version of WordNet
构建 WordNet 的增强版本
  • 批准号:
    0414072
  • 财政年份:
    2004
  • 资助金额:
    $ 16.2万
  • 项目类别:
    Standard Grant
WordNet as an Interlingual Lexical Resource
WordNet 作为语际词汇资源
  • 批准号:
    9805732
  • 财政年份:
    1998
  • 资助金额:
    $ 16.2万
  • 项目类别:
    Standard Grant

相似海外基金

ECLIPSE/Collaborative Proposal: Studying Microwave-Plasma interactions at Solid Interfaces Using Microwave Microstrip Architectures
ECLIPSE/协作提案:使用微波微带架构研究固体界面处的微波-等离子体相互作用
  • 批准号:
    2206769
  • 财政年份:
    2022
  • 资助金额:
    $ 16.2万
  • 项目类别:
    Standard Grant
ECLIPSE/Collaborative Proposal: Studying Microwave-Plasma Interactions at Solid Interfaces Using Microwave Microstrip Architectures
ECLIPSE/协作提案:使用微波微带架构研究固体界面处的微波-等离子体相互作用
  • 批准号:
    2206546
  • 财政年份:
    2022
  • 资助金额:
    $ 16.2万
  • 项目类别:
    Standard Grant
Collaborative Proposal: Linking the topographic features of bio-inspired undulated cylinders to their force reduction properties using critical points
合作提案:使用临界点将仿生波状圆柱体的地形特征与其减力特性联系起来
  • 批准号:
    2037582
  • 财政年份:
    2021
  • 资助金额:
    $ 16.2万
  • 项目类别:
    Standard Grant
Collaborative Proposal: MRA: Using NEON data to elucidate the ecological effects of global environmental change on phenology across time and space
合作提案:MRA:利用 NEON 数据阐明全球环境变化对跨时间和空间物候的生态影响
  • 批准号:
    2017463
  • 财政年份:
    2021
  • 资助金额:
    $ 16.2万
  • 项目类别:
    Standard Grant
Collaborative Proposal: MRA: Using NEON data to elucidate the ecological effects of global environmental change on phenology across time and space
合作提案:MRA:利用 NEON 数据阐明全球环境变化对跨时间和空间物候的生态影响
  • 批准号:
    2017740
  • 财政年份:
    2021
  • 资助金额:
    $ 16.2万
  • 项目类别:
    Standard Grant
Collaborative Proposal: Plastic Spiraling In River Networks (Plastic-SIReN): Determining the controls of watershed plastic fluxes using a field and modeling approach
合作提案:河流网络中的塑料螺旋 (Plastic-SIReN):使用现场和建模方法确定流域塑料通量的控制
  • 批准号:
    2113333
  • 财政年份:
    2021
  • 资助金额:
    $ 16.2万
  • 项目类别:
    Standard Grant
Collaborative Proposal: MRA: Using NEON data to elucidate the ecological effects of global environmental change on phenology across time and space
合作提案:MRA:利用 NEON 数据阐明全球环境变化对跨时间和空间物候的生态影响
  • 批准号:
    2017785
  • 财政年份:
    2021
  • 资助金额:
    $ 16.2万
  • 项目类别:
    Standard Grant
Collaborative Proposal: Plastic Spiraling In River Networks (Plastic-SIReN): Determining the controls of watershed plastic fluxes using a field and modeling approach
合作提案:河流网络中的塑料螺旋 (Plastic-SIReN):使用现场和建模方法确定流域塑料通量的控制
  • 批准号:
    2113338
  • 财政年份:
    2021
  • 资助金额:
    $ 16.2万
  • 项目类别:
    Standard Grant
CRCNS Research Proposal: Collaborative Research: Evaluating Machine Learning Architectures Using a Massive Benchmark Dataset of Brain Responses to Natural Scenes
CRCNS 研究提案:协作研究:使用大脑对自然场景反应的大量基准数据集评估机器学习架构
  • 批准号:
    2138972
  • 财政年份:
    2020
  • 资助金额:
    $ 16.2万
  • 项目类别:
    Standard Grant
Collaborative Proposal: WoU-MMA: Observations of Gravitational Wave Sources Using the Long Wavelength Array
合作提案:WoU-MMA:使用长波长阵列观测引力波源
  • 批准号:
    2011731
  • 财政年份:
    2020
  • 资助金额:
    $ 16.2万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了