Collaborative Proposal: Using the Web as a Corpus for Empirical Linguistic Research

合作提案:使用网络作为实证语言学研究的语料库

基本信息

  • 批准号:
    0112429
  • 负责人:
  • 金额:
    $ 16.2万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2001
  • 资助国家:
    美国
  • 起止时间:
    2001-09-01 至 2003-08-31
  • 项目状态:
    已结题

项目摘要

This project will develop tools that make it possible to retrieve naturally occurring sentences from the World Wide Web on the basis of lexical content and syntactic structure, providing linguists with an immediate, easily accessible source of raw linguistic data. The PIs will investigate specific linguistic hypotheses at the lexical semantics/syntax interface as an illustrative application of these tools. At a high level, the planned work constitutes an important step toward a new paradigm for linguistic research. Rather than relying entirely on introspective data generated by the linguist who is trying to (dis)prove a particular hypothesis, Web-enabled linguistics research will draw on the methodology and the tools developed by the PIs to supply naturally occurring data on which theories can rest. With regard to specific linguistic questions, the goal is to provide an explanation of the rules and constraints that govern three transitivity alternations (Middle, Unaccusative, Unspecified Object Deletion), and the PIs expect data made available by their tools to shed light on the "grey" area between competence and performance, that is, the linguistic behavior that seems to fall outside of rule-governed behavior. Although naturally occurring data are not accorded great emphasis in generative syntax, the use of text corpora has a tradition in the greater linguistic enterprise. An explosive new phenomenon in the world of naturally occurring text, the World Wide Web is an essentially untapped resource that embodies the rich and dynamic nature of language, presenting a data resource of unparalleled size and diversity
该项目将开发工具,使人们能够从万维网上检索自然出现的句子的词汇内容和句法结构的基础上,为语言学家提供一个直接的,容易获得的原始语言数据源。 作为这些工具的说明性应用,PI将调查词汇语义/句法界面上的特定语言假设。 在高层次上,计划中的工作是迈向语言学研究新范式的重要一步。 而不是完全依赖于内省的数据所产生的语言学家谁是试图证明一个特定的假设,网络使语言学研究将借鉴的方法和工具开发的PI提供自然发生的数据,理论可以休息。 关于具体的语言问题,我们的目标是提供一个解释的规则和约束,支配三个及物性交替(中间,不明确,未指定对象删除),和PI期望数据提供他们的工具,以阐明能力和性能之间的“灰色”区域,也就是说,语言行为,似乎落在规则支配的行为之外。 虽然自然发生的数据在生成句法中没有得到很大的重视,但文本语料库的使用在更大的语言学事业中有着传统。 万维网是自然文本世界中的一个爆炸性的新现象,它是一种基本上尚未开发的资源,体现了语言的丰富和动态特性,提供了无与伦比的规模和多样性的数据资源

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Christiane Fellbaum其他文献

Erratum to: Large, huge or gigantic? Identifying and encoding intensity relations among adjectives in WordNet
  • DOI:
    10.1007/s10579-013-9235-2
  • 发表时间:
    2013-06-02
  • 期刊:
  • 影响因子:
    1.800
  • 作者:
    Vera Sheinman;Christiane Fellbaum;Isaac Julien;Peter Schulam;Takenobu Tokunaga
  • 通讯作者:
    Takenobu Tokunaga
Idiome in einem Digitalen Lexikalischen System
Human and Automatic Interpretation of Romanian Noun Compounds
罗马尼亚语名词复合词的人工和自动解释
  • DOI:
    10.48550/arxiv.2403.06360
  • 发表时间:
    2024
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Ioana Marinescu;Christiane Fellbaum
  • 通讯作者:
    Christiane Fellbaum

Christiane Fellbaum的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Christiane Fellbaum', 18)}}的其他基金

CI-P: Collaborative Research: LexLink: Aligning WordNet, FrameNet, PropBank and VerbNet
CI-P:协作研究:LexLink:对齐 WordNet、FrameNet、PropBank 和 VerbNet
  • 批准号:
    1205473
  • 财政年份:
    2012
  • 资助金额:
    $ 16.2万
  • 项目类别:
    Standard Grant
A Workshop on Restructuring Adjectives in WordNet
WordNet 中形容词重组研讨会
  • 批准号:
    1139844
  • 财政年份:
    2011
  • 资助金额:
    $ 16.2万
  • 项目类别:
    Standard Grant
CI-ADDO-EN: A Second-Generation Architecture for WordNet
CI-ADDO-EN:WordNet 的第二代架构
  • 批准号:
    0855157
  • 财政年份:
    2009
  • 资助金额:
    $ 16.2万
  • 项目类别:
    Standard Grant
RI: Collaborative Proposal: Complementary Lexical Resources: Towards an Alignment of WordNet and FrameNet
RI:协作提案:补充词汇资源:实现 WordNet 和 FrameNet 的协调
  • 批准号:
    0705199
  • 财政年份:
    2007
  • 资助金额:
    $ 16.2万
  • 项目类别:
    Standard Grant
Collaborative Research: CRI: An Open Linguistic Infrastructure for American English
合作研究:CRI:美式英语的开放语言基础设施
  • 批准号:
    0551531
  • 财政年份:
    2006
  • 资助金额:
    $ 16.2万
  • 项目类别:
    Standard Grant
Constructing an Enhanced Version of WordNet
构建 WordNet 的增强版本
  • 批准号:
    0414072
  • 财政年份:
    2004
  • 资助金额:
    $ 16.2万
  • 项目类别:
    Standard Grant
WordNet as an Interlingual Lexical Resource
WordNet 作为语际词汇资源
  • 批准号:
    9805732
  • 财政年份:
    1998
  • 资助金额:
    $ 16.2万
  • 项目类别:
    Standard Grant

相似海外基金

ECLIPSE/Collaborative Proposal: Studying Microwave-Plasma interactions at Solid Interfaces Using Microwave Microstrip Architectures
ECLIPSE/协作提案:使用微波微带架构研究固体界面处的微波-等离子体相互作用
  • 批准号:
    2206769
  • 财政年份:
    2022
  • 资助金额:
    $ 16.2万
  • 项目类别:
    Standard Grant
ECLIPSE/Collaborative Proposal: Studying Microwave-Plasma Interactions at Solid Interfaces Using Microwave Microstrip Architectures
ECLIPSE/协作提案:使用微波微带架构研究固体界面处的微波-等离子体相互作用
  • 批准号:
    2206546
  • 财政年份:
    2022
  • 资助金额:
    $ 16.2万
  • 项目类别:
    Standard Grant
Collaborative Proposal: Linking the topographic features of bio-inspired undulated cylinders to their force reduction properties using critical points
合作提案:使用临界点将仿生波状圆柱体的地形特征与其减力特性联系起来
  • 批准号:
    2037582
  • 财政年份:
    2021
  • 资助金额:
    $ 16.2万
  • 项目类别:
    Standard Grant
Collaborative Proposal: MRA: Using NEON data to elucidate the ecological effects of global environmental change on phenology across time and space
合作提案:MRA:利用 NEON 数据阐明全球环境变化对跨时间和空间物候的生态影响
  • 批准号:
    2017463
  • 财政年份:
    2021
  • 资助金额:
    $ 16.2万
  • 项目类别:
    Standard Grant
Collaborative Proposal: MRA: Using NEON data to elucidate the ecological effects of global environmental change on phenology across time and space
合作提案:MRA:利用 NEON 数据阐明全球环境变化对跨时间和空间物候的生态影响
  • 批准号:
    2017740
  • 财政年份:
    2021
  • 资助金额:
    $ 16.2万
  • 项目类别:
    Standard Grant
Collaborative Proposal: Plastic Spiraling In River Networks (Plastic-SIReN): Determining the controls of watershed plastic fluxes using a field and modeling approach
合作提案:河流网络中的塑料螺旋 (Plastic-SIReN):使用现场和建模方法确定流域塑料通量的控制
  • 批准号:
    2113333
  • 财政年份:
    2021
  • 资助金额:
    $ 16.2万
  • 项目类别:
    Standard Grant
Collaborative Proposal: MRA: Using NEON data to elucidate the ecological effects of global environmental change on phenology across time and space
合作提案:MRA:利用 NEON 数据阐明全球环境变化对跨时间和空间物候的生态影响
  • 批准号:
    2017785
  • 财政年份:
    2021
  • 资助金额:
    $ 16.2万
  • 项目类别:
    Standard Grant
Collaborative Proposal: Plastic Spiraling In River Networks (Plastic-SIReN): Determining the controls of watershed plastic fluxes using a field and modeling approach
合作提案:河流网络中的塑料螺旋 (Plastic-SIReN):使用现场和建模方法确定流域塑料通量的控制
  • 批准号:
    2113338
  • 财政年份:
    2021
  • 资助金额:
    $ 16.2万
  • 项目类别:
    Standard Grant
CRCNS Research Proposal: Collaborative Research: Evaluating Machine Learning Architectures Using a Massive Benchmark Dataset of Brain Responses to Natural Scenes
CRCNS 研究提案:协作研究:使用大脑对自然场景反应的大量基准数据集评估机器学习架构
  • 批准号:
    2138972
  • 财政年份:
    2020
  • 资助金额:
    $ 16.2万
  • 项目类别:
    Standard Grant
Collaborative Proposal: WoU-MMA: Observations of Gravitational Wave Sources Using the Long Wavelength Array
合作提案:WoU-MMA:使用长波长阵列观测引力波源
  • 批准号:
    2011731
  • 财政年份:
    2020
  • 资助金额:
    $ 16.2万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了