ITR/SY(CISE) Learning Syntactic/Semantic Information for Parsing
ITR/SY(CISE) 学习用于解析的句法/语义信息
基本信息
- 批准号:0112435
- 负责人:
- 金额:$ 44.94万
- 依托单位:
- 依托单位国家:美国
- 项目类别:Standard Grant
- 财政年份:2001
- 资助国家:美国
- 起止时间:2001-08-15 至 2006-07-31
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
This research concerns the unsupervised learning of structural information about English that is not present in current tree-banks (specifically the various Penn tree-banks). That is, one wants a machine to learn this information without having to create a corpus in which the information is annotated. The structural information to be learned often falls at the boundary between syntax and semantics; for example, does the fact that the "New York Stock Exchange" has as part of the name the location "New York" fall under syntax or semantics? What about the similarity between the expressions "[to] market useless items" and "the market for useless items"? The intention is to learn this kind of information in a form that current statistical parsers can use so that they can output more finely structured parses. But this is not meant to suggest that parsing is the sole use for this sort of information. More and more systems for automatically extracting information from free text use coreference detection and "named-entity recognition" (e.g., recognizing that "New York" is a location, but "New York Stock Exchange" is an organization). There is evidence to suggest that both coreference and named-entity recognition can be improved with the finer level of analysis to be made possible by this research. Or again, "language models" (programs that assign a probability to strings in a language) are standard parts of all current speech-recognition systems; there is evidence that suggests that finer grained syntactic analysis can improve current language models. Thus, this research will enable a wide variety of systems to make better use of language input and so make these systems more accessible to a diverse user pool.
这项研究涉及当前树库(特别是各种宾夕法尼亚树库)中不存在的英语结构信息的无监督学习。 也就是说,人们希望机器能够学习这些信息,而不必创建一个对信息进行注释的语料库。 所要学习的结构信息往往处于语法和语义的边界; 例如,“纽约证券交易所”名称中包含“纽约”这一事实是否属于语法或语义? “营销无用物品”和“无用物品市场”这两个表述有何相似之处? 目的是以当前统计解析器可以使用的形式学习此类信息,以便它们可以输出更精细结构的解析。 但这并不意味着解析是此类信息的唯一用途。 越来越多的自动从自由文本中提取信息的系统使用共指检测和“命名实体识别”(例如,识别“纽约”是一个位置,但“纽约证券交易所”是一个组织)。 有证据表明,通过本研究实现更精细的分析水平,共指和命名实体识别都可以得到改善。 或者,“语言模型”(为语言中的字符串分配概率的程序)是所有当前语音识别系统的标准部分;有证据表明,更细粒度的句法分析可以改进当前的语言模型。 因此,这项研究将使各种系统能够更好地利用语言输入,从而使这些系统更容易被不同的用户群访问。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Eugene Charniak其他文献
Framed PAINTING: The Representation of a Common Sense Knowledge Fragment
带框绘画:常识知识片段的表征
- DOI:
- 发表时间:
1977 - 期刊:
- 影响因子:0
- 作者:
Eugene Charniak - 通讯作者:
Eugene Charniak
A Common Representation for Problem-Solving and Language-Comprehension Information
解决问题和语言理解信息的通用表示
- DOI:
10.1016/0004-3702(81)90001-1 - 发表时间:
1981 - 期刊:
- 影响因子:0
- 作者:
Eugene Charniak - 通讯作者:
Eugene Charniak
Re-thinking Supertags in Linear Context-free Rewriting Systems for Constituency Parsing
重新思考用于选区解析的线性上下文无关重写系统中的超级标签
- DOI:
- 发表时间:
2021 - 期刊:
- 影响因子:0
- 作者:
Srinivas Bangalore;Aravind K. Joshi;Su;Sabine Brants;Stefanie Dipper;Peter Eisenberg;Sil;Esther K¨onig;Wolfgang Lezius;Branden Chan;Stefan Schweter;Eugene Charniak;Mark Johnson;Micha Elsner;David Austerweil;Isaac Ellis;Catherine Haxton;R. Hill;Jeremy Shrivaths;Michael Moore;Pozar;J. Devlin;Ming;Kenton Lee - 通讯作者:
Kenton Lee
Figures of Merit for Best-First Probabilistic Chart Parsing
最佳优先概率图解析的品质因数
- DOI:
- 发表时间:
1996 - 期刊:
- 影响因子:0
- 作者:
Sharon A. Caraballo;Eugene Charniak - 通讯作者:
Eugene Charniak
Toward a model of children's story comprehension
- DOI:
- 发表时间:
1972-12 - 期刊:
- 影响因子:0
- 作者:
Eugene Charniak - 通讯作者:
Eugene Charniak
Eugene Charniak的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Eugene Charniak', 18)}}的其他基金
EAGER: Construction of Inter-Igbo
EAGER:Inter-Igbo 的建设
- 批准号:
1240178 - 财政年份:2012
- 资助金额:
$ 44.94万 - 项目类别:
Standard Grant
Improved Statistical Language Models
改进的统计语言模型
- 批准号:
9319516 - 财政年份:1994
- 资助金额:
$ 44.94万 - 项目类别:
Continuing Grant
Probability and Natural Language Processing
概率与自然语言处理
- 批准号:
8911122 - 财政年份:1989
- 资助金额:
$ 44.94万 - 项目类别:
Continuing Grant
A Single-Semantic-Process Theory of Parsing (Information Science)
解析的单语义过程理论(信息科学)
- 批准号:
8515005 - 财政年份:1986
- 资助金额:
$ 44.94万 - 项目类别:
Continuing Grant
An Approach to Abductive Inference in Artificial Intelligence Systems (Information Science)
人工智能系统中的溯因推理方法(信息科学)
- 批准号:
8416034 - 财政年份:1985
- 资助金额:
$ 44.94万 - 项目类别:
Standard Grant
Research on Natural Language Processing (Frame Selection)
自然语言处理研究(帧选择)
- 批准号:
8013690 - 财政年份:1981
- 资助金额:
$ 44.94万 - 项目类别:
Standard Grant
Computer Science and Computer Engineering Research Equipment
计算机科学与计算机工程研究设备
- 批准号:
7907810 - 财政年份:1979
- 资助金额:
$ 44.94万 - 项目类别:
Standard Grant
相似国自然基金
基于Nurr1调节YAP-INF2-线粒体分裂途径探讨龙琥醒脑颗粒在SH-SY5Y细胞氧糖剥夺再灌注诱发的神经元损伤的保护作用研究
- 批准号:2025JJ80982
- 批准年份:2025
- 资助金额:0.0 万元
- 项目类别:省市级项目
SY4835通过WEE1/DDR1双靶点抑制胰腺癌的作用及机制
- 批准号:82373136
- 批准年份:2023
- 资助金额:48 万元
- 项目类别:面上项目
米糠黄酮抑制Aβ诱导的SH-SY5Y细胞中Tau蛋白过度磷酸化的分子机制研究
- 批准号:2022JJ31009
- 批准年份:2022
- 资助金额:0.0 万元
- 项目类别:省市级项目
天目山来源链霉菌Streptomyces sp. SY1322中morindolestatin类新颖咔唑生物碱获取及其铁死亡抑制活性研究
- 批准号:LY21H300001
- 批准年份:2020
- 资助金额:0.0 万元
- 项目类别:省市级项目
基于MDM2-p53和MDMX-p53蛋白-蛋白相互作用的双重抑制剂SY1108的结构优化及抗肿瘤活性研究
- 批准号:21867013
- 批准年份:2018
- 资助金额:40.0 万元
- 项目类别:地区科学基金项目
昆虫病原线虫共生菌SY5致死小菜蛾毒素的中肠靶标受体分离与鉴定
- 批准号:31301663
- 批准年份:2013
- 资助金额:23.0 万元
- 项目类别:青年科学基金项目
圆根大戟和甘遂中保护多巴胺所致SH-SY5Y细胞损伤帕金森模型作用和机制研究
- 批准号:81260628
- 批准年份:2012
- 资助金额:49.0 万元
- 项目类别:地区科学基金项目
拟南芥SY1蛋白抑制逆境基因表达的分子机理研究
- 批准号:31270316
- 批准年份:2012
- 资助金额:80.0 万元
- 项目类别:面上项目
刺五加有效组分对转染α-Syn的 SH-SY5Y细胞调控及机制研究
- 批准号:81073019
- 批准年份:2010
- 资助金额:32.0 万元
- 项目类别:面上项目
亚洲含SY基因组披碱草属植物地理分化的分子生物学基础
- 批准号:30270092
- 批准年份:2002
- 资助金额:20.0 万元
- 项目类别:面上项目
相似海外基金
ITR/SY(CISE): Putting Multi Stage Annotations to Work
ITR/SY(CISE):将多阶段注释投入使用
- 批准号:
0302421 - 财政年份:2002
- 资助金额:
$ 44.94万 - 项目类别:
Standard Grant
ITR/SY(CISE): Biomolecular Computing by DNA/Enzyme Systems
ITR/SY(CISE):DNA/酶系统的生物分子计算
- 批准号:
0113443 - 财政年份:2001
- 资助金额:
$ 44.94万 - 项目类别:
Standard Grant
ITR/SY(CISE): Putting Multi Stage Annotations to Work
ITR/SY(CISE):将多阶段注释投入使用
- 批准号:
0113569 - 财政年份:2001
- 资助金额:
$ 44.94万 - 项目类别:
Standard Grant
ITR/SY(CISE): Compositional Connectors
ITR/SY(CISE):组合连接器
- 批准号:
0113810 - 财政年份:2001
- 资助金额:
$ 44.94万 - 项目类别:
Standard Grant
ITR/SY(CISE): Why algorithms work well in practice: pertubation-based average-case analysis of the simplex algorithm and beyond
ITR/SY(CISE):为什么算法在实践中表现良好:单纯形算法及其他算法的基于扰动的平均情况分析
- 批准号:
0112487 - 财政年份:2001
- 资助金额:
$ 44.94万 - 项目类别:
Standard Grant
ITR/SY(CISE): Cache-Oblivious Data Structures
ITR/SY(CISE):忽略缓存的数据结构
- 批准号:
0112849 - 财政年份:2001
- 资助金额:
$ 44.94万 - 项目类别:
Continuing Grant
ITR/SY+IM(CISE): Self-Calibrating, Scalable Displays for Digital Library Collections
ITR/SY IM(CISE):数字图书馆馆藏的自校准、可扩展显示器
- 批准号:
0113325 - 财政年份:2001
- 资助金额:
$ 44.94万 - 项目类别:
Continuing Grant
ITR/SY (CISE): Software Improvement Through Binary Rewriting
ITR/SY (CISE):通过二进制重写改进软件
- 批准号:
0113633 - 财政年份:2001
- 资助金额:
$ 44.94万 - 项目类别:
Continuing Grant
ITR/SY (CISE): Verification and Supervisory Control of Hybrid Embedded Systems
ITR/SY (CISE):混合嵌入式系统的验证和监督控制
- 批准号:
0113131 - 财政年份:2001
- 资助金额:
$ 44.94万 - 项目类别:
Standard Grant
ITR/SY(CISE): Cryptography: Examining the Assumptions
ITR/SY(CISE):密码学:检查假设
- 批准号:
0113941 - 财政年份:2001
- 资助金额:
$ 44.94万 - 项目类别:
Continuing Grant