A Study for Knowledge ExtractionAid System from Web Text
网络文本知识提取辅助系统的研究
基本信息
- 批准号:17200007
- 负责人:
- 金额:$ 27.79万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Scientific Research (A)
- 财政年份:2005
- 资助国家:日本
- 起止时间:2005 至 2007
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
We aimed at a system that extracts texts or part of texts including knowledge which various users are interested in from huge amount of Web pages in this research. We developed the following systems for this purpose.(1) A system which extracts terms that characterize a search engine result web pages using the term extraction system "Gensen Web" which we have already developed.(2) A system which extracts definition of terms which we extract by the system of (1) and relations among these terms. To accomplish this task, we utilize the usage consultation system via Web search engine called "Kiwi."(3) In order to make more efficient system of (2), we employed a suffix array technology and use the web pages crawled in advance. We named the system as "UT-Kiwi" and made it publically available from the Internet.(4) To enhance the above described systems, we developed a people name search engine named "Nayose." When we search pages for given people name, we get pages indicating distinct person even though they have the same name. Our system clusters those web pages according to the real person.(5) Aiming at more innovative knowledge extraction, we also studied new machine learning algorithms based on non-parametric Bayes theory.(6) Utilize web page in English more, we developed the Sakumon system which is an assisting system for English cloze test using English web pages.
本研究的目标是从海量的Web页面中抽取文本或部分文本,其中包含各种用户感兴趣的知识。为此,我们开发了以下系统。(1)使用我们已经开发的术语提取系统Gensen Web来提取表征搜索引擎结果网页的术语的系统。(2)通过(1)的系统提取术语的定义以及这些术语之间的关系的系统。为了完成这一任务,我们利用了通过Web搜索引擎的使用咨询系统--猕猴桃。(3)为了使(2)的系统更高效,我们采用了后缀数组技术,并使用了预先抓取的网页。我们将该系统命名为“UT-Kiwi”,并将其从互联网上公开提供。(4)为了增强上述系统,我们开发了一个名为“Nayose”的人名搜索引擎。当我们在页面上搜索给定的人名时,我们得到的页面指示不同的人,即使他们的名字相同。针对更具创新性的知识提取,研究了基于非参数贝叶斯理论的机器学习算法。(6)进一步利用英文网页,开发了英语完形填空辅助系统Sakumon系统。
项目成果
期刊论文数量(57)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
用例検索システムKiwiの知識テキストマイニングツールへの拡張
将示例搜索系统 Kiwi 扩展为知识文本挖掘工具
- DOI:
- 发表时间:2006
- 期刊:
- 影响因子:0
- 作者:藤本宏涼;国安結;中川裕志;吉田稔;清田陽司
- 通讯作者:清田陽司
A Multilingual Usage Consultation Tool based on Internet Searching ---More than search engine, Less than QA
基于互联网搜索的多语言使用咨询工具——不止于搜索引擎,低于QA
- DOI:
- 发表时间:2005
- 期刊:
- 影响因子:0
- 作者:Kumiko Tanaka-Ishii;Hiroshi Nakagawa
- 通讯作者:Hiroshi Nakagawa
Cross-Lingual Concern Analysisi from Multiingual Weblog Articles
多语言博客文章中的跨语言关注分析
- DOI:
- 发表时间:2007
- 期刊:
- 影响因子:0
- 作者:Tomohiro Fukuhara;Takehito Utsuro;Hiroshi Nakagawa
- 通讯作者:Hiroshi Nakagawa
Understanding Sentiment of People from News Articles: Temporal Sentiment Analysis of Social Events
- DOI:
- 发表时间:2007
- 期刊:
- 影响因子:0
- 作者:T. Fukuhara;Hiroshi Nakagawa;T. Nishida
- 通讯作者:T. Fukuhara;Hiroshi Nakagawa;T. Nishida
Application of Variational Bayse to Dirichlet Process Unigram Mixture Model
变分贝叶斯在狄利克雷过程一元混合模型中的应用
- DOI:
- 发表时间:2007
- 期刊:
- 影响因子:0
- 作者:Issei Sato;Hiroshi Nakagawa
- 通讯作者:Hiroshi Nakagawa
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
NAKAGAWA Hiroshi其他文献
Field survey on rice spikelet sterility in an extremely hot summer of 2018 in Japan
2018年日本酷暑水稻穗不育田间调查
- DOI:
10.2480/agrmet.d-21-00024 - 发表时间:
2021 - 期刊:
- 影响因子:1.3
- 作者:
YOSHIMOTO Mayumi;SAKAI Hidemitsu;ISHIGOOKA Yasushi;KUWAGATA Tsuneo;ISHIMARU Tsutomu;NAKAGAWA Hiroshi;MARUYAMA Atsushi;OGIWARA Hitoshi;NAGATA Kenji - 通讯作者:
NAGATA Kenji
The Heroic Epic of the Ainu
阿伊努人的英雄史诗
- DOI:
- 发表时间:
2009 - 期刊:
- 影响因子:0
- 作者:
白石典之;相馬秀廣;加藤雄三;A. エンフトル;加藤哲郎;サーラ・スヴェン;橋本雄一;Yoshihiko Hirano;木村一信・崔在〓(共編著);中野 等;松澤克行;西沢保;礒永和貴;金沢陽;平野嘉彦;陳來幸;李静和(編著);白石 典之;岩井茂樹;清水和裕;山内民博;サーラ・スヴェン;ロナルド・トビ;小泉徹;NAKAGAWA Hiroshi - 通讯作者:
NAKAGAWA Hiroshi
貿易陶磁時代区分試論-出光美術館陶片室の貿易陶磁片展示解説基礎学習
贸易陶瓷时期分类考察 - 出光美术馆陶瓷件室贸易陶瓷件展览说明基础研究
- DOI:
- 发表时间:
2009 - 期刊:
- 影响因子:0
- 作者:
白石典之;相馬秀廣;加藤雄三;A. エンフトル;加藤哲郎;サーラ・スヴェン;橋本雄一;Yoshihiko Hirano;木村一信・崔在〓(共編著);中野 等;松澤克行;西沢保;礒永和貴;金沢陽;平野嘉彦;陳來幸;李静和(編著);白石 典之;岩井茂樹;清水和裕;山内民博;サーラ・スヴェン;ロナルド・トビ;小泉徹;NAKAGAWA Hiroshi;藤井讓治;松方冬子;金沢陽 - 通讯作者:
金沢陽
【歴代古案】所収二月九日付上杉景勝宛秀吉条書と『出雲意宇六社文書』所収正月九日付羽柴秀吉書状をめぐって
【历史古物】《出云六色书》中2月9日秀吉写给上杉景胜的文章和1月9日羽柴秀吉的信
- DOI:
- 发表时间:
2007 - 期刊:
- 影响因子:0
- 作者:
白石典之;相馬秀廣;加藤雄三;A. エンフトル;加藤哲郎;サーラ・スヴェン;橋本雄一;Yoshihiko Hirano;木村一信・崔在〓(共編著);中野 等;松澤克行;西沢保;礒永和貴;金沢陽;平野嘉彦;陳來幸;李静和(編著);白石 典之;岩井茂樹;清水和裕;山内民博;サーラ・スヴェン;ロナルド・トビ;小泉徹;NAKAGAWA Hiroshi;藤井讓治 - 通讯作者:
藤井讓治
モダニティーの想像力
现代性的想象
- DOI:
- 发表时间:
2009 - 期刊:
- 影响因子:0
- 作者:
白石典之;相馬秀廣;加藤雄三;A. エンフトル;加藤哲郎;サーラ・スヴェン;橋本雄一;Yoshihiko Hirano;木村一信・崔在〓(共編著);中野 等;松澤克行;西沢保;礒永和貴;金沢陽;平野嘉彦;陳來幸;李静和(編著);白石 典之;岩井茂樹;清水和裕;山内民博;サーラ・スヴェン;ロナルド・トビ;小泉徹;NAKAGAWA Hiroshi;藤井讓治;松方冬子;金沢陽;高見澤磨;中川成美(著) - 通讯作者:
中川成美(著)
NAKAGAWA Hiroshi的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('NAKAGAWA Hiroshi', 18)}}的其他基金
Development of a novel therapeutic approach targeting gingipain for regression phenomenon in Down syndrome
开发一种针对唐氏综合症消退现象的牙龈蛋白酶的新型治疗方法
- 批准号:
20K10204 - 财政年份:2020
- 资助金额:
$ 27.79万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
Study on the relationship among nutrients, ABC transporters and locomotive system
营养物质、ABC转运蛋白与运动系统关系的研究
- 批准号:
16K00879 - 财政年份:2016
- 资助金额:
$ 27.79万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
Development of the new molecular target therapy for wound healing of oral mucosa
口腔粘膜创面愈合新型分子靶向治疗药物的研制
- 批准号:
16K11805 - 财政年份:2016
- 资助金额:
$ 27.79万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
A Study of Privacy Protection in Information Retrieval
信息检索中的隐私保护研究
- 批准号:
15H02700 - 财政年份:2015
- 资助金额:
$ 27.79万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
Preventing A False Light Caused by k-anonymity with Mathematical Modling and Optimization
通过数学建模和优化防止 k-匿名引起的假光
- 批准号:
26540041 - 财政年份:2014
- 资助金额:
$ 27.79万 - 项目类别:
Grant-in-Aid for Challenging Exploratory Research
Development of the new molecular target therapy for phenytoin-induced gingival overgrowth using the antagonist of TRPA1 channel
使用 TRPA1 通道拮抗剂开发新的分子靶向治疗苯妥英诱导的牙龈过度生长
- 批准号:
25463180 - 财政年份:2013
- 资助金额:
$ 27.79万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
Comprehensive analysis of the relationship between the function of ABC transporters and bone metabolism; from the view point of osteoclast generation and function
综合分析ABC转运蛋白功能与骨代谢的关系;
- 批准号:
24592822 - 财政年份:2012
- 资助金额:
$ 27.79万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
A Study on Differential Privacy for Data Base with Correlation
相关数据库差分隐私研究
- 批准号:
24650064 - 财政年份:2012
- 资助金额:
$ 27.79万 - 项目类别:
Grant-in-Aid for Challenging Exploratory Research
Descriptive Study of Mukawa Dialect of Ainu using Recorded Materials
利用记录材料对阿伊努族川方言进行描述性研究
- 批准号:
23320080 - 财政年份:2011
- 资助金额:
$ 27.79万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
Proposal of a new phonological unit of phonological typology
音系类型学新音系单元的提案
- 批准号:
23652082 - 财政年份:2011
- 资助金额:
$ 27.79万 - 项目类别:
Grant-in-Aid for Challenging Exploratory Research
相似海外基金
Investigation on sentential inference bridging between lexical/grammatical knowledge and text comprehension
词汇/语法知识与文本理解之间的句子推理桥接研究
- 批准号:
23K00628 - 财政年份:2023
- 资助金额:
$ 27.79万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
Constructing a large-scale biomedical knowledge graph using all PubMed abstracts and PMC full-text articles and its applications
利用所有PubMed摘要和PMC全文文章构建大规模生物医学知识图谱及其应用
- 批准号:
10648553 - 财政年份:2023
- 资助金额:
$ 27.79万 - 项目类别:
CAREER: Knowledge Extraction and Discovery from Massive Text Corpora via Extremely Weak Supervision
职业:通过极弱监督从海量文本语料库中提取和发现知识
- 批准号:
2239440 - 财政年份:2023
- 资助金额:
$ 27.79万 - 项目类别:
Continuing Grant
III: Small: Intelligent Scientific Text Analytics with Knowledge-Augmented Abductive Reasoning
III:小:具有知识增强归纳推理的智能科学文本分析
- 批准号:
2234058 - 财政年份:2023
- 资助金额:
$ 27.79万 - 项目类别:
Standard Grant
From Rights to Votes: Understanding Political Knowledge and Mobilization Via Text Messaging Among System-Impacted Groups
从权利到投票:通过受系统影响的群体中的短信了解政治知识和动员
- 批准号:
2215480 - 财政年份:2022
- 资助金额:
$ 27.79万 - 项目类别:
Continuing Grant
Extending knowledge graph structures through deep text understanding
通过深度文本理解扩展知识图结构
- 批准号:
22K12044 - 财政年份:2022
- 资助金额:
$ 27.79万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
Knowledge based neural question generation from text
从文本生成基于知识的神经问题
- 批准号:
560815-2020 - 财政年份:2022
- 资助金额:
$ 27.79万 - 项目类别:
Alliance Grants
Automatic knowledge discovery from scientific text.
从科学文本中自动发现知识。
- 批准号:
558981-2021 - 财政年份:2022
- 资助金额:
$ 27.79万 - 项目类别:
Alexander Graham Bell Canada Graduate Scholarships - Doctoral
Building and Querying Knowledge Graphs from Text Corpora
从文本语料库构建和查询知识图
- 批准号:
RGPIN-2018-04270 - 财政年份:2022
- 资助金额:
$ 27.79万 - 项目类别:
Discovery Grants Program - Individual
Temporal Knowledge Graph Construction from Text
从文本构建时态知识图
- 批准号:
21K17816 - 财政年份:2021
- 资助金额:
$ 27.79万 - 项目类别:
Grant-in-Aid for Early-Career Scientists