経験マイニング : Web文書からの個人の経験の抽出と分類
经验挖掘:从网络文档中提取个人经验并进行分类
基本信息
- 批准号:19024057
- 负责人:
- 金额:$ 4.1万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Scientific Research on Priority Areas
- 财政年份:2007
- 资助国家:日本
- 起止时间:2007 至 2008
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
商品やサービスなど, 指定されたトピックに関連する個人の経験の記述をWeb文書集合から収集し, 述語項構造に基づく表現形式に構造化するとともに, 事態タイプ(ポジティブ/ネガティブな出来事・状態, 入手・利用等の行為など)や事実性情報(当該事態の時間情報とそれに対する話者態度)といった意味情報を解析する経験マイニングを開発した. 20年度の具体的成果は次の4点である.(1)評価極性知識獲得の大規模実験 : 事態タイプのうち, とくに「遅刻する, 炎症が治まる, 錆が出る」など, 評価極性を持つ出来事に関する知識の獲得に注力し, 大規模なWeb文書コーパスからこれを獲得する実験を行った. その結果, コーパスのサイズを大きくすると, 獲得できる知識の精度, カバレッジともに劇的に向上に, 最終的に1.6億文のコーパスから75以上のカバレッジを85以上の精度で獲得できることが確かめられた.(2)事実性解析モデルの洗練 : 事実性解析については, 2007年度の成果をベースに, 事実性タグ体系の見直しと訓練データの拡張を行った. また, 文中で隣接する事態表現の事実性の間に依存関係があることに着目し, これをFactorial CRFでモデル化することによって解析精度を向上させることができた.(3)公開デモサイト「みんなの経験」の開発 : 以上の成果を利用し, 文書集合から実際に経験情報を抽出し, データペース化するシステムを開発するとともに, これを最近1年半分のプログ記事(約1億5千万記事)に適用し, 約5千万件の経験情報からなる経験データベースを構築した. このデータベースは, 今年度新たに開発した公開デモサイト「みんなの経験」で検索できるようになっている. 同サイトは, プログデータの利用契約の締結に時間を要したが, 2008年12月上旬に無制限一般公開できる運びになっている.(4)民間への技術移転 : 大手Webポータルサイト「@nifty」を運営するニフティ株式会社と連携し, 同社のサービス業務に経験マイニングの技術を導入する準備を進めた.
Product description, specification, relationship, personal history, Web document collection, collection, term construction, basic presentation, construction, event description The information of the event (the time information of the event and the attitude of the speaker) and the meaning information of the event are analyzed. 20 years of concrete results of the four points. (1)Evaluation of polarity knowledge acquisition on a large scale: events are in progress, inflammation is cured, and the acquisition of knowledge is focused on evaluation of polarity, and large-scale Web documents are acquired. As a result, the accuracy of the knowledge obtained is greater than 75%, the accuracy of the knowledge obtained is greater than 85%, and the accuracy of the knowledge obtained is greater than 75%. (2)Practice analysis: Practice analysis, 2007 results, practice system and training training. The relationship between the behavior of the event and the accuracy of the analysis is discussed in detail. (3)Development of open media: The above achievements are utilized, and the collection of documents is extracted from the current media information. The development of media information is applicable to the development of media records (about 150 million records) in the last one and a half years, and about 50 million pieces of media information are constructed. This year's new launch is open to the public. In the same way, the time of conclusion of the contract for the use of information is required. In early December 2008, there is no restriction on the general public. (4)Technology migration of civil society: preparation for the introduction of technology in the operation of large Web services "@nifty"
项目成果
期刊论文数量(15)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
言語処理から知に迫る-自然言語処理からの再挑戦-
通过语言处理获取知识——自然语言处理的另一个挑战——
- DOI:
- 发表时间:2008
- 期刊:
- 影响因子:0
- 作者:阿部修也;江口萌;隅田飛鳥;大崎梓;乾健太郎;Kentaro Inui;乾健太郎
- 通讯作者:乾健太郎
Two-Phased Event Relation Acquisition: Coupling the Relation-Oriented and Argument-Oriented Approaches
- DOI:10.3115/1599081.1599082
- 发表时间:2008-08
- 期刊:
- 影响因子:0
- 作者:Shuya Abe;Kentaro Inui;Yuji Matsumoto
- 通讯作者:Shuya Abe;Kentaro Inui;Yuji Matsumoto
みんなの経験 : プログから抽出したイベントおよびセンチメントのDB化
每个人的经验:创建从节目中提取的事件和情绪的数据库
- DOI:
- 发表时间:2009
- 期刊:
- 影响因子:0
- 作者:阿部修也;江口萌;隅田飛鳥;大崎梓;乾健太郎
- 通讯作者:乾健太郎
Common semantic resources for textual statement extraction and organization
用于文本语句提取和组织的通用语义资源
- DOI:
- 发表时间:2008
- 期刊:
- 影响因子:0
- 作者:阿部修也;江口萌;隅田飛鳥;大崎梓;乾健太郎;Kentaro Inui
- 通讯作者:Kentaro Inui
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
乾 健太郎其他文献
Wikipedia記事に対する拡張固有表現ラベルの多重付与
为维基百科文章多重分配扩展实体标签
- DOI:
- 发表时间:
2016 - 期刊:
- 影响因子:0
- 作者:
鈴木 正敏;松田 耕史;関根 聡;岡崎 直観;乾 健太郎 - 通讯作者:
乾 健太郎
人間同士の雑談における話題遷移モデリング
人类聊天中的主题转换建模
- DOI:
- 发表时间:
2023 - 期刊:
- 影响因子:0
- 作者:
岸波 洋介;赤間 怜奈;佐藤 志貴;徳久 良子;鈴木 潤;乾 健太郎 - 通讯作者:
乾 健太郎
日本語Wikificationコーパスの構築に向けて
致力于建立日语维基百科语料库
- DOI:
- 发表时间:
2016 - 期刊:
- 影响因子:0
- 作者:
Davaajav Jargalsaikhan;岡崎 直観;松田 耕史;乾 健太郎 - 通讯作者:
乾 健太郎
前面投影と背面投影の組み合わせによるステルス投影の広域化
正投与背投相结合的广域隐形投影
- DOI:
- 发表时间:
2020 - 期刊:
- 影响因子:0
- 作者:
鈴木 正敏;松田 耕史;大内 啓樹;鈴木 潤;乾 健太郎;Noriaki Kuwahara,Kiyoshi Yasuda;宮田章裕;野村柾貴,森﨑慶人,脇田 航;奥田慎一,橋本直己 - 通讯作者:
奥田慎一,橋本直己
ユーザ生成コンテンツの高品質な自動翻訳に向けた言語現象の体系的分析
对语言现象进行系统分析,以实现用户生成内容的高质量自动翻译
- DOI:
- 发表时间:
2021 - 期刊:
- 影响因子:0
- 作者:
藤井 諒;三田 雅人;阿部 香央莉;塙 一晃;森下 睦;鈴木 潤;乾 健太郎 - 通讯作者:
乾 健太郎
乾 健太郎的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('乾 健太郎', 18)}}的其他基金
Computational Modeling of Argumentation Understanding
论证理解的计算建模
- 批准号:
22H00524 - 财政年份:2022
- 资助金额:
$ 4.1万 - 项目类别:
Grant-in-Aid for Scientific Research (A)
文書集合からの事態関係知識の自動獲得と深い言語理解への応用
从文档集中自动获取情境相关知识并应用于深度语言理解
- 批准号:
15680006 - 财政年份:2003
- 资助金额:
$ 4.1万 - 项目类别:
Grant-in-Aid for Young Scientists (A)
既存の言語資源からの大規模語彙的言い換え知識の自動抽出
从现有语言资源中自动提取大规模词汇释义知识
- 批准号:
13780293 - 财政年份:2001
- 资助金额:
$ 4.1万 - 项目类别:
Grant-in-Aid for Young Scientists (B)
知覚神経による骨代謝調節に関する研究
感觉神经调节骨代谢的研究
- 批准号:
12770795 - 财政年份:2000
- 资助金额:
$ 4.1万 - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (A)
骨延長法の骨成熟過程に対する非浸襲性低出力超音波の影響
无创低功率超声对骨延长法骨成熟过程的影响
- 批准号:
10770720 - 财政年份:1998
- 资助金额:
$ 4.1万 - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (A)
タスク指向日本語対話システムにおける漸進的発話の生成方法に関する研究
任务导向日语对话系统中渐进式话语生成方法研究
- 批准号:
09780318 - 财政年份:1997
- 资助金额:
$ 4.1万 - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (A)
タスク指向日本語対話システムにおけるあいづちの理解と生成に関する研究
面向任务的日语对话系统中Aizuchi的理解与生成研究
- 批准号:
08780335 - 财政年份:1996
- 资助金额:
$ 4.1万 - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (A)
相似海外基金
Building of an educational system of developmental care in NICU for nursing staff
NICU护理人员发育护理教育体系的构建
- 批准号:
15H05091 - 财政年份:2015
- 资助金额:
$ 4.1万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
International Cmparative Study on Evaluation of After-school Support at School Premise and the effects on Disparity Correction
校内课外支持评价及其对差距矫正效果的国际比较研究
- 批准号:
25301048 - 财政年份:2013
- 资助金额:
$ 4.1万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
A Comparative Research on Teacher Laws under Neo-Liberal Reforms in the U.S. and Japan
美日新自由主义改革下教师法比较研究
- 批准号:
22730626 - 财政年份:2010
- 资助金额:
$ 4.1万 - 项目类别:
Grant-in-Aid for Young Scientists (B)
Tourist behavior of foreign visitors to Japan: An analysis of travel barrier through qualitative and quantitative research method
外国游客赴日旅游行为:通过定性和定量研究方法分析旅游障碍
- 批准号:
22530457 - 财政年份:2010
- 资助金额:
$ 4.1万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
The Construction of Medical Malpractice and Realization of Public Sphere on the Internet
互联网医疗事故公共领域的构建与实现
- 批准号:
21530523 - 财政年份:2009
- 资助金额:
$ 4.1万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
Building a supportive coaching program : Qualitative analysis of coaching expertise of elite sport coaches
建立支持性教练计划:精英体育教练的教练专业知识的定性分析
- 批准号:
21500577 - 财政年份:2009
- 资助金额:
$ 4.1万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
Facilities Search and Google Street View Using Reputation in Blogs
使用博客中的声誉进行设施搜索和 Google 街景
- 批准号:
21700116 - 财政年份:2009
- 资助金额:
$ 4.1万 - 项目类别:
Grant-in-Aid for Young Scientists (B)
Construction of a Collective Judgment Formation Model of Electronic Democracy
电子民主集体判断形成模型的构建
- 批准号:
19500209 - 财政年份:2007
- 资助金额:
$ 4.1万 - 项目类别:
Grant-in-Aid for Scientific Research (C)