多言語Webテキストからの知識マイニング関する研究
多语言网络文本知识挖掘研究
基本信息
- 批准号:19024014
- 负责人:
- 金额:$ 6.53万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Scientific Research on Priority Areas
- 财政年份:2007
- 资助国家:日本
- 起止时间:2007 至 2008
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
知識マイニングアルゴリズムの開発 : 多言語テキストコーパスから有用な情報抽出を行うための知識マイニングアルゴリズムとして、複数トピックを併せ持つテキストにおいてトピックを潜在変数とした単語の分類を行う統計的機械学習アルゴリズムを、階層的ディリクレ過程を基礎にした数理モデルによって開発した。これによってテキストにおける潜在トピックとそのトピックに対応する単語集合という知識を自動抽出できるアルゴリズムが明らかになった。人名の参照曖昧性解消 : Webテキスト処理において重要な応用である同性同名の人物の検索結果を実世界の異なる人物を記述するページごとにクラスタリングする参照曖昧性解消システムを開発した。これは、教師なし機械学習によるため、精度、高速性の両面から検討し、Web検索エンジンで人名検索を行った結果において同性同名の人物を参照するページを実世界において異なる人物毎に5秒程度で高速にクラスタリングするシステムの開発し、その精度の実験的評価を行った結果、F値で0.8を得た。スパムプログ分析 : Web上の重要な情報資源であるブログは常にスパムブログに悩まされており、排除のために大きなコストがかかっている。評判分析などの目的でブログの有効利用を図ることができる環境整備のツールとしてスパムブログの判定に役立つようなスパムブログの構造分析システムについて検討した。この結果、語彙にかかわる素性を分割してSVMを適用し、その結果をロジスティック回帰して組み合わせる方法によって、精度0.88を得た。
Knowledge development: Multi-language, multi-language. This is a list of potential users who can automatically extract their knowledge. Name Reference Ambiguity Resolution: Web Search Results for Same Sex and Same Name People Description of Different People in the World For example, teacher's mechanical learning, accuracy, speed, and surface search results, Web search results, and the evaluation results of the same sex, same name, and different people in the world, F = 0.8. Web analytics: Important information resources on the Web. Evaluation and analysis of the effective use of environmental protection, environmental protection The result, the word, the element, the segmentation, the SVM, the result, the method, the accuracy, the accuracy, the accuracy.
项目成果
期刊论文数量(11)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Person Name Disambiguation in Web Pages Using Social Network, Compound Words and Latent Topics
- DOI:10.1007/978-3-540-68125-0_24
- 发表时间:2008-05
- 期刊:
- 影响因子:0
- 作者:Shingo Ono;Issei Sato;Minoru Yoshida;Hiroshi Nakagawa
- 通讯作者:Shingo Ono;Issei Sato;Minoru Yoshida;Hiroshi Nakagawa
汎用シソーラス探索ライブラリの開発
通用同义词库搜索库的开发
- DOI:
- 发表时间:2008
- 期刊:
- 影响因子:0
- 作者:松岡 有希;坂本 竜基;伊藤 禎宣;大向 一輝;武田 英明;小暮 潔;清田 陽司(他5名)
- 通讯作者:清田 陽司(他5名)
Gram-Free Synonym Extraction via Suffix Arrays
通过后缀数组进行无革兰氏同义词提取
- DOI:
- 发表时间:2008
- 期刊:
- 影响因子:0
- 作者:Minoru Yoshida;Hiroshi Nakagawa
- 通讯作者:Hiroshi Nakagawa
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
中川 裕志其他文献
Dynamic Scheduling for Multiprocessor Systems with Static Priority lists
具有静态优先级列表的多处理器系统的动态调度
- DOI:
- 发表时间:
2007 - 期刊:
- 影响因子:0
- 作者:
中川 裕志;湯本 紘彰;森 辰則;H.Youhata - 通讯作者:
H.Youhata
A Study about Cybernetic Avatar after the Death of the Master Person
大师死后的控制论化身研究
- DOI:
10.7210/jrsj.41.9 - 发表时间:
2023 - 期刊:
- 影响因子:0
- 作者:
Atsuko Kanematsu;Ryota Ando;Shun Hirano;Mamoru Endo;Takatoshi Naka;Masashi Yamada;Shinya Miyazaki;安藤亮太,平野隼,兼松篤子,遠藤守,中貴俊,山田雅之,宮崎慎也;中川 裕志;Nakagawa Hiroshi - 通讯作者:
Nakagawa Hiroshi
中川 裕志的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('中川 裕志', 18)}}的其他基金
多言語Webテキストからの知識マイニングに関する研究
多语言网络文本知识挖掘研究
- 批准号:
18049011 - 财政年份:2006
- 资助金额:
$ 6.53万 - 项目类别:
Grant-in-Aid for Scientific Research on Priority Areas
分かり易さ向上のためのテキストコンテンツ変換に関する研究
文本内容转换以提高可理解性的研究
- 批准号:
16016215 - 财政年份:2004
- 资助金额:
$ 6.53万 - 项目类别:
Grant-in-Aid for Scientific Research on Priority Areas
分かり易さ向上のためのテキストコンテンツ変換に関する研究
文本内容转换以提高可理解性的研究
- 批准号:
15017217 - 财政年份:2003
- 资助金额:
$ 6.53万 - 项目类别:
Grant-in-Aid for Scientific Research on Priority Areas
モバイル環境における理解容易なテキスト生成のための自然言語処理に関する研究
移动环境中易于理解的文本生成的自然语言处理研究
- 批准号:
14019017 - 财政年份:2002
- 资助金额:
$ 6.53万 - 项目类别:
Grant-in-Aid for Scientific Research on Priority Areas
モバイル環境向けコンテンツ開発のための自然言語処理に関する研究
移动环境内容开发的自然语言处理研究
- 批准号:
13224019 - 财政年份:2001
- 资助金额:
$ 6.53万 - 项目类别:
Grant-in-Aid for Scientific Research on Priority Areas (C)
述語の意味による日本語談話理解システム
基于谓语意义的日语语篇理解系统
- 批准号:
08837008 - 财政年份:1996
- 资助金额:
$ 6.53万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
接続助詞の関係的意味に基づく日本語談話理解システムに関する研究
基于连词关系意义的日语语篇理解系统研究
- 批准号:
07221206 - 财政年份:1995
- 资助金额:
$ 6.53万 - 项目类别:
Grant-in-Aid for Scientific Research on Priority Areas
接続助詞の関係的意味に基づく日本語談話理解システムに関する研究
基于连词关系意义的日语语篇理解系统研究
- 批准号:
06232207 - 财政年份:1994
- 资助金额:
$ 6.53万 - 项目类别:
Grant-in-Aid for Scientific Research on Priority Areas
助動詞・助詞の関係的意味に基づく日本語談話理解システムに関する研究
基于助动词和助词关系意义的日语语篇理解系统研究
- 批准号:
05241205 - 财政年份:1993
- 资助金额:
$ 6.53万 - 项目类别:
Grant-in-Aid for Scientific Research on Priority Areas
確定節で表された知識ベースの無矛盾性維持に関する研究
定语从句表达的知识库一致性维护研究
- 批准号:
63633508 - 财政年份:1988
- 资助金额:
$ 6.53万 - 项目类别:
Grant-in-Aid for Scientific Research on Priority Areas
相似国自然基金
WWW多媒体内容安全模型与算法研究
- 批准号:60472082
- 批准年份:2004
- 资助金额:24.0 万元
- 项目类别:面上项目
基于页-对象视图的WWW上信息集成技术的研究
- 批准号:69803004
- 批准年份:1998
- 资助金额:12.0 万元
- 项目类别:青年科学基金项目
相似海外基金
https://www-kofu.jsps.go.jp/kofu1/shinsei/shoriKanri/kadaiKanriList.do
https://www-kofu.jsps.go.jp/kofu1/shinsei/shoriKanri/kadaiKanriList.do
- 批准号:
22K08059 - 财政年份:2022
- 资助金额:
$ 6.53万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
NUM - efficient, privacy-focused alternative to WWW for storing & retrieving structured data
NUM - 高效、注重隐私的 WWW 存储替代方案
- 批准号:
54162 - 财政年份:2020
- 资助金额:
$ 6.53万 - 项目类别:
Study
Analysis of lifestyle and health texts on the WWW consisting of text and numeric data.
对 WWW 上由文本和数字数据组成的生活方式和健康文本的分析。
- 批准号:
18K11549 - 财政年份:2018
- 资助金额:
$ 6.53万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
A development of an innohttps://www-kofu.jsps.go.jp/kofu1/shinsei/shoriKanri/kadaiKanriList.dovative technology to identify key odorants from complex volatile mixtures
开发了一种 innohttps://www-kofu.jsps.go.jp/kofu1/shinsei/shoriKanri/kadaiKanriList.dovative 技术,用于从复杂的挥发性混合物中识别关键气味剂
- 批准号:
17K19215 - 财政年份:2017
- 资助金额:
$ 6.53万 - 项目类别:
Grant-in-Aid for Challenging Research (Exploratory)
Integrated Media Analysis for Medical/Health Information Matching on WWW
WWW 医疗/健康信息匹配的综合媒体分析
- 批准号:
15K00425 - 财政年份:2015
- 资助金额:
$ 6.53万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
Integrated Development of Japanese linguistics by WWW searching
WWW检索的日语语言学综合发展
- 批准号:
26370551 - 财政年份:2014
- 资助金额:
$ 6.53万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
Research and Development about Support for Safe and Secure by Visualization of WWW information using Augmented Reality
通过使用增强现实技术可视化 WWW 信息来支持安全可靠的研究和开发
- 批准号:
25870576 - 财政年份:2013
- 资助金额:
$ 6.53万 - 项目类别:
Grant-in-Aid for Young Scientists (B)
Groupware Performance Library for the WWW
WWW 的群件性能库
- 批准号:
449403-2013 - 财政年份:2013
- 资助金额:
$ 6.53万 - 项目类别:
University Undergraduate Student Research Awards
RepServer: Antigen Receptor Repertoire Analysis Pipelines via the WWW
RepServer:通过 WWW 的抗原受体库分析管道
- 批准号:
8822801 - 财政年份:2012
- 资助金额:
$ 6.53万 - 项目类别:
RepServer: Antigen Receptor Repertoire Analysis Pipelines via the WWW
RepServer:通过 WWW 的抗原受体库分析管道
- 批准号:
8636990 - 财政年份:2012
- 资助金额:
$ 6.53万 - 项目类别: