半教師有りクラスタリング手法を用いた語義別用例の収集

使用半监督聚类方法按词义收集示例

基本信息

  • 批准号:
    19011001
  • 负责人:
  • 金额:
    $ 2.82万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
  • 财政年份:
    2007
  • 资助国家:
    日本
  • 起止时间:
    2007 至 2008
  • 项目状态:
    已结题

项目摘要

本研究の目的は、語義別用例を収集するシステムを作成すること、またそのシステムを利用して、本領域で作成されるコーパスを評価することである。作成するシステムでは半教師有りクラスタリング手法を用いる。昨年度は手法の提案とシステムの作成を行った。本年度はシステムの改良及び精度向上のための研究を行った。また本領域で作成されたコーパスの評価も行った。システムの改良としては検索処理の部分を文字列から単語に直すことで、動詞に対する語義別用例も収集することができるようになった。また半教師の部分でユーザからの入力が必要であるが、その部分に以前の入力を修正する機能を付加した。またシステムの精度向上のためには、用例間距離の測定手法と名詞間の距離の設定手法が鍵であると考え、それらの研究に取り組んだ。用例間距離の測定手法としては線型モデルのパラメータ学習という枠組みを提案した。また名詞間の距離については部分的にクラスタリングされた名詞を種として、全名詞の対する距離を測定する手法を試みた。コーパスの評価としては、語義別用例を収集し、語義の曖昧性解消の学習や用例の語義に基づくクラスタリングで利用できるようにした。同時にコーパスの特徴も考察した。成果としては今年度、国際会議3件、研究会5件の論文発表を行った。
Purpose this study の は don't use cases, semantic を 収 set す る シ ス テ ム を made す る こ と, ま た そ の シ ス テ ム を using し て, this field で さ れ る コ ー パ ス を review 価 す る こ と で あ る. To create a するシステムで するシステムで, a half-teacher has the techniques of ラスタリ ラスタリ グ グ を and る る. Last year, the proposal for the <s:1> technique <s:1> was completed as を and った. This year, the research on the improvement of システム システム and the improvement of び accuracy is carried out in the を line った of ため. Youdaoplaceholder0 in this field, で should be written as されたコ パス パス <s:1> evaluation 価 また profession った. Modified と シ ス テ ム の し て は 検 cable 処 principle part の を text columns か ら 単 language に straight す こ と で, verb に す seaborne る semantic don't use case も 収 set す る こ と が で き る よ う に な っ た. ま た half part teacher の で ユ ー ザ か ら の が into force necessary で あ る が, そ の part に の を into force before correction す る function を plus し た. ま た シ ス テ ム の precision upward の た め に は, use case, the distance between the の determination technique と の distance between nouns の setting technique が key で あ る と え test, そ れ ら に の research group take り ん だ. Technique is measured by the distance between the case の と し て は linear モ デ ル の パ ラ メ ー タ learning と い う 枠 group み を proposal し た. ま た の distance between nouns に つ い て は part of に ク ラ ス タ リ ン グ さ れ た を kind of noun と し て, all nouns の す seaborne を る distance measurement す る gimmick を try み た. コ ー パ ス の review 価 と し て は don't use cases, semantic を 収 し, semantic ambiguity の null の learning や cases の semantic に base づ く ク ラ ス タ リ ン グ で using で き る よ う に し た. At the same time, にコ にコ パス パス パス <s:1> feature にコ examine た. This year, 3 international conferences and 5 research conferences were held. The publication list of papers is を lines った.

项目成果

期刊论文数量(18)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Rで学ぶクラスタ解析
使用 R 学习聚类分析
  • DOI:
  • 发表时间:
    2007
  • 期刊:
  • 影响因子:
    0
  • 作者:
    中井克典;加藤毅;河野裕彦;山内薫;今尾浩土;新納浩幸
  • 通讯作者:
    新納浩幸
茨城大学研究者情報総覧
茨城大学研究员信息一览
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
Ping-pong Document Clustering using NMF and Linkage-Based Refinement
  • DOI:
  • 发表时间:
    2008-05
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Hiroyuki Shinnou;Minoru Sasaki
  • 通讯作者:
    Hiroyuki Shinnou;Minoru Sasaki
文書関連性を素性として追加した文書クラスタリング
添加文档相关性作为特征的文档聚类
  • DOI:
  • 发表时间:
    2008
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Suzumi Tokuoka; Yoshihiro Kita; Hideo Shindou;Masaki Yamada;Takao Shimizu;佐々木稔・新納浩幸
  • 通讯作者:
    佐々木稔・新納浩幸
Ensemble document clustering using weighted hypergraph generated by NMF
  • DOI:
    10.3115/1557769.1557793
  • 发表时间:
    2007-06
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Hiroyuki Shinnou;Minoru Sasaki
  • 通讯作者:
    Hiroyuki Shinnou;Minoru Sasaki
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

新納 浩幸其他文献

固有表現抽出におけるタグセットの相互適応
命名实体提取中标签集的相互适应
  • DOI:
  • 发表时间:
    2017
  • 期刊:
  • 影响因子:
    0
  • 作者:
    鈴木雅也;古宮 嘉那子;佐々木 稔;新納 浩幸
  • 通讯作者:
    新納 浩幸
順方向多層 LSTM と分散表現を用いた教師あり学習による語義曖昧性解消
使用前向多层 LSTM 和分布式表示通过监督学习进行词义消歧
  • DOI:
  • 发表时间:
    2017
  • 期刊:
  • 影响因子:
    0
  • 作者:
    新納 浩幸;古宮 嘉那子;佐々木 稔
  • 通讯作者:
    佐々木 稔
All-words WSDとfine-tuningを利用した分類語彙表の語義の分散表現の構築
使用 All-words WSD 和微调构建分类词典中单词含义的分布式表示
  • DOI:
  • 发表时间:
    2019
  • 期刊:
  • 影响因子:
    0
  • 作者:
    柳沼 大輝;古宮 嘉那子;新納 浩幸
  • 通讯作者:
    新納 浩幸
PyTorchによる物体検出
使用 PyTorch 进行物体检测
  • DOI:
  • 发表时间:
    2020
  • 期刊:
  • 影响因子:
    0
  • 作者:
    田中裕隆;曹鋭;白静;馬ブン;新納浩幸;新納 浩幸;新納浩幸
  • 通讯作者:
    新納浩幸
画像キャプション生成における複数形表現の統一
图像标题生成中复数表示的统一
  • DOI:
  • 发表时间:
    2017
  • 期刊:
  • 影响因子:
    0
  • 作者:
    鈴木類;古宮 嘉那子;浅原 正幸;佐々木 稔;新納 浩幸;西友佑 新納 浩幸 古宮 嘉那子 佐々木 稔,
  • 通讯作者:
    西友佑 新納 浩幸 古宮 嘉那子 佐々木 稔,

新納 浩幸的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('新納 浩幸', 18)}}的其他基金

常識推論タスク CommonGen のための文の非常識度合いの推定と常識的文への再生成
估计句子的荒谬程度并将其重新生成常识句子,用于常识推理任务 CommonGen
  • 批准号:
    23K11212
  • 财政年份:
    2023
  • 资助金额:
    $ 2.82万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
情報抽出を目的とした定型パターンの自動構築に関する研究
信息抽取固定模式自动构建研究
  • 批准号:
    11780247
  • 财政年份:
    1999
  • 资助金额:
    $ 2.82万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
既存知能を利用した小規模コーパスからの知識獲得
使用现有智能从小型语料库中获取知识
  • 批准号:
    09780308
  • 财政年份:
    1997
  • 资助金额:
    $ 2.82万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
多義語を考慮した単語間の共起性の測定
考虑多义词测量单词之间的共现
  • 批准号:
    08780327
  • 财政年份:
    1996
  • 资助金额:
    $ 2.82万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
コーパスからの動詞句型慣用表現の自動抽出
从语料库中自动提取动词短语惯用表达
  • 批准号:
    07780302
  • 财政年份:
    1995
  • 资助金额:
    $ 2.82万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)

相似海外基金

情報源符号の平均符号長と復号遅延に関する階層的クラスタリングの解明
关于信息源代码的平均代码长度和解码延迟的层次聚类的阐明
  • 批准号:
    24K14818
  • 财政年份:
    2024
  • 资助金额:
    $ 2.82万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
高次元小標本におけるクラスタリング手法とカーネル法の有効性に関する理論と応用
高维小样本中聚类方法和核方法有效性的理论与应用
  • 批准号:
    24K20748
  • 财政年份:
    2024
  • 资助金额:
    $ 2.82万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
銀河クラスタリングと重力レンズ効果を用いた標準宇宙論モデルの検証
使用星系团聚和引力透镜验证标准宇宙学模型
  • 批准号:
    24KJ0211
  • 财政年份:
    2024
  • 资助金额:
    $ 2.82万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
尺度混在・次元縮約クラスタリングによる主要情報の抽出と効率的計算環境の開発
使用混合尺度/降维聚类提取关键信息并开发高效计算环境
  • 批准号:
    24K14869
  • 财政年份:
    2024
  • 资助金额:
    $ 2.82万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
自然炎症マーカーを用いたHFpEF患者の病態クラスタリングと薬物治療選択への応用
使用天然炎症标志物对 HFpEF 患者进行病理聚类及其在药物治疗选择中的应用
  • 批准号:
    24K18329
  • 财政年份:
    2024
  • 资助金额:
    $ 2.82万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
有害事象分散表現のクラスタリングによる医薬品安全シグナル検出手法の開発
利用不良事件分布式表示聚类开发药物安全信号检测方法
  • 批准号:
    24K15817
  • 财政年份:
    2024
  • 资助金额:
    $ 2.82万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
不確実性を考慮したクラスタリングに基づく柔軟な推薦システムに関する発展的研究
考虑不确定性的基于聚类的柔性推荐系统发展研究
  • 批准号:
    24K15110
  • 财政年份:
    2024
  • 资助金额:
    $ 2.82万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Hierarchical structure of knowledge networks and hierarchical analogical reasoning
知识网络的层次结构与层次类比推理
  • 批准号:
    23K18497
  • 财政年份:
    2023
  • 资助金额:
    $ 2.82万
  • 项目类别:
    Grant-in-Aid for Challenging Research (Exploratory)
MS/MSスペクトルの階層的クラスタリングによる農薬代謝物の網羅的探索
通过 MS/MS 谱图的层次聚类全面搜索农药代谢物
  • 批准号:
    23K05086
  • 财政年份:
    2023
  • 资助金额:
    $ 2.82万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Study on liquid water content fluctuation in high Reynolds number turbulence with large-scale mixing in convective clouds
对流云大尺度混合高雷诺数湍流中液态水含量波动研究
  • 批准号:
    23K03686
  • 财政年份:
    2023
  • 资助金额:
    $ 2.82万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了