学術論文検索におけるユーザの視点に基づいたブーリアン型検索クエリ作成支援の研究
学术论文搜索中基于用户视角创建布尔搜索查询的支持研究
基本信息
- 批准号:19K20629
- 负责人:
- 金额:$ 2.25万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Early-Career Scientists
- 财政年份:2019
- 资助国家:日本
- 起止时间:2019-04-01 至 2024-03-31
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
本年度は,ユーザが考案したブーリアン型検索クエリに対して,検索条件ANDで結合する候補語を推薦するシステムを構築した.提案システムでは,検索クエリとANDで結合される語は,検索クエリと関連性が高く,さらにいずれの検索語と同義的あるいは類似的でないものが適切であるという仮定に基づき,トピックモデルおよび単語分散表現による単語分散表現を用いて推定を行った.まず,Latent Dirichlet Allocationを用いて,検索クエリと関連している可能性の高い語をランク付けする.次に,word2vecを用いて,いずれの検索語と同義的かつ類似的でない可能性の高い語をランク付けする.そして,これら2種類の結果を統合し,最もランクの高い語から順に候補語としてユーザに提示する.実験では,NTCIR-1 ,-2データセットに収録されている15種類の検索課題に対して考案した検索クエリを用いて,システムが提示した上位5件の候補語を検証した.具体的には,検索クエリを用いたクエリ尤度モデルによるランキングを行い,ランキング結果の上位100, 200, 300, 400, 500件を検索結果として獲得する場合に対する再現率により,初期の検索クエリおよびシステムが出力した候補語に対してユーザが最も再現率が向上する選択を行った場合を比較し,検索性能の変化を検証した.なお,本実験では,候補語に対するユーザの操作は,上位5件の候補語から1つの語を選択および適切な語が出力されていなかったため選択しないことを仮定している.その結果,検索結果として獲得する論文数の各条件において,平均で4.44%の向上が期待できることが確認された.
This year, the search conditions AND the candidate language are recommended. A proposal is a proposal that is based on a set of criteria, such as a set of criteria, a set of criteria, a set of criteria Latent Dirichlet Allocation is used in the middle of the search, and the probability of the search is high. In the second place, the word2vec is used in the middle, which indicates that the search term is synonymous with the similar term and that the probability of the search term is high. The results of these two categories are integrated, and the most important candidate language is the prompt language. In fact, NTCIR-1 ,-2 data sets are included in the list of 15 types of search topics, and the list of search topics is included in the list of 5 candidates. More specifically, the search results are 100, 200, 300, 400, 500 pieces in the upper range of search results. The search results are obtained in the case of reproduction rate. The initial search results are used in the case of output candidate. The performance of the search is changing. This is the first time that the candidate language has been selected. The results of the search and the number of papers obtained under each condition averaged 4.44% and the number of expected papers was confirmed.
项目成果
期刊论文数量(3)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
福田 悟志其他文献
福田 悟志的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('福田 悟志', 18)}}的其他基金
感情分析の観点から信頼性が低い情報が拡散されるメカニズムを解析するための研究
从情感分析角度分析不可靠信息传播机制的研究
- 批准号:
22K18152 - 财政年份:2022
- 资助金额:
$ 2.25万 - 项目类别:
Grant-in-Aid for Early-Career Scientists