動的に変わる集合に対する類似検索のスケッチを利用した高速化

使用动态变化集的草图加速相似性搜索

基本信息

  • 批准号:
    21K11901
  • 负责人:
  • 金额:
    $ 2.25万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
  • 财政年份:
    2021
  • 资助国家:
    日本
  • 起止时间:
    2021-04-01 至 2025-03-31
  • 项目状态:
    未结题

项目摘要

昨年度に提案した動的に変化する集合を対象とするスケッチ更新アルゴリズムの空間計算量の削減に取り組んだ。本アルゴリズムでは、Min-Hashというハッシュ関数を利用してスケッチを作成する。ハッシュ値算出には(1)ハッシュ値割り当て表と(2)集合のヒストグラムが必要になるが、前者については表サイズを小さくする既存手法を採り入れて空間計算量の大幅な削減に成功した。一方で、後者についてはヒストグラムの空間計算量を大幅に減らすと集合からどの要素がいつ離脱するかという情報を保持できないため、スケッチの精度が下がるという問題が発生した。このため、後者については空間計算量を30パーセント程度削減するに留まった。動的に変化する集合に対して、省メモリで精度の高いヒストグラムを生成する手法が必要になっており、2023年度はこの条件を満たすヒストグラム生成法についても研究を進める。一方、応用研究としては動的に変化するテキスト集合をクエリとする範囲類似検索 (Range Search)についても研究した。ここで動的に変化するテキスト集合とは、具体的には特定ユーザによるSNSへの投稿を指しており、類似検索により投稿内容が似た類似ユーザを探すことを目指している。本問題に対して転置インデクスを用いた高速解法を考案した。とくに提案手法では転置インデクスをクエリに対してのみ持たせることで、転置インデクスの管理オーバーヘッドを増やさずに高速処理を実現した。この他に、株価時系列を終値の集合と見なして類似検索ベースの株価予測にも取り組んだ。ここでは過去の類似時系列を検索して、過去の事例から株価の上昇/下落を予測する。そして、予測対象銘柄以外の他社データも過去の事例に加えた方が、予測精度が向上するという興味深い結果を得た。
The information collection of the proposed motion last year is similar to the one in which the information is updated, and the amount of space calculation is cut. In this article, you can use the number of Min-Hash information to make a decision. It is calculated that (1) when the table (2) collects the necessary information, and the former uses the existing method to import the existing data into the space calculation, the calculation of space is significantly reduced. On the one hand, there is a large amount of space calculation on the one hand and the other on the other. on the other hand, there is a significant increase in the amount of space calculation on the one hand and the other on the other. on the other hand, there is a significant increase in the amount of space calculation on the one hand and the other on the other. After that, the amount of space calculation will be reduced by 30%. In order to improve the accuracy and accuracy of the system, it is necessary to improve the performance of the system. In the year 2023, it is necessary to improve the research on the method of generating information in 2023. On the one hand, it is necessary to use the information collection of research activities. The scope of information is similar to that of Range Search. The content of the contribution is similar to that of the user, the content of the contribution is similar to that of the user, the content of the contribution is similar to that of the user, the content of the contribution is similar to that of the user, the content of the contribution is similar to that of the user, and the content of the contribution is similar to that of the user. This problem requires a high-speed solution to solve the problem. I need to know how to make a proposal. I don't know what to do. I don't know. I don't know. If you want to check the collection of other and local series of data, you can see that the data type is similar to that of the data collection. When it seems that the past type is the same, the series of requests are affected, and the upper

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
文字位置に着目した Min-Hash ベースの文字列類似検索
基于最小哈希的关注字符位置的字符串相似度搜索
  • DOI:
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    0
  • 作者:
    古賀久志,別府直輝;笠井龍一
  • 通讯作者:
    笠井龍一
画像の追加を許容するDeep Hashingに基づく類似画像検索
基于深度哈希的相似图像搜索,允许添加图像
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    友田涼太;古賀久志;Y. Maeda and N. Suzuki;Ye Chenyang,古賀久志
  • 通讯作者:
    Ye Chenyang,古賀久志
Exact Algorithm to Solve Continuous Similarity Search for Evolving Queries and Its Variant
解决演化查询的连续相似性搜索及其变体的精确算法
  • DOI:
    10.1587/transinf.2021dap0003
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0.7
  • 作者:
    古賀久志,別府直輝;笠井龍一;中尾 友紀,古賀久志;T. Yamazaki and H. Koga
  • 通讯作者:
    T. Yamazaki and H. Koga
区間Min-Hashを用いた時系列データに対する近似最近傍探索
使用区间 Min-Hash 近似最近邻搜索时间序列数据
  • DOI:
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    0
  • 作者:
    友田涼太;古賀久志
  • 通讯作者:
    古賀久志
Stock Price Prediction for Individual Brands with Indexing DTW
使用索引 DTW 预测单个品牌的股价
  • DOI:
    10.20729/00220096
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    古賀久志,別府直輝;笠井龍一;中尾 友紀,古賀久志
  • 通讯作者:
    中尾 友紀,古賀久志
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

古賀 久志其他文献

On a Two-Dimensional Antidictionary Coding
二维反字典编码
On a Universal Antidictionary Coding for Stationary Ergodic Sources with Finite Alphabet
有限字母平稳遍历源的通用反字典编码
Document Relation Analysis Based on Compressibility Vector
基于可压缩向量的文档关系分析
  • DOI:
  • 发表时间:
    2009
  • 期刊:
  • 影响因子:
    0
  • 作者:
    張 諾;松崎 大輔;渡邊 俊典;古賀 久志
  • 通讯作者:
    古賀 久志
uGridにおけるセキュリティを考慮したマルチサービス映像配信ネットワークの提案
uGrid中考虑安全性的多业务视频分发网络的提出
  • DOI:
  • 发表时间:
    2009
  • 期刊:
  • 影响因子:
    0
  • 作者:
    山崎 啓介、張諾;渡邊 俊典;古賀 久志;岡本聡
  • 通讯作者:
    岡本聡
大容量データ転送アプリケーションの実現に向けたTCP over SCTPパラレルネットワーキングおよび並列経路選択手法の検討
实现大容量数据传输应用的TCP over SCTP并行组网及并行路由选择方法研究
  • DOI:
  • 发表时间:
    2009
  • 期刊:
  • 影响因子:
    0
  • 作者:
    張 諾;松崎 大輔;渡邊 俊典;古賀 久志;岡本聡
  • 通讯作者:
    岡本聡

古賀 久志的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('古賀 久志', 18)}}的其他基金

スケジューリング理論に基くネットワーク通信品質保証技術の設計に関する研究
基于调度理论的网络通信质量保障技术设计研究
  • 批准号:
    17700054
  • 财政年份:
    2005
  • 资助金额:
    $ 2.25万
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)

相似海外基金

Continuously Similarity Search for Evolvingi Sets
Evolvingi 集的连续相似性搜索
  • 批准号:
    18K11311
  • 财政年份:
    2018
  • 资助金额:
    $ 2.25万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Development of a data stream management system using special hardware assistance
使用特殊硬件辅助开发数据流管理系统
  • 批准号:
    26330061
  • 财政年份:
    2014
  • 资助金额:
    $ 2.25万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了