基于Context建模的基因组数据压缩研究

批准号:
61861045
项目类别:
地区科学基金项目
资助金额:
35.0 万元
负责人:
陈建华
依托单位:
学科分类:
F0101.信息论
结题年份:
2022
批准年份:
2018
项目状态:
已结题
项目参与者:
唐猛、易虎、李京建、王健明、史伟、王炯、和志圆、罗茂
国基评审专家1V1指导 中标率高出同行96.8%
结合最新热点,提供专业选题建议
深度指导申报书撰写,确保创新可行
指导项目中标800+,快速提高中标率
微信扫码咨询
中文摘要
基于 Context 建模的熵编码已经获得广泛应用。实际应用中的主要问题是如何建立有效的 Context 模型,既提高熵编码效率又降低模型代价。基于Context树模型的优化与context加权是解决这个问题的有效手段。但目前这两种技术都还有改进的空间。本项目基于最小描述长度理论,研究context树模型的更细粒度优化问题;探索context加权代价和可选择加权。同时,针对基于参考的基因组压缩问题,研究序列片段的相似测度和最佳匹配策略,探索基于后缀数组的匹配序列查找算法,研究压缩数据的随机访问以及适合随机访问分组压缩的context建模问题。研究成果将以论文形式在国内外重要期刊上发表论文 10 篇以上(SCI,EI收录6-8篇)
英文摘要
Context modeling-based entropy coding has been applied in many applications. The major obstacle in practice is how to construct an effective context model which can improve the entropy coding efficiency as well as reduce the model cost. The optimization of the context tree model and context weighting are two effective methods to tackle the above problem. However, both of them can still be improved. In this project, the tuning of the context tree model will be performed on a more fine-grained basis. The context weighting cost and optional context weighting will be explored. Meanwhile, for the referential-based genome sequence compression, the similarity measure between the reference and target subsequences as well as the suffix array-based optimal matching strategy will be studied. The random access of the compressed sequence along with the corresponding context modeling strategy will also be studied in this project.
本项目首先对利用context模型实现高阶条件熵编码时面临的模型稀释问题进行研究。以context树模型作为优化对象,采用描述长度增量作为树节点的合并依据,获得了更有利于改进编码性能的条件概率分布。在基于参考序列的基因组数据压缩研究中,我们根据目标与参考序列的相似程度,合理利用局部与全局匹配,实现了FASTA格式数据的高效压缩。在对FASTQ文件中质量分数压缩研究中,通过设计合理的映射规则和轻量级索引,在保证压缩效率的同时,实现了对压缩数据中指定分段的快速随机访问。.本项目对分布式信源编码问题也展开了研究。针对目前基于信道码的方案不能利用信源内部相关性,我们通过传送一部分信源数据,以改进边信息或改进迭代译码概率分布的方式,使基于信道码的分布式信源编码方案能通过利用信源内部相关性来提高压缩效率。针对基于信源码的分布式信源编码方案在特定的信源概率分布下,不能有效利用信源间相关性的问题,我们以间隔编码来代替扩展概率区间方案,使分布式算术码对信源间相关性的利用不再依赖信源概率分布。.在分布式视频编码的边信息生成与改善研究中,针对如何更有效实现解码方运动估计的问题,我们尝试了将光流法与块匹配法有机结合来降低运动估计的计算复杂度,也研究了通过传送一部分WZ帧信息来弥补解码方运动估计不理想的问题,还探索了基于相位插值的运动估计思路,以便在光照有变化的情况下,弥补光流法的不足。.采样速率很大程度上决定了信号压缩感知的重建质量,因此本项目对速率自适应的压缩感知展开了多项研究。包括通过对稀疏信号的概率分布建模,用采样值的能量对信号稀疏度进行估计,并通过速率自适应调整,实现了监控视频压缩感知重建质量的重大改进;将采样端和重建端提供的信息进行融合来对当前帧的稀疏度进行估计的方案,提高了普通视频的压缩感知重建精度等研究。.综上所述,本项目在上述研究方向都取得了良好的成果,顺利完成了项目研究任务。
期刊论文列表
专著列表
科研奖励列表
会议论文列表
专利列表
DOI:10.1093/bioinformatics/bty934
发表时间:2019-06-15
期刊:BIOINFORMATICS
影响因子:5.8
作者:Shi, Wei;Chen, Jianhua;Chen, Min
通讯作者:Chen, Min
Side information hybrid generation based on improved motion vector field
基于改进运动矢量场的辅助信息混合生成
DOI:10.1007/s11042-021-10870-8
发表时间:2021-05-08
期刊:MULTIMEDIA TOOLS AND APPLICATIONS
影响因子:3.6
作者:Wang, Wei;Li, Jingjian;Chen, Jianhua
通讯作者:Chen, Jianhua
DOI:10.11999/jeit190750
发表时间:2020
期刊:电子与信息学报
影响因子:--
作者:王健明;陈建华
通讯作者:陈建华
DOI:https://doi.org/10.1016/j.image.2022.116698
发表时间:2022
期刊:Signal Processing: Image Communication
影响因子:--
作者:莫鸿;陈建华;郎恂;李京建
通讯作者:李京建
Adaptive Block-Based Compressed Video Sensing Based on Saliency Detection and Side Information.
基于显着性检测和辅助信息的自适应块压缩视频感知
DOI:10.3390/e23091184
发表时间:2021-09-08
期刊:Entropy (Basel, Switzerland)
影响因子:--
作者:Wang W;Wang J;Chen J
通讯作者:Chen J
基于蜂窝状结构的可拉伸稳定输出电化学晶体管的制备及应用
- 批准号:52263019
- 项目类别:地区科学基金项目
- 资助金额:33万元
- 批准年份:2022
- 负责人:陈建华
- 依托单位:
基于Context建模的熵编码及其应用研究
- 批准号:61062005
- 项目类别:地区科学基金项目
- 资助金额:22.0万元
- 批准年份:2010
- 负责人:陈建华
- 依托单位:
国内基金
海外基金
