SaTC: CORE: Small: SOFIA: Finding and profiling malware source-code in public archives at scale
SaTC:核心:小型:SOFIA:大规模在公共档案中查找和分析恶意软件源代码
基本信息
- 批准号:2132642
- 负责人:
- 金额:$ 50万
- 依托单位:
- 依托单位国家:美国
- 项目类别:Standard Grant
- 财政年份:2021
- 资助国家:美国
- 起止时间:2021-10-01 至 2024-09-30
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
This project develops methods and tools for identifying and profiling malware source code from public software archives. The project is motivated by the following insight: software archives, like GitHub, host a surprisingly large number of publicly-accessible malware repositories, where a "malware repository" refers to repositories that provide the source-code for compiling a working malware binary (effectively the malware author's software project). This constitutes a huge missed opportunity: GitHub alone has more than 32 million public repositories and there are many similar software platforms. The project’s novelties are: (a) novel methods to extract and profile malware source code effectively and at scale, and (b) the largest annotated malware source code database. Ultimately, the project provides a key building block for fighting malware: security research could greatly benefit from an extensive database of malware source code, which is currently unavailable. The project's broader significance and importance are it can help build a preventive system against malware. This capability enables an early detector of malware and its creation within the hacker ecosystem, which can provide critical insights into the activities of the hackers in advance, and possibly before an infection or an attack takes place.From a technical point of view, the project develops methods to: (a) systematically mine these repositories, and (b) study and profile the malware and the related hacking ecosystem. Preliminary research has identified more than 7000 GitHub malware source code repositories and many highly-collaborative communities with hundreds of malware authors. A key novelty is that repositories are described with a comprehensive set of features along three dimensions: (a) metadata, such as title and description, (b) the source code and its structure, and (c) the social context, which captures the interactions among authors and repositories. The second key novelty is algorithmic, as the project develops new approaches and also evaluates and adapts: (a) state of the art data-mining techniques, such as word embedding, (b) code-specific profiling techniques, and (c) techniques for the describing the interactions of authors, such as a novel recursive tensor decomposition.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
该项目开发用于从公共软件档案中识别和分析恶意软件源代码的方法和工具。该项目的动机是:软件档案,如GitHub,托管着数量惊人的大量可公开访问的恶意软件存储库,其中的“恶意软件存储库”是指提供用于编译有效的恶意软件二进制代码的存储库(实际上是恶意软件作者的软件项目)。这构成了一个巨大的错失机会:仅GitHub一家就拥有超过3200万个公共存储库,还有许多类似的软件平台。该项目的新颖性是:(A)有效和大规模地提取和分析恶意软件源代码的新方法,以及(B)最大的带注释的恶意软件源代码数据库。最终,该项目为打击恶意软件提供了一个关键的构建块:安全研究可以极大地受益于一个广泛的恶意软件源代码数据库,而这个数据库目前还无法获得。该项目的更广泛的意义和重要性是,它可以帮助建立一个防范恶意软件的系统。这一能力使恶意软件及其在黑客生态系统中的创建能够及早检测,这可以提前提供对黑客活动的关键洞察,并可能在感染或攻击发生之前提供。从技术角度来看,该项目开发方法来:(A)系统地挖掘这些存储库,以及(B)研究和描述恶意软件和相关的黑客生态系统。初步研究已经确定了超过7000个GitHub恶意软件源代码存储库和许多与数百名恶意软件作者高度协作的社区。一个重要的新奇之处是,存储库是通过三个维度的一组全面的特征来描述的:(A)元数据,如标题和描述,(B)源代码及其结构,以及(C)社会上下文,它捕获了作者和存储库之间的交互。第二个关键的新颖性是算法,因为该项目开发了新的方法,也评估和适应:(A)最先进的数据挖掘技术,如单词嵌入,(B)代码特定的剖析技术,以及(C)描述作者交互的技术,如新的递归张量分解。该奖项反映了NSF的法定使命,并通过使用基金会的智力优势和更广泛的影响审查标准进行评估,被认为值得支持。
项目成果
期刊论文数量(5)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Unveiling A Hidden Risk: Exposing Educational but Malicious Repositories in GitHub
揭露隐藏风险:在 GitHub 中暴露教育性但恶意的存储库
- DOI:
- 发表时间:2023
- 期刊:
- 影响因子:0
- 作者:Masud, Md Rayhanul;Faloutsos, Michalis
- 通讯作者:Faloutsos, Michalis
PIMan: A Comprehensive Approach for Establishing Plausible Influence among Software Repositories
- DOI:10.1109/asonam55673.2022.10068629
- 发表时间:2022-11
- 期刊:
- 影响因子:0
- 作者:Md Omar Faruk Rokon;Risul Islam;Md Rayhanul Masud;M. Faloutsos
- 通讯作者:Md Omar Faruk Rokon;Risul Islam;Md Rayhanul Masud;M. Faloutsos
URLytics: Profiling Forum Users from their Posted URLs
URLytics:通过发布的 URL 分析论坛用户
- DOI:10.1109/asonam55673.2022.10068682
- 发表时间:2022
- 期刊:
- 影响因子:0
- 作者:Treves, Ben;Masud, Md Rayhanul;Faloutsos, Michalis
- 通讯作者:Faloutsos, Michalis
Repo2Vec: A Comprehensive Embedding Approach for Determining Repository Similarity
Repo2Vec:确定存储库相似性的综合嵌入方法
- DOI:10.1109/icsme52107.2021.00038
- 发表时间:2021
- 期刊:
- 影响因子:0
- 作者:Rokon, Md Omar;Yan, Pei;Islam, Risul;Faloutsos, Michalis
- 通讯作者:Faloutsos, Michalis
HyperMan: detecting misbehavior in online forums based on hyperlink posting behavior
- DOI:10.1007/s13278-022-00943-3
- 发表时间:2022-08
- 期刊:
- 影响因子:2.8
- 作者:Risul Islam;Ben Treves;Md Omar Faruk Rokon;M. Faloutsos
- 通讯作者:Risul Islam;Ben Treves;Md Omar Faruk Rokon;M. Faloutsos
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Michalis Faloutsos其他文献
iDispatcher: A unified platform for secure planet-scale information dissemination
- DOI:
10.1007/s12083-012-0128-8 - 发表时间:
2012-04-19 - 期刊:
- 影响因子:2.600
- 作者:
Md Sazzadur Rahman;Guanhua Yan;Harsha V. Madhyastha;Michalis Faloutsos;Stephan Eidenbenz;Mike Fisk - 通讯作者:
Mike Fisk
Performance Evaluation of a New MAC Protocol for the CDMA Interconnection Network
- DOI:
10.1007/s11235-005-6628-6 - 发表时间:
2005-05-01 - 期刊:
- 影响因子:2.300
- 作者:
Jang Hyun Baek;Michalis Faloutsos;Ho Yeon Chung - 通讯作者:
Ho Yeon Chung
Analyzing Communication Interaction Networks (CINs) in enterprises and inferring hierarchies
分析企业中的通信交互网络 (CIN) 并推断层次结构
- DOI:
10.1016/j.comnet.2012.11.028 - 发表时间:
2013-07 - 期刊:
- 影响因子:5.6
- 作者:
Yi Wang;Marios Iliofotou;Michalis Faloutsos;Bin Wu - 通讯作者:
Bin Wu
A linear-time optimal-message distributed algorithm for minimum spanning trees
- DOI:
10.1007/s00446-004-0107-2 - 发表时间:
2004-08-01 - 期刊:
- 影响因子:2.100
- 作者:
Michalis Faloutsos;Mart Molle - 通讯作者:
Mart Molle
Michalis Faloutsos的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Michalis Faloutsos', 18)}}的其他基金
TWC: Medium: Collaborative: Know Thy Enemy: Data Mining Meets Networks for Understanding Web-Based Malware Dissemination
TWC:媒介:协作:了解你的敌人:数据挖掘与网络结合以了解基于 Web 的恶意软件传播
- 批准号:
1638219 - 财政年份:2016
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
TWC: Medium: Collaborative: Know Thy Enemy: Data Mining Meets Networks for Understanding Web-Based Malware Dissemination
TWC:媒介:协作:了解你的敌人:数据挖掘与网络结合以了解基于 Web 的恶意软件传播
- 批准号:
1314935 - 财政年份:2013
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
NECO: A Graph-Based Approach to Traffic Monitoring and Application Classification
NECO:基于图的流量监控和应用分类方法
- 批准号:
1316446 - 财政年份:2012
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
NECO: A Graph-Based Approach to Traffic Monitoring and Application Classification
NECO:基于图的流量监控和应用分类方法
- 批准号:
0832069 - 财政年份:2008
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
Collaborative Research: NETS-NBD: RIDR: Towards Robust Inter-Domain Routing: Measurements, Models, and Deployable Tools
协作研究:NETS-NBD:RIDR:迈向稳健的域间路由:测量、模型和可部署工具
- 批准号:
0721889 - 财政年份:2007
- 资助金额:
$ 50万 - 项目类别:
Continuing Grant
Collaborative Research: NetMine: Finding Patterns in Network Data
合作研究:NetMine:寻找网络数据中的模式
- 批准号:
0208950 - 财政年份:2002
- 资助金额:
$ 50万 - 项目类别:
Continuing Grant
CAREER: Multicast Protocols and Topology Models for the Internet
职业:互联网的组播协议和拓扑模型
- 批准号:
9985195 - 财政年份:2000
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
相似国自然基金
胆固醇羟化酶CH25H非酶活依赖性促进乙型肝炎病毒蛋白Core及Pre-core降解的分子机制研究
- 批准号:82371765
- 批准年份:2023
- 资助金额:50 万元
- 项目类别:面上项目
锕系元素5f-in-core的GTH赝势和基组的开发
- 批准号:22303037
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
基于合成致死策略搭建Core-matched前药共组装体克服肿瘤耐药的机制研究
- 批准号:
- 批准年份:2022
- 资助金额:52 万元
- 项目类别:
鼠伤寒沙门氏菌LPS core经由CD209/SphK1促进树突状细胞迁移加重炎症性肠病的机制研究
- 批准号:
- 批准年份:2022
- 资助金额:30 万元
- 项目类别:青年科学基金项目
基于外泌体精准调控的“核-壳”(core-shell)同步血管化骨组织工程策略的应用与机制探讨
- 批准号:
- 批准年份:2020
- 资助金额:55 万元
- 项目类别:
肌营养不良蛋白聚糖Core M3型甘露糖肽的精确制备及功能探索
- 批准号:92053110
- 批准年份:2020
- 资助金额:70.0 万元
- 项目类别:重大研究计划
Core-1-O型聚糖黏蛋白缺陷诱导胃炎发生并介导慢性胃炎向胃癌转化的分子机制研究
- 批准号:81902805
- 批准年份:2019
- 资助金额:20.5 万元
- 项目类别:青年科学基金项目
原始地球增生晚期的Core-merging大碰撞事件:地核增生、核幔平衡与核幔边界结构的新认识
- 批准号:41973063
- 批准年份:2019
- 资助金额:65.0 万元
- 项目类别:面上项目
RBM38通过协助Pol-ε结合、招募core调控HBV复制
- 批准号:31900138
- 批准年份:2019
- 资助金额:24.0 万元
- 项目类别:青年科学基金项目
CORDEX-CORE区域气候模拟与预估研讨会
- 批准号:41981240365
- 批准年份:2019
- 资助金额:1.5 万元
- 项目类别:国际(地区)合作与交流项目
相似海外基金
SaTC: CORE: Small: An evaluation framework and methodology to streamline Hardware Performance Counters as the next-generation malware detection system
SaTC:核心:小型:简化硬件性能计数器作为下一代恶意软件检测系统的评估框架和方法
- 批准号:
2327427 - 财政年份:2024
- 资助金额:
$ 50万 - 项目类别:
Continuing Grant
Collaborative Research: NSF-BSF: SaTC: CORE: Small: Detecting malware with machine learning models efficiently and reliably
协作研究:NSF-BSF:SaTC:核心:小型:利用机器学习模型高效可靠地检测恶意软件
- 批准号:
2338301 - 财政年份:2024
- 资助金额:
$ 50万 - 项目类别:
Continuing Grant
Collaborative Research: NSF-BSF: SaTC: CORE: Small: Detecting malware with machine learning models efficiently and reliably
协作研究:NSF-BSF:SaTC:核心:小型:利用机器学习模型高效可靠地检测恶意软件
- 批准号:
2338302 - 财政年份:2024
- 资助金额:
$ 50万 - 项目类别:
Continuing Grant
SaTC: CORE: Small: NSF-DST: Understanding Network Structure and Communication for Supporting Information Authenticity
SaTC:核心:小型:NSF-DST:了解支持信息真实性的网络结构和通信
- 批准号:
2343387 - 财政年份:2024
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
NSF-NSERC: SaTC: CORE: Small: Managing Risks of AI-generated Code in the Software Supply Chain
NSF-NSERC:SaTC:核心:小型:管理软件供应链中人工智能生成代码的风险
- 批准号:
2341206 - 财政年份:2024
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
Collaborative Research: SaTC: CORE: Small: Towards Secure and Trustworthy Tree Models
协作研究:SaTC:核心:小型:迈向安全可信的树模型
- 批准号:
2413046 - 财政年份:2024
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
SaTC: CORE: Small: Socio-Technical Approaches for Securing Cyber-Physical Systems from False Claim Attacks
SaTC:核心:小型:保护网络物理系统免受虚假声明攻击的社会技术方法
- 批准号:
2310470 - 财政年份:2023
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
SaTC: CORE: Small: Study, Detection and Containment of Influence Campaigns
SaTC:核心:小型:影响力活动的研究、检测和遏制
- 批准号:
2321649 - 财政年份:2023
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
Collaborative Research: SaTC: CORE: Small: Investigation of Naming Space Hijacking Threat and Its Defense
协作研究:SaTC:核心:小型:命名空间劫持威胁及其防御的调查
- 批准号:
2317830 - 财政年份:2023
- 资助金额:
$ 50万 - 项目类别:
Continuing Grant
Collaborative Research: SaTC: CORE: Small: Towards a Privacy-Preserving Framework for Research on Private, Encrypted Social Networks
协作研究:SaTC:核心:小型:针对私有加密社交网络研究的隐私保护框架
- 批准号:
2318843 - 财政年份:2023
- 资助金额:
$ 50万 - 项目类别:
Continuing Grant