科技魔方

谷歌开源Magika:AI驱动文件类型识别系统,提升用户安全

更多动态

2024年02月19日

  Google最近开源了一款名为Magika的文件类型识别系统,该系统由AI驱动,能够在毫秒级内准确识别超过100种不同的文件类型,包括二进制文件和文本文件。在Google内部,Magika被广泛应用于提升用户安全,主要用于对Gmail、Drive和安全浏览中的文件进行适当的安全检查和内容策略扫描。

  Magika的主要功能特点包括:

  AI驱动的准确识别:Magika采用了自定义的、高度优化的深度学习模型,使其能够在几毫秒内准确识别出二进制和文本文件的类型,即便是在CPU上运行也能快速完成。

  支持多种文件类型:它能够识别超过100种不同的文件类型,包括常见的文档、图片、代码文件和配置文件等。

  高效性能:在包含100万文件的基准测试中,Magika的识别性能比其他现有工具高出约20%,尤其在处理文本文件时,展现出更大的性能优势。

  此外,Magika的广泛应用不仅体现在提高用户安全方面,还包括简单易用的安装和使用。用户可以通过简单的命令行指令pip install magika进行安装,而且无需GPU支持。该系统的代码和模型在GitHub上免费提供,并且采用Apache2许可证,便于其他软件改进其文件识别准确性,为研究人员提供大规模识别文件类型的可靠方法。

  Magika即将与VirusTotal集成,这将提高平台分析和检测恶意代码的效率和准确性,有助于全球网络安全生态系统的建设。总体而言,Magika的开源和易于集成特性使其成为一个备受期待的文件类型识别工具,有望为文件安全领域带来新的发展。详细介绍和演示可以在其网站和GitHub页面上找到。

+1

来源:站长之家

延展资讯