西甲

微软发布史无前例的恶意软件数据集设17万纪录

2020-09-16 03:52:13来源:励志吧0次阅读

微软发布“史无前例”的歹意软件数据集,设17万奖金征集预测算法

夏乙 发自 凹非寺

一个“史无前例”的歹意软件感染数据集亮相了。

这个数据集来自微软,毕竟,他们的重要产品Windows,大概是全球遭受病虫害最频繁的软件了。

同时推出的,还有一场Kaggle比赛:让你训练机器学习算法,来预测1台电脑是否是是感染了歹意软件,俗称“中毒了没”

我们先来看看这份数据集究竟有多“史无前例”

它包括的信息相当全面,共有60多项。

每一行数据都对应着一个MachineIdentifier,相当于设备ID,也都包含一个代表着真实值的HasDetections,显示这台设备有没有感染恶意软件。

同时,还包括大量可能能用来判断中没中毒的信息,比如设备的运行状况指标,和本身软硬件环境,比如:防火墙版本、装了几个杀毒软件、默许浏览器是哪一款、是个电脑还是个手机、显示器分辨率多少、处理器几核什么架构、内存多大、用的是不是是固态硬盘…

乃至还包含这台机器是不是是用来打游戏的、是否是是触摸屏、带不带手写笔,和代表国家和城市的数字代码等等。

这样的数据1共有多少条呢?答案是,在训练集里有近900万条,集里近800万条。也就是说,微软了来自1600万台设备的信息,给你训练算法。

如果102你对这么大的数字不敏感…我们换个衡量大小的方式。这个数据集以csv形态存储,一共8.47GB。

这些数据,都来自Windows用户,由Windows本身记录和默许防火墙Windows Defender搜集而来。固然,数据经过清洗,其实不包括隐私信息。

庞大的数据集准备就绪,办比赛也顺理成章。因此,也就有了Kaggle上的微软歹意软件预测竞赛。

这个比赛,由微软、美国东北大学、佐治亚理工大合主办。

参赛者需要做的,就是训练一个算法,为集里的每台电脑,预测一个感染歹意软件的几率,范围在【0, 1】区间。

比赛设置了2.5万美元(大约17万元)的奖金池。其中,第一名奖金1.2万美元,第二名7000美元,第三四五名分别是3000、2000、1000美元。

这个奖金设置,对安全界人士来讲可能太低了点。英特尔安全研究员Marco Figueroa就在Twitter上说:

微软你是认真的吗?一个歹意软件预测比赛才给2.5万美元奖金?应当最少30万美元起!

不过,参赛者们仍然很热情。

从上周启动到量子位发稿时,已有551支队伍参加了。

现在距离比赛结束,还有两个多月,新队伍还在源源不断地涌进来。昨天才杀入战局的南京大学小(队名叫“杀”的那位)一次提交就排到了榜首。

自己治疗灰指甲
入局第三批集采!先声药业「托法替布」获批上市
先声药业又一新药获批,艾得辛?临床试验申请获批!
灰指甲是不是治不好
分享到:
  • 友情链接
  • 合作伙伴