笔记本

DarkBERT:诞生自暗网的 AI,却要为资安尽一份力

PConline 2023-05-19 00:16:05
笔记本资讯栏目

当人们提到大型语言模型(LLM)时,通常会想到像OpenAI的ChatGPT这样的产品,这类产品在各行业中广泛应用,如搜索引擎、语音助手和客户服务。然而,一个问题一直困扰着LLM的使用:它们需要进行大量的预训练和微调工作,这可能会花费大量的时间和资源。

最近,韩国研究人员通过从暗网中收集数据创造了一个新的LLM,名为“DarkBERT”。 DarkBERT基于BERT和RoBERTa,并利用Tor网络爬取了暗网数据进行训练。由于该数据包含黑客、诈骗党和罪犯的资料,因此该团队使用了预处理技术和分析权重等方法来排除受害者信息并过滤出原始资料来创建一组暗网数据库。此外,从论文中的表格可以看到,该数据库主要涉及成人图像、药物和金流等类别。

尽管DarkBERT的训练数据来源有争议,但该模型具有很多实际应用价值,例如检测勒索软件、侦测泄露机敏数据站点,或是实时监控非法信息等资案用途。虽然研究团队目前没有公布具体的计划,但可以申请使用DarkBERT以学术为目的。

点评:

即使从最不寻常的来源收集数据,也可以训练有用的人工智能模型。尽管一些人可能担心暗网数据对DarkBERT的影响,但这并没有阻止研究人员将其用于实际应用中。这表明,在AI技术迅速发展的今天,我们需要更加关注如何让这些技术在受控和透明的环境下运行,确保它们能够产生积极的社会效益。

点击展开全文
打开太平洋科技,阅读体验更佳

网友评论

聚超值推荐

更多优惠

相关推荐

NVIDIA推出RTX4090D,将旗舰游戏显卡带回中国,完全符合美国要求 笔记本 资讯
NVIDIA推出RTX4090D,将旗舰游戏显卡带回中国,完全符合美国要求
IDC中国智能终端市场十大洞察,场景化与专业化并进, AI与云推动变革 笔记本 资讯
IDC中国智能终端市场十大洞察,场景化与专业化并进, AI与云推动变革
学生党年底换机攻略 看准这几项就不会踩坑 笔记本 资讯
学生党年底换机攻略 看准这几项就不会踩坑
第二届全球数字贸易博览会闭幕 dynabook智能解决方案推动企业转型 笔记本 资讯
第二届全球数字贸易博览会闭幕 dynabook智能解决方案推动企业转型
2023年度盘点:除了遥遥领先的NVIDIA,竟还有这么多AI芯片发布! 笔记本 资讯
2023年度盘点:除了遥遥领先的NVIDIA,竟还有这么多AI芯片发布!
体验华为擎云 G740:数字化浪潮下,商用终端如何重构企业智慧办公新体验 笔记本 资讯
体验华为擎云 G740:数字化浪潮下,商用终端如何重构企业智慧办公新体验
戴尔公布2024财年Q3财报 AI驱动服务器和网络业务营收实现环比增长 笔记本 资讯
戴尔公布2024财年Q3财报 AI驱动服务器和网络业务营收实现环比增长
PlayStation 6可能搭载GDDR7显存,发布时间遥遥无期 笔记本 资讯
PlayStation 6可能搭载GDDR7显存,发布时间遥遥无期
花样繁多的可穿戴设备最后都变成了AI接口 笔记本 资讯
花样繁多的可穿戴设备最后都变成了AI接口
迎接AI PC时代,华硕首台酷睿Ultra处理器轻薄本灵耀14 2024曝光 笔记本 资讯
迎接AI PC时代,华硕首台酷睿Ultra处理器轻薄本灵耀14 2024曝光
相关产品
取消