笔记本

请登录登录

DarkBERT：诞生自暗网的 AI，却要为资安尽一份力

PConline 2023-05-19 00:16:05

笔记本资讯栏目

当人们提到大型语言模型（LLM）时，通常会想到像OpenAI的ChatGPT这样的产品，这类产品在各行业中广泛应用，如搜索引擎、语音助手和客户服务。然而，一个问题一直困扰着LLM的使用：它们需要进行大量的预训练和微调工作，这可能会花费大量的时间和资源。

最近，韩国研究人员通过从暗网中收集数据创造了一个新的LLM，名为“DarkBERT”。 DarkBERT基于BERT和RoBERTa，并利用Tor网络爬取了暗网数据进行训练。由于该数据包含黑客、诈骗党和罪犯的资料，因此该团队使用了预处理技术和分析权重等方法来排除受害者信息并过滤出原始资料来创建一组暗网数据库。此外，从论文中的表格可以看到，该数据库主要涉及成人图像、药物和金流等类别。

尽管DarkBERT的训练数据来源有争议，但该模型具有很多实际应用价值，例如检测勒索软件、侦测泄露机敏数据站点，或是实时监控非法信息等资案用途。虽然研究团队目前没有公布具体的计划，但可以申请使用DarkBERT以学术为目的。

点评：

即使从最不寻常的来源收集数据，也可以训练有用的人工智能模型。尽管一些人可能担心暗网数据对DarkBERT的影响，但这并没有阻止研究人员将其用于实际应用中。这表明，在AI技术迅速发展的今天，我们需要更加关注如何让这些技术在受控和透明的环境下运行，确保它们能够产生积极的社会效益。

点击展开全文

网友评论

聚超值推荐

Apple 苹果 MacBook Air 2023款 15.3英寸笔记本电脑（M2、8GB、256GB） 满3000减300 月销1000+ ￥9999 ￥10499

DELL 戴尔 XPS 13 9315 十二代酷睿版 13.4英寸轻薄本 券后省80 ￥8419 ￥8499

ASUS 华硕灵耀14 2023款十三代酷睿版 14.0英寸轻薄本 送赠品 ￥5499 ￥5799

Apple 苹果 iPad 10.2英寸平板电脑（256GB WLAN版/A13）银色 券后省740 月销1w+ ￥3049 ￥3639

Apple 苹果 MacBook Pro 14英寸笔记本电脑（M1 Pro、16GB、512GB） ￥11399 ￥14999

kindle Scribe 10.2英寸电子书阅读器 16GB 券后省50 月销2000+ ￥2709 ￥2759

Hanvon 汉王 Clear 7英寸电子书阅读器平板 每满1399减101 月销5000+ ￥1297 ￥1399

HUAWEI 华为平板 11.5英寸 2023款 120Hz护眼全面屏 WiFi 8G+256G 券后省50 月销4000+ ￥2049 ￥2099

MI 小米平板6 Pro 11英寸 送赠品 ￥2399 ￥2499

相关推荐

NVIDIA推出RTX4090D，将旗舰游戏显卡带回中国，完全符合美国要求 笔记本资讯

NVIDIA推出RTX4090D，将旗舰游戏显卡带回中国，完全符合美国要求

IDC中国智能终端市场十大洞察，场景化与专业化并进， AI与云推动变革 笔记本资讯

IDC中国智能终端市场十大洞察，场景化与专业化并进， AI与云推动变革

学生党年底换机攻略看准这几项就不会踩坑 笔记本资讯

学生党年底换机攻略看准这几项就不会踩坑

第二届全球数字贸易博览会闭幕 dynabook智能解决方案推动企业转型 笔记本资讯

第二届全球数字贸易博览会闭幕 dynabook智能解决方案推动企业转型

2023年度盘点：除了遥遥领先的NVIDIA，竟还有这么多AI芯片发布！ 笔记本资讯

2023年度盘点：除了遥遥领先的NVIDIA，竟还有这么多AI芯片发布！

体验华为擎云 G740：数字化浪潮下，商用终端如何重构企业智慧办公新体验 笔记本资讯

体验华为擎云 G740：数字化浪潮下，商用终端如何重构企业智慧办公新体验

戴尔公布2024财年Q3财报 AI驱动服务器和网络业务营收实现环比增长 笔记本资讯

戴尔公布2024财年Q3财报 AI驱动服务器和网络业务营收实现环比增长

PlayStation 6可能搭载GDDR7显存，发布时间遥遥无期 笔记本资讯

PlayStation 6可能搭载GDDR7显存，发布时间遥遥无期

花样繁多的可穿戴设备最后都变成了AI接口 笔记本资讯

花样繁多的可穿戴设备最后都变成了AI接口

迎接AI PC时代，华硕首台酷睿Ultra处理器轻薄本灵耀14 2024曝光 笔记本资讯

迎接AI PC时代，华硕首台酷睿Ultra处理器轻薄本灵耀14 2024曝光

相关产品