在当今科技迅速发展的时代,AI 数字人领域不断涌现出令人瞩目的创新成果。
Diamond 模型专为模拟 CS:GO 设计,其代码和数据集开源,在 RTX 3090 上运行速度可达 10 fps,成为实时游戏生成模型的新成员。FalAI 为此搭建在线试玩网站,带来全新体验。

INTELLECT-1 作为首个去中心化 10B 大模型,训练已正式启动,可在官网查看进度,目前训练进度达 2.08%,算力贡献者众多。
OpenAI 的 SearchGPT 虽仅对部分美国用户推出 UI,但能通过 URL 直达搜索结果页面并触发搜索功能。
GAGAvatar 是首个通用化 3D 高斯头像框架,能将单张图片转为 3D 模型,支持克隆表情和头部动作,代码和数据集开源。
F5-TTS 是最新开源可商用的 TTS 模型,支持中英文语音生成和克隆,速度表现佳。
JujoHotaru LoRA 系列用于控制人物表情,包括多种表情和相关效果,提供大量演示。
阿里推出的 FLUX.1-Turbo-Alpha 支持 8 步出图,基于 FLUX.1-dev 模型训练,在速度和适配性上有优势。
在数字人开源项目方面,OpenAvatar 是知名的数字人形象框架,提供标准接口和实现,方便开发人员构建。
RAIN AI 可构建不断自主演化的虚拟人物。DigiDoug 是基于实际扫描的开源数字人。GPT-3 可用于生成虚拟人自然语言。OpenAI’s CLIP 可通过语言描述生成图像用于虚拟人物。
此外,还有一些与数字人项目相关的开源大模型。
如 AI Voice Chat,可实现语音与 chatGPT 聊天,优势是语言对语音几乎无延迟,运行在 RTX 3090 GPU 上。
Diffusion Avatars 能合成高保真 3D 头像,控制姿势和表情。
PoseGPT 采用大型语言模型理解和推理 3D 人体姿势。
Animate Anyone 实现从静止图像到人物动态视频。
DUIX 是硅基智能开发的 AI 数字人智能交互平台,支持多终端一键部署,具有数字人模板、画面流畅、真实模拟、实时渲染、网络依赖低等特点,应用场景广泛。
腾讯音乐娱乐的天琴实验室开源的 MuseV 专注于生成高质量虚拟人视频和口型同步,支持多种生成方式,兼容稳定扩散生态系统。
蚂蚁开源的 EchoMimic 结合音频和面部特征点生成人像动画,灵活且效果出色,安装和使用虽有步骤但并非难事。
EMEET 壹秘超清4K直播电脑摄像头60FPS高帧率线上视频通话会议专用摄像头内置降噪麦 C60E 4K
¥159
¥159
微星品牌游戏主机 酷睿i5 12600KF/14600KF/RTX4060/5060/5060TI海景房主机DIY台式电脑整机组装电脑 配三 14600KF+一线旗舰RTX5060Ti
嘉柏兰【国家3C认证丨20000毫安】充电宝适用小米120W超级快充大容量可上飞机自带线移动电源小巧便携 【尊享版2万毫安】自带双线+120W超级快充
秦轩万能电视机遥控器通用创维TCL海信康佳长虹小米乐视三星索尼等品牌 红外款【纯蓝牙电视不要买】
¥13.3
¥19
VSGO微高摄影包20L户外专业休闲摄影黑鹞通勤微单反相机包双肩包防水耐用大容量器材收纳包
大水牛(BUBALUS)额定850W BX850金牌全模电源(PCIe5.1/智能模组/双CPU+4显卡接口/单路12V/支持5080显卡)
恒洁(HEGII)淋浴花洒全套钢琴按键大平台双重智能除垢喷枪手持顶喷花洒套装 【升级恒温防烫-银色】938-333B
雷珞克适用华为240W超级充电头P50/p40 mate50 40pro nova7/8pro充电器适用荣耀50se/60数据线手机充电器 1米6A快充线
盈通(yeston) RTX 5060 Ti 8G GDDR7 游戏高手OC PA 电竞光追游戏AI智能学习电脑独立显卡
网友评论