DeepSeek更新网页与App端版本并灰度测试,将上下文长度提升至1M Token,是此前近8倍。但大量用户反馈,不要为追求超长文本或理工科能力牺牲文本表达与共情理解等软实力。
这背后,春节推出的可能是V3系列小幅更新,下一代万亿参数级旗舰模型因规模跃升训练放缓,发布进程延后。
近日,DeepSeek更新网页与App端版本并灰度测试,将上下文长度提升至1M Token,约为此前的8倍。然而大量用户反馈,其不应为超长文本和理工科能力牺牲软实力。据悉,春节可能仅推出V3系列小幅更新,下一代万亿参数级旗舰模型因训练放缓,发布延后。
DeepSeek更新网页与App端版本并灰度测试,将上下文长度提升至1M Token,是此前近8倍。但大量用户反馈,不要为追求超长文本或理工科能力牺牲文本表达与共情理解等软实力。
这背后,春节推出的可能是V3系列小幅更新,下一代万亿参数级旗舰模型因规模跃升训练放缓,发布进程延后。
网友评论