![](/rp/kFAqShRrnkQMbH6NYLBYoJ3lq9s.png)
如何评价 DeepSeek 的 DeepSeek-V3 模型(2024/12)? - 知乎
deepseek官网与api已更新V3模型官网显示模型名为deepseek-V3-600BDeepseek V3的Aider代码能力排行榜正确…
怎样看待深度求索发布的大模型DeepSeek-V3?该模型有哪些先进 …
推理速度快:Deepseek V3 每秒的吞吐量可达 60 tokens; 模型设计好:Deepseek V3 采用 MoE 结构,完整模型达到 671B 的参数量,其中单个 token 激活 37B 参数; 模型架构创新 1. 混合专 …
deepSeek,可以用来干啥,用了一下感觉和gpt差不多呀? - 知乎
2024年12月31日 · 本来deepseek与GPT都差不多啊(当然模型内部差异是很大的),都是LLM(语言类通用大模型)。不过最近deepseek刚升级v3。感觉知识库比GPT要新一些。而且相对一 …
deepseek v3模型为啥要开源? - 知乎
DeepSeek选择是非常明智的选择,主打就是一个差异化,你CloseAI搞封闭,我就搞开放,这样的差异性可以弥补其他方面的不足。 想象一下,如果DeepSeek也选择闭源,那即便使用更小成 …
国外评测 DeepSeek-V3 超越了迄今为止所有开源模型,DeepSeek …
最近deepseek风头十足,不仅便宜还好用! 本来兴致冲冲准备在Coze上开发智能体,想着用DeepSeek大显身手,结果被告知: “只有专业会员才能用” 。 顿时感觉被泼了一盆冷水,这权 …
DeepSeek V3 如此成功,其他AI大模型可以模仿吗? - 知乎
中国人工智能企业深度求索(DeepSeek)宣布全面开源其核心大模型,这一决策不仅引发技术界的震动,更蕴含着深刻的管理学智慧——当模仿与创新的边界在数字时代日益模糊,组织如何 …
DeepSeek 那么厉害为什么要开源? - 知乎
deepseek 开源是因为伟大,推动技术发展,如果是美国早就吹上天了。 说实话油管大部分美国人也认输了 基本都是反思,夸赞的. 然而德语区真是另外一副风格,大量的德国人用zz问题开 …
deepseek大模型有哪些令人眼前一亮的的用法? - 知乎
DeepSeek 的崛起,相对于对英伟达股价的影响,可能威胁更大的,是同样做大模型的同行,既包括国外的 OpenAI、Anthropic,也包括国内的豆包、Kimi(有人还记得它吗)、文心等,估值 …
deepseek v3的成本这么低的根本原因是什么? - 知乎
看技术报告啊,哪个报告写的多好啊。具体来说,MoE 架构 和 FP8 混合精度训练 是降低 DeepSeek-V3 训练成本的最大因素: MoE 架构:通过稀疏激活机制大幅减少了计算量。 FP8 …
如何评价deepseek预发布的deepseek-R1? - 知乎
2024年11月20日 · 让他数了下01序列中的1试试,这个问题不用CoT根本做不对,用了CoT大概有70%的正确率,deepseek-R1一遍就做对了,还反思了两次来确认答案,可爱捏 …