deepseek - 搜索

约 423,000 个结果

在新选项卡中打开链接

时间不限

zhihu.com
https://www.zhihu.com › question
如何评价 DeepSeek 的 DeepSeek-V3 模型（2024/12）？ - 知乎
deepseek官网与api已更新V3模型官网显示模型名为deepseek-V3-600BDeepseek V3的Aider代码能力排行榜正确…
zhihu.com
https://www.zhihu.com › question
怎样看待深度求索发布的大模型DeepSeek-V3？该模型有哪些先进 …
推理速度快：Deepseek V3 每秒的吞吐量可达 60 tokens; 模型设计好：Deepseek V3 采用 MoE 结构，完整模型达到 671B 的参数量，其中单个 token 激活 37B 参数; 模型架构创新 1. 混合专 …
zhihu.com
https://www.zhihu.com › question
deepSeek，可以用来干啥，用了一下感觉和gpt差不多呀？ - 知乎
2024年12月31日 · 本来deepseek与GPT都差不多啊（当然模型内部差异是很大的)，都是LLM（语言类通用大模型）。不过最近deepseek刚升级v3。感觉知识库比GPT要新一些。而且相对一 …
zhihu.com
https://www.zhihu.com › question
deepseek v3模型为啥要开源？ - 知乎
DeepSeek选择是非常明智的选择，主打就是一个差异化，你CloseAI搞封闭，我就搞开放，这样的差异性可以弥补其他方面的不足。想象一下，如果DeepSeek也选择闭源，那即便使用更小成 …
zhihu.com
https://www.zhihu.com › question
国外评测 DeepSeek-V3 超越了迄今为止所有开源模型，DeepSeek …
最近deepseek风头十足，不仅便宜还好用！本来兴致冲冲准备在Coze上开发智能体，想着用DeepSeek大显身手，结果被告知： “只有专业会员才能用” 。顿时感觉被泼了一盆冷水，这权 …
zhihu.com
https://www.zhihu.com › question
DeepSeek V3 如此成功，其他AI大模型可以模仿吗？ - 知乎
中国人工智能企业深度求索（DeepSeek）宣布全面开源其核心大模型，这一决策不仅引发技术界的震动，更蕴含着深刻的管理学智慧——当模仿与创新的边界在数字时代日益模糊，组织如何 …
zhihu.com
https://www.zhihu.com › question
DeepSeek 那么厉害为什么要开源？ - 知乎
deepseek 开源是因为伟大，推动技术发展，如果是美国早就吹上天了。说实话油管大部分美国人也认输了基本都是反思，夸赞的. 然而德语区真是另外一副风格，大量的德国人用zz问题开 …
zhihu.com
https://www.zhihu.com › question
deepseek大模型有哪些令人眼前一亮的的用法? - 知乎
DeepSeek 的崛起，相对于对英伟达股价的影响，可能威胁更大的，是同样做大模型的同行，既包括国外的 OpenAI、Anthropic，也包括国内的豆包、Kimi（有人还记得它吗）、文心等，估值 …
zhihu.com
https://www.zhihu.com › question
deepseek v3的成本这么低的根本原因是什么？ - 知乎
看技术报告啊，哪个报告写的多好啊。具体来说，MoE 架构和 FP8 混合精度训练是降低 DeepSeek-V3 训练成本的最大因素： MoE 架构：通过稀疏激活机制大幅减少了计算量。 FP8 …
zhihu.com
https://www.zhihu.com › question
如何评价deepseek预发布的deepseek-R1？ - 知乎
2024年11月20日 · 让他数了下01序列中的1试试，这个问题不用CoT根本做不对，用了CoT大概有70%的正确率，deepseek-R1一遍就做对了，还反思了两次来确认答案，可爱捏 …
分页
- 1
- 2
- 3
- 4