2026-04-25 DeepSeek-V4
Canace 的博客
Tomorrow is another day
主页
文章归档
知识库
关于我
订阅
随机文章
2026-04-25 DeepSeek-V4
目录
简介
核心要点
相关来源
简介
DeepSeek-V4 系列是 DeepSeek 的最新 MoE 大模型,支持 100 万 token 上下文,在长上下文场景下效率大幅提升。
核心要点
模型规模
:DeepSeek-V4-Pro(1.6T 参数,49B 激活)、DeepSeek-V4-Flash(284B 参数,13B 激活)
架构创新
:混合注意力( CSA + HCA)、mHC、Muon 优化器
长上下文效率
:100 万 token 下仅需 V3.2 的 27% FLOPs、10% KV cache
相关来源
DeepSeek-V4 技术报告
常用文档
Git 文档
常用开发提示词
分类
软技能与思考
51
工程化与运维
51
AI探索
18
Web开发
142
编程基础
42
网站建设
5
标签
随笔
性能优化
AI原理
JavaScript&TypeScript
后端
API&服务
Python/Go/其他
计算机科学
AI编程
职业发展
翻译
前端
框架与库
笔记
系统设计
编程语言
CSS与可视化
构建与部署
开发工具
Agent,Skill
Node.js
跨端方案
项目管理
知识库
代码质量