几点关于AI的常识

2/15/25About 1 min

推理模型和指令模型的作用是不一样的。就拿DeepSeek来说，DP-R1 是推理模型，DP-V3是指令模型。推理模型和指令模型的侧重点是不一样的。大多数场景其实根本用不到推理模型。
参数模型越大，模型文件越大，文件模型越大就只能在服务端部署，本地部署的都是比较小的模型，比如1.5B的模型。641B的模型就只能在服务端部署。
参数量越大的模型效果越好，类似参数越大记忆的东西越多，输出会更加准确，就拿DP-R1-614B和DP-R1-1.5B做比较来说，614B的效果好太多了，1.5B基本上不能用。
同样的提示词在不同的模型中出来的效果是不一样的，差别会非常的大，所以有的时候要选择合适的模型进行输出，这是很重要的。甚至提示词的规则都不一样，比如即梦和stable diffusion。
所有模型训练都有一个截止日期，问这个截止日期之后的事情，模型不会知道，比如问 DeepSeek，2025美国总统是不是特朗普，它都不知道.