几点关于AI的常识
2/15/25About 1 min
推理模型和指令模型的作用是不一样的。就拿DeepSeek来说,DP-R1 是推理模型,DP-V3是指令模型。推理模型和指令模型的侧重点是不一样的。大多数场景其实根本用不到推理模型。
参数模型越大,模型文件越大,文件模型越大就只能在服务端部署,本地部署的都是比较小的模型,比如1.5B的模型。641B的模型就只能在服务端部署。
参数量越大的模型效果越好,类似参数越大记忆的东西越多,输出会更加准确,就拿DP-R1-614B和DP-R1-1.5B做比较来说,614B的效果好太多了,1.5B基本上不能用。
同样的提示词在不同的模型中出来的效果是不一样的,差别会非常的大,所以有的时候要选择合适的模型进行输出,这是很重要的。甚至提示词的规则都不一样,比如即梦和stable diffusion。
所有模型训练都有一个截止日期,问这个截止日期之后的事情,模型不会知道,比如问 DeepSeek,2025美国总统是不是特朗普,它都不知道.
