目前主流开源的大模型发展迅速,许多模型经过优化后可以在个人电脑(甚至CPU或消费级GPU)上运行。以下是当前主流的开源大模型及其在个人设备上的部署可行性总结:
一、主流开源大模型
1.DeepSeek系列
DeepSeek大语言模型算法:以Transformer架构为基础,自主研发的深度神经网络模型。模型基于注意力机制,通过海量语料数据进行预训练,并经过监督微调、人类反馈的强化学习等进行对齐,构建形成深度神经网络,并增加审核、过滤等安全机制,使算法模型部署后能够根据人类的指令或者提示,实现语义分析、计算推理、问答对话、篇章生成