硬件基础 GPU: Inter GTX5060 (100%跑,勉强够用) CPU: Inter I9-14900HX (实际上用不到) 内存:32GB
软件基础 ●操作系统:windows 11 ●框架: LLama-Factory (国产最热门的微调框架) 国内北航开源的低代码大模型训练框架,可以实现零代码微调,简单易学,功能强大,且目前热度很高,建议新手从这个开始入门,非常适合我这种小白 关于框架选择建议可以看https://www.zhihu.com/question/638803488/answer/84354509523 ●算法:LoRA(最著名的部分参数微调算法) 2021 年 Microsoft Research 提出,首次提出了通过低秩矩阵分解的方式来进行部分参数微调,极大推动了 AI 技术在多行业的广泛落地应用:LoRA: Low-Rank Adaptation of Large Language Models ●基座模型:DeepSeek-R1-Distill-Qwen-1.5B 蒸馏技术通常用于通过将大模型(教师模型)的知识转移到小模型(学生模型)中,使得小模型能够在尽量保持性能的同时,显著减少模型的参数量和计算需求。