You may also enjoy
从“模仿”到“思辨”:大模型两阶段对齐的最佳实践
4 分钟阅读
在微调大模型时,我们常手里攥着一堆数据:同一个问题,一个回答逻辑严密(Chosen),另一个回答虽然能看但略显平庸甚至有误(Rejected)。
明知有坑,为何不绕?——聊聊那些被“懒惰”喂养的不幸
7 分钟阅读
生活中最让人扼腕叹息的,往往不是突如其来的天灾,而是那些明明可以避开,却最终还是发生了的不幸。
LLM 微调避坑指南:从训练动态到显存账本的深度解剖
5 分钟阅读
在单卡(如 Tesla P100 16GB)上对大语言模型进行微调时,往往会遇到 Loss 不降、无限复读或显存溢出(OOM)等诡异问题。这篇博客将从底层逻辑出发,拆解 LLM 微调中的核心概念与显存消耗真相。
房价暴跌,房租凭什么死撑?一场剥离金融幻觉的底层估值修复
3 分钟阅读
近期房地产市场有一个极其违背直觉的现象:很多城市的二手房价格已经跌去了 20% 甚至 30%,但打工人们发现,自己每个月交的房租依然坚挺,甚至在部分核心地段还有微涨。
Leave a comment