MindMining

❯

万维钢：三层自我

万维钢：三层自我

2026年4月18日5分钟阅读

人的三层自我

1. 进程自我

本质：你时时刻刻感觉到的”我”，是大脑维持主体意识的在线计算
关键特征：
区分”我”和”非我”，但不稳定（全神贯注时会消失）
是被动的”新闻发言人”，而非实际决策者（大脑在你意识到前数百毫秒就已做出选择）
对应佛学五蕴：感觉输入、情绪评估、概念加工、意向行动、觉知
所有的即时反思都是查看进程自我的运行日志

2. 界面自我

本质：叙事中更稳定、可控且被他人认可的角色，即你的性格标签、人设、自传
关键特征：
是连续的人生故事，帮助他人快速认知你
具有一定约束力，可临时调整行为匹配情境（如内向者扮演社牛）
并非恒常不变，会随场景变化呈现不同状态

3. 内核自我

本质：生成进程自我和界面自我的背后主体，最接近”真我”的部分
关键特征：
不可被直接感知，是大脑运行的底层规则（无意识的概率分布和先验假设）
是慢变量，不随临时情绪或场景变化
对应佛教的”阿赖耶识”，成分是”习气”和”业力”

AI类比理解三层自我

进程自我 = LLM单次运行的完整流程：当下的念头流
界面自我 = 模型的系统提示词和角色设定：临时行为框架
内核自我 = 模型的结构和权重参数：训练完成后相对固定的底层逻辑

如何升级内核自我，实现成长

本质：持续修改模型参数

真正的成长需要主动更新内核自我的参数，而非停留在调整进程自我和修改界面提示词。

两大微调杠杆

语料（输入样本）：从小到大接触的信息、模仿的行为、加入的群体。长期接收碎片、极端信息会让大脑参数过度拟合垃圾数据。
强化学习的奖励函数：为行为提供反馈的奖惩机制。明确具体的奖励目标比泛泛的口号更有效。

面对预测误差的正确选择

当现实打脸你的预测时：

最偷懒：回避打脸的证据
稍好：绕开类似场景
最有价值：承认错误，重写模型参数（这是内核自我更新的黄金时机）

人的终极自由：自主选择训练内容

人可以主动选择训练自己的语料和奖励函数，这是元认知层面的觉醒：主动审视”是谁在训练我？我的目标是否合理？”

7个习惯的积极主动：主动选择的自由/权利

传统文化呼应

中式智慧：“吾日三省吾身”、“苟日新，日日新，又日新”
西方谚语：思想→语言→行动→习惯→性格→命运，对应从进程自我到内核自我参数的凝聚过程
河南师大杜灵来：心态引导视角，视角影响观念，观念决定行为，行为养成习惯，习惯塑造性格，性格决定命运

关系图谱

人的三层自我
1. 进程自我
2. 界面自我
3. 内核自我
AI类比理解三层自我
如何升级内核自我，实现成长
本质：持续修改模型参数
两大微调杠杆
面对预测误差的正确选择
人的终极自由：自主选择训练内容
传统文化呼应

Created with Quartz v4.5.2 © 2026

GitHub
Discord Community