人的三层自我

1. 进程自我

  • 本质:你时时刻刻感觉到的”我”,是大脑维持主体意识的在线计算

  • 关键特征

  • 区分”我”和”非我”,但不稳定(全神贯注时会消失)

  • 是被动的”新闻发言人”,而非实际决策者(大脑在你意识到前数百毫秒就已做出选择)

  • 对应佛学五蕴:感觉输入、情绪评估、概念加工、意向行动、觉知

  • 所有的即时反思都是查看进程自我的运行日志

2. 界面自我

  • 本质:叙事中更稳定、可控且被他人认可的角色,即你的性格标签、人设、自传

  • 关键特征

  • 是连续的人生故事,帮助他人快速认知你

  • 具有一定约束力,可临时调整行为匹配情境(如内向者扮演社牛)

  • 并非恒常不变,会随场景变化呈现不同状态

3. 内核自我

  • 本质:生成进程自我和界面自我的背后主体,最接近”真我”的部分

  • 关键特征

  • 不可被直接感知,是大脑运行的底层规则(无意识的概率分布和先验假设)

  • 是慢变量,不随临时情绪或场景变化

  • 对应佛教的”阿赖耶识”,成分是”习气”和”业力”

AI类比理解三层自我

  • 进程自我 = LLM单次运行的完整流程:当下的念头流

  • 界面自我 = 模型的系统提示词和角色设定:临时行为框架

  • 内核自我 = 模型的结构和权重参数:训练完成后相对固定的底层逻辑

如何升级内核自我,实现成长

本质:持续修改模型参数

真正的成长需要主动更新内核自我的参数,而非停留在调整进程自我和修改界面提示词。

两大微调杠杆

  1. 语料(输入样本):从小到大接触的信息、模仿的行为、加入的群体。长期接收碎片、极端信息会让大脑参数过度拟合垃圾数据。

  2. 强化学习的奖励函数:为行为提供反馈的奖惩机制。明确具体的奖励目标比泛泛的口号更有效。

面对预测误差的正确选择

当现实打脸你的预测时:

  • 最偷懒:回避打脸的证据

  • 稍好:绕开类似场景

  • 最有价值:承认错误,重写模型参数(这是内核自我更新的黄金时机)

人的终极自由:自主选择训练内容

人可以主动选择训练自己的语料和奖励函数,这是元认知层面的觉醒:主动审视”是谁在训练我?我的目标是否合理?”

7个习惯的积极主动:主动选择的自由/权利

传统文化呼应

  • 中式智慧:“吾日三省吾身”、“苟日新,日日新,又日新”

  • 西方谚语:思想→语言→行动→习惯→性格→命运,对应从进程自我到内核自我参数的凝聚过程

  • 河南师大杜灵来:心态引导视角,视角影响观念,观念决定行为,行为养成习惯,习惯塑造性格,性格决定命运