人的三层自我
1. 进程自我
-
本质:你时时刻刻感觉到的”我”,是大脑维持主体意识的在线计算
-
关键特征:
-
区分”我”和”非我”,但不稳定(全神贯注时会消失)
-
是被动的”新闻发言人”,而非实际决策者(大脑在你意识到前数百毫秒就已做出选择)
-
对应佛学五蕴:感觉输入、情绪评估、概念加工、意向行动、觉知
-
所有的即时反思都是查看进程自我的运行日志
2. 界面自我
-
本质:叙事中更稳定、可控且被他人认可的角色,即你的性格标签、人设、自传
-
关键特征:
-
是连续的人生故事,帮助他人快速认知你
-
具有一定约束力,可临时调整行为匹配情境(如内向者扮演社牛)
-
并非恒常不变,会随场景变化呈现不同状态
3. 内核自我
-
本质:生成进程自我和界面自我的背后主体,最接近”真我”的部分
-
关键特征:
-
不可被直接感知,是大脑运行的底层规则(无意识的概率分布和先验假设)
-
是慢变量,不随临时情绪或场景变化
-
对应佛教的”阿赖耶识”,成分是”习气”和”业力”
AI类比理解三层自我
-
进程自我 = LLM单次运行的完整流程:当下的念头流
-
界面自我 = 模型的系统提示词和角色设定:临时行为框架
-
内核自我 = 模型的结构和权重参数:训练完成后相对固定的底层逻辑
如何升级内核自我,实现成长
本质:持续修改模型参数
真正的成长需要主动更新内核自我的参数,而非停留在调整进程自我和修改界面提示词。
两大微调杠杆
-
语料(输入样本):从小到大接触的信息、模仿的行为、加入的群体。长期接收碎片、极端信息会让大脑参数过度拟合垃圾数据。
-
强化学习的奖励函数:为行为提供反馈的奖惩机制。明确具体的奖励目标比泛泛的口号更有效。
面对预测误差的正确选择
当现实打脸你的预测时:
-
最偷懒:回避打脸的证据
-
稍好:绕开类似场景
-
最有价值:承认错误,重写模型参数(这是内核自我更新的黄金时机)
人的终极自由:自主选择训练内容
人可以主动选择训练自己的语料和奖励函数,这是元认知层面的觉醒:主动审视”是谁在训练我?我的目标是否合理?”
7个习惯的积极主动:主动选择的自由/权利
传统文化呼应
-
中式智慧:“吾日三省吾身”、“苟日新,日日新,又日新”
-
西方谚语:思想→语言→行动→习惯→性格→命运,对应从进程自我到内核自我参数的凝聚过程
-
河南师大杜灵来:心态引导视角,视角影响观念,观念决定行为,行为养成习惯,习惯塑造性格,性格决定命运