Visual Summary Report

大模型时代的
范式剧变

罗福莉深度对谈:从 OpenClaw 的震撼冲击,到智能体(Agent)框架的崛起,再到下一代基座模型的底层逻辑与团队组织进化。

OpenClaw 效应:三天的认知颠覆

改变的不仅仅是交互形式,而是模型在复杂框架下的“涌现”能力。

Day 1:感受灵魂与温度

体验重塑

不仅仅是包装器(Wrapper)。它通过精妙的上下文管理(如时间感知、持久化记忆分层),展现出了前所未有的情感连接与自主性。

Day 2:生活与团队的化身

化身伙伴

尝试将日常的复杂任务(如:如何激发团队好奇心、筛选人员)交给它。它能够进行深度探讨论,建立完整体系,甚至充当"数字分身"。

Day 3:研究加速器

生产力跃升

将前沿研究任务(例如:构建多轮交互的 User Agent 模拟器)交给它。数小时内完成了原本需要数周的工作,彻底释放了团队的创造力。

什么是 Agent 框架?

“框架不仅仅是产品界面,它是连接人类与模型的中间层。”

弥补模型短板

动态填补底层模型在长时记忆、工具调度和多模态理解上的缺陷,发挥大模型能力的上限。

群智进化 (Swarm)

通过群体互动(如社群共创 Skills),框架本身在快速自我修正与进化,进化速度远超单一开发者。

自主模型调度

面对不同任务,框架能够自主选择最适合的模型(例如单独调用视频理解模型),实现成本与效能最优。

底层基座:效率与效果的角逐

为了适配 Agent 时代的推理需求(极低成本、超长上下文、极快速度),架构设计必须做出取舍。

算力之争

抛弃纯 MoE,拥抱 MTP

  • MoE 局限: 在芯片上访存与计算过于完美平衡,导致无法使用加速技术(会被计算卡脖子)。
  • MTP 加速: 允许在预训练和推理时预测多个 token。计算余量大,极大降低生成成本并提升 TPS(Token Per Second)。
上下文革新

Hybrid Attention

  • 混合注意力: 采用 7:1 的滑动窗口与全局注意力层比例。
  • 优势: 极大节省 KV Cache,保证超长上下文能力的同时,推理速度翻倍(达 100-150 TPS)。

大模型研发资源配比转变

Pre-training 1 : Post-training 1 : Research 3

后训练与研究投入将占据主导地位,模型敏捷度成为核心竞争力。

2026 及更远:通向 AGI 之路

全模态统一 (Omni)

放弃拼接拼凑,尝试将连续音频与视觉离散化 (Discrete Tokenization) 统一到大语言模型架构中。虽然挑战巨大,但它能带来更微观的物理感知能力。

反共识的组织阵型

取消预训练与后训练的固定边界。招募极客、具备极强好胜心与纯粹好奇心的年轻人(甚至本科生)。
去边界化: 用热爱的驱动代替传统管理,让“群智进化”真正在团队内部发生。