原文来源:深思SenseAI
图片来源:由无界 AI? 生成
大模型遇冷,但是 Agent 方向的融资热潮似乎还如火如荼。Imbue 日前获得了 2 亿美元的 B 轮融资,估值已超过 10 亿美元。领投方为加密货币亿万富豪 Jed McCaleb 成立的非营利组织 Astera Institute,同时,英伟达、通用汽车旗下自动驾驶公司 Cruise 的首席执行官 Kyle Vogt、Notion 的联合创始人 Simon Last 等也是本轮融资的投资方,帮助 Imbue 成长为了 AI 领域的新独角兽。大语言模型可能卷不过 Open AI,但要说 Agent,真说不上谁会是这个领域的“ OpenAI ”。
作为同样在 AI Agent 领域的初创公司,Imbue 更像是一个技术向的人工智能研究室,从编程场景切入,致力于训练模型的推理能力,以让任何人都能够定制自己的人工智能代理。
虽然 10 亿美金的估值已经跻身前列,但 Imbue 本身还处于非常早期的阶段,员工仅有 20 人,也未有成熟产品面世。这与公司价值观也息息相关,创始人表示,Imbue 的商业化之路还很漫长,在融资过程中,他们有意避免了与风投公司的会面,非盈利组织会对公司成长更有耐心。
Imbue 团队规模不大,但团队成员有着非常多元的背景,在 AI 、神经科学、等离子体物理学等学科都有丰富的经验。
Sense说:值得注意的是,Imbue 是少数由女性创业者领导的 AI 初创公司。创始人 Kanjun 关注“人”、“文化”和社会组织,致力于通过理解机器的思维方式来实现通用智能。Kanjun 毕业后作为 Chief of Staff 加入 Dropbox 将公司从 300?人增长至 1500 人,后创办了?The Archive?和 YC 投资的 AI 招聘平台?Sourceress。
他们瞄准 Agent 赛道,以超大规模的语言模型为基础,不断提高 AI 推理能力,丰富代理场景,希望可以实现完全的超级 PC 中的 AI 智能,人们可以根据自己的目标设定不同功用的 Agent ,服务与我们的日常工作。
1. 高效的 Agent 需要训练强大的推理能力
他们表示,当前的人工智能系统代表用户完成简单任务的能力非常有限,虽然可以预见到未来几年会迅速发展,但在人工智能代理能够以真正强大、安全和可用的方式实现更复杂的目标之前,还有很多工作要做。
推理( reasoning )通常被认为是完成一个有效 Agent 的主要障碍,它涉及处理不确定性的能力、知道什么时候应该变化使用方法、提出问题、收集新信息以及处理现实复杂的、难以预测的问题的能力。为了创建可靠性强的推理模型,Imbue采取了“全栈”方法:训练基础模型,构建实验代理和接口,在基础设施工具中投入资源,同时不断学习模型运作的核心机制。
– 模型层。 Imbue 训练的超大型模型拥有超过 1000 亿的参数,因为有英伟达的投资,他们有约 1 万个 H100 集群,让他们能够从训练数据到架构和推理机制的所有内容进行快速迭代——与 OpenAI 用来训练 GPT-3 的处理器数量差不多。
– 代理层。 目前,Imbue 主要开发了用于内部编码的代理,同时也在孵化更多的代理方向。
– 界面层。现在的 AI 聊天界面基本都是拟物化的。而团队认为,这不一定是最好的交互方式,新的交互界面可能可以更好的解决 Agent 的稳健型、协作能力和信任感,它们可以理解世界,也可以做到更真实。
– 工具层。 Imbue 在内部系统中投入很多资源,无论是错误检查还是代理和模型的可视化页面,完善效率工具的搭建可以让整个过程更加可视化,同时可以为外部产品工具注入新鲜思路。
– 理论层。 Imbue 的研究人员发表了有关自我监督学习的理论基础,以及控制神经网络等系统学习基本定律的文章,他们认为深刻理解深度学习理论,才能更好的理解大型语言模型学习过程背后的核心机制。
这种“全栈”方法渐渐形成了正向循环。设计可用于内部的 Agent 和工具可以帮助 Imbue 更快地迭代更好的模型,进而解锁更有用的代理,创建更好的模型。研究理论可以促进对于神经网络的理解,进而可以更好的设计模型架构。
2. 以编码 Agent 为切入点进行开发
Imbue 一开始就选择了编码场景作为 Agent 的切入点,主要是因为:
– 使用是创新的必要条件。当开发的产品也在自己的日常工作中被频繁使用的时候,产品才能被足够重视,而且能得到足够的信息以进行后续的优化。
– 解决编码问题可以提高模型的推理能力。可能因为代码是互联网上为数不多的显式推理示例之一,有代码的训练通常可以提升模型的推理能力。而且由于编程问题非常客观(代码要么通过测试,要么没有通过),形成了一个理想的测试平台,让我们理解是否正在对底层系统进行有意义的改进。
– 编码能力对最终的问题解决很重要。生成代码是 Agent 解决问题的有效方式。更强的编码能力可以直接转化为更有可能成功完成复杂任务的智能体。(例如,编写 SQL 查询表中信息的代理比尝试在不使用任何代码的情况下组装相同信息的代理更有可能满足用户请求。)
– 编码 Agent 具有重要的战略意义。 随着代理的改进并接管我们更多的工作,Imbue 公司的研究和工程速度也随之提高。这不仅有助于构建软件系统,还可以借助编码 Agent 的能力进行下一步的原型设计。
但 Imbue 目前不打算开放编码 Agent ,它成为了一种改进代理的方式。后续随着产品成熟,相应的工具和模型也会被公开。
当我们构建人工智能代理时,实际上是在构建能够理解我们的目标、主动沟通并在后台为我们工作的智能PC。今天,我们离不开电脑,因为如果我们不在电脑前,就很难完成任何事情。真正有用的人工智能代理将从根本上改变这一点,让我们能够专注于我们真正关心的事情。
这就是 Imbue 的愿景:我们希望构建真正的个人电脑,赋予我们自由、尊严和代理权,让我们可以做自己喜欢的事情。
“如果我们深思熟虑地构建这项技术,就可以生活在一个不再需要粘在屏幕上的世界,计算机可以帮助我们消除想法和执行之间的障碍。我们将自由地探索我们的好奇心,发现宇宙的规律,进行创造艺术,更深入地了解彼此,或者只是花时间享受生活。”
同时,Imbue 也在密切关注 AI 的安全风险,已经在三个领域开展了工作:
– 设计AI代理以自然语言进行推理,并完全以最终用户的目标为条件。
– 追求深度学习的基本法则,以提高对当今最重要的人工智能系统的理解。
– 为政策制定者开发工具,以理解大量监管建议并将其转化为保护人民的政策。
参考材料
https://imbue.com/company/introducing-imbue/
https://imbue.com