AI最大赛道Agent机遇全解析

以下文章来源于Atom Capital ,作者科技最前沿的

AI最大赛道Agent机遇全解析-2

Atom Capital .

科技最前沿,创业路上的一点光

写在前面

Agent无疑是近期AI创投领域最火热的赛道。自3月AutoGPT爆火出圈之后,越来越多Agent初创项目涌现并拿到融资;随着OpenAI DevDay推出其官方Agent框架Assistant API,更是让这个概念进一步“火出圈”。几天前,Bill Gates发表文章表示 Agent不仅会改变每个人与电脑互动的方式。它还将颠覆软件行业,引领自输入命令到点击图标以来最大的计算机革命。

Agent一直是我们关注的重点方向之一,在上半年就做了相关投资布局。在与大量创业者交流中,我们发现,围绕Agent大家有非常多奇思妙想的创意,同时也有很多困惑之处,在落地实践中遇到不少挑战。我们近期组织了一次闭门沙龙,邀请AI领域专家和一线Agent创业者深入探讨Agent的落地、挑战及机遇。会上有很多精彩的实践经验和洞察,相信对朋友们会有启发。我们将部分观点整理成文,感谢与会者的精彩分享:段楠(MSRA研究员)、胡一川(来也科技CTO)、周健(澜码科技创始人)、陈龙博(illa Cloud创始人)、苏少炜(法千言创始人)、王磊(人大高瓴人工智能学院博士)、张东晖(前微软Bing亚洲搜索技术负责人、前阿里云产品负责人)和孙锋(微软搜索广告General Manager)。

AI最大赛道Agent机遇全解析-3

01 狂飙的Agent—Agent 2023大事记

“如果一篇论文提出了某种不同的训练方法,OpenAI内部会嗤之以鼻,认为都是我们玩剩下的。但是当新的AI Agent论文出来时,我们会十分认真且兴奋地讨论。普通人、创业者和极客在构建AI Agents方面相比OpenAI这样的公司更有优势。 ”

-- OpenAI联创Andrej Karpathy

如果说现在还有什么AI领域的“点子”能让OpenAI为之兴奋,那非Agent莫属。 从一个学界研究的概念到走入大众视野,Agent只用了短短不到一年时间。 如果大模型是未来水电煤一般 的基础设施,那么Agent则是未来用户接触、使用AI的方式。 我们梳理了今年Agent狂飙突进的重要milestone,从中也可以窥见它的核心发展脉络。

2023.3.16,微软发布Microsoft 365 Copilot,引发业界巨大反响,提示了一种 基于LLM的应用开发范式,也即今天形成行业共识的Agent。

2023.4,以AutoGPT为代表的Autonomous Agent 热度快速蹿升,AutoGPT成为GitHub历史上star数增长最快的项目。 同期比较受关注的类似项目包括: TaskMatrix.ai,HuggingGPT, AgentGPT, Toolformer, BabyAGI等等。

2023.6,OpenAI 应用研究主管 Lilian Weng 发布博文《LLM Powered Autonomous Agents》进一步推动了agent的热度,Lilian提出 Agent = 大型语言模型+记忆+规划技能+工具使用。

多Agent框架相继发布,相对于单一Agent框架能够更好地解决复杂问题。 目前比较火的多Agent框架包括: Camel(4月发布,3.4k star), MetaGPT(8月发布,29.7k star), AutoGen(9月发布,微软团队,13.6k star)

2023.11.6,OpenAI DevDay,推出其官方Agent开发框架Assistant API,赋能开发者更加高效方便地基于GPT模型进行的Agent开发。

AI最大赛道Agent机遇全解析-4

02 Agent Landscape概览

Agent吸引了大量创业者投身其中,据我们不完全统计,今年下半年在海外拿到知名创投机构投资的Agent项目已超过20家。在此我们做个基本梳理,方便大家了解目前市场上的整体情况:

从 创 投行业角度, 当下LLM based Agent领域初创公司可大致分为两类:

中间层infra

提供实用可复用的Agent框架,降低开发Agent 的复杂度,并为Agent的合作提供机制设计。该类项目主要从模块化、适配性、协作等几方面进行创新。其中拿到知名机构投资的代表项目包括:AutoGPT、Imbue、Voiceflow、Fixie AI、Reworked、Cognosys、Induced ai等。

Vertical Agent

深入某个垂直领域,理解该领域专家的工作流,运用Agent 思路设计Copilot产品,用户介入使 Agent思路更为可控。其中拿到知名机构投资的代表项目包括:Dropzone(安全领域)、Middleware(大模型可观察性领域)、Parcha(Fintech领域)、Luda(游戏领域)、Outbound AI(医疗领域)、Fine(软件开发领域)。

从Agent的互动/工作模式角度, 复旦大学自然语言处理团队(FudanNLP)在其 LLM-based Agents 综述论文( https://arxiv.org/pdf/2309.07864.pdf )中,将Agent分成了三类: 单一Agent, 多Agent以及人与Agent交互(按交互方式又分为指导-执行模式和平等合作模式) 。如下图所示:

AI最大赛道Agent机遇全解析-5

AI最大赛道Agent机遇全解析-6

03 Agent落地:场景和挑战

本次沙龙参与者既有学界资深的AI研究员,也有富有实战经验的一线Agent创业者。 对于围绕Agent大家关心的若干问题,我们进行了深入讨论,以下是本次讨论的一些精彩观点:

Agent适合在哪些场景落地?

创业者们已经尝试了各种落地场景,总结下来,以下几点更契合Agent的落地。

做到比人(普通员工) 好

客户不一定要求Agent达到专家水平,很多场合只要比普通员工好就够了。Agent PK的,实际上是月薪几千元的员工。比如,公司IT部门要响应业务人员的各种需求(如临时报表)。如果提供对话式UI,通过几轮对话让业务人员说明白需求,Agent来自动生成,做到这个,客户已经愿意买单了。这样IT团队可以从琐碎中解脱出来,做更重要的事。

Text to SQL

Text to SQL 在企业落地上有很多案例,以上例子本质上就是Text to SQL, 只不过多了很多新的数据来源:比如从商业化中最值钱的文档(合同、财报、简历、招投标书等)中提取数据。把这些数据连同专家知识

THE END
分享
二维码
< <上一篇
下一篇>>