Skip to content
On this page

AI Agent & LangGraph: Zero to Hero 大模型驱动的智能体

AI Agent是以大模型(LLM)为核心推理机,配备上作用于物理世界的动作模块(Action)和感知环境的观察模块(Observation),架起了大模型与现实世界的通道。 大大增强了AI系统的适应性、可靠性和广泛性。

大模型(LLM)缺点智能体(Agent)的解决方案
互动性差动作(Action)
连续性差状态(State = Observation + Memory)
自主性差循环 (Cycle)

大模型虽然在推理方面得到了突飞猛进的发展,但要能处理实际生活中更广泛的任务时,自身仍然存在明显缺陷:

  • 互动性差:输出仅为文本,难以与物理世界进行有效互动;

  • 连续性差:大模型调用是无状态的,无法建立多次调用间的联系;

  • 自主性差:大模型只能被动地响应用户的输入,缺乏自主性;

**智能体(Agent)**通过增加下面的组件,解决上述大模型存在的问题:

  • 动作(Action):随着自动化程度的提升,人类积累了大量可以与物理世界互动的程序。这些程序作为工具(tools),可以通过解析(Parser)大模型的输出形成对工具的API调用,从而作用于外部的物理世界。
  • 状态(State):在多次调用大模型时,周围环境的变化(Observation)和之前的操作历史(Memory),都作为prompt的一部分一起输入到大模型,从而让模型建立多次调用之间的联系,增加系统响应的连贯性。
  • 循环(Cycle):允许模型自己判断,是否需要循环调用大模型,从而可以解决更复杂的问题,让模型从被动调用转变为主动自治。

智能体的核心思想是使用语言模型来选择要采取的一系列行动。在链中,一系列动作是硬编码的(用代码)。在智能体中,语言模型被用作推理引擎,以确定以何种顺序采取哪些操作。