AI Agent & LangGraph: Zero to Hero 大模型驱动的智能体
AI Agent是以大模型(LLM)为核心推理机,配备上作用于物理世界的动作模块(Action)和感知环境的观察模块(Observation),架起了大模型与现实世界的通道。 大大增强了AI系统的适应性、可靠性和广泛性。
大模型(LLM)缺点 | 智能体(Agent)的解决方案 |
---|---|
互动性差 | 动作(Action) |
连续性差 | 状态(State = Observation + Memory) |
自主性差 | 循环 (Cycle) |
大模型虽然在推理方面得到了突飞猛进的发展,但要能处理实际生活中更广泛的任务时,自身仍然存在明显缺陷:
互动性差:输出仅为文本,难以与物理世界进行有效互动;
连续性差:大模型调用是无状态的,无法建立多次调用间的联系;
自主性差:大模型只能被动地响应用户的输入,缺乏自主性;
**智能体(Agent)**通过增加下面的组件,解决上述大模型存在的问题:
- 动作(Action):随着自动化程度的提升,人类积累了大量可以与物理世界互动的程序。这些程序作为工具(tools),可以通过解析(Parser)大模型的输出形成对工具的API调用,从而作用于外部的物理世界。
- 状态(State):在多次调用大模型时,周围环境的变化(Observation)和之前的操作历史(Memory),都作为prompt的一部分一起输入到大模型,从而让模型建立多次调用之间的联系,增加系统响应的连贯性。
- 循环(Cycle):允许模型自己判断,是否需要循环调用大模型,从而可以解决更复杂的问题,让模型从被动调用转变为主动自治。
智能体的核心思想是使用语言模型来选择要采取的一系列行动。在链中,一系列动作是硬编码的(用代码)。在智能体中,语言模型被用作推理引擎,以确定以何种顺序采取哪些操作。