💠分享|使用 GPT-4 和 LangChain 构建的应用程序将如何改变一切
00 分钟
2023-4-27
2023-8-26
type
status
slug
summary
date
tags
category
password
Text
AI summary
AI custom autofill
Multi-select
Status
URL
hashtag
勘误
标签
标题
类型
贴文
🪄
icon
 
如果您想了解通用人工智能 (AGI) 的最新发展以及如何使用 GPT-4 和 LangChain 构建智能应用程序,那么这篇文章一定不容错过。作者 Kevin Dewalt 深入探讨了 GPT-4 和 LangChain 的工作原理,以及它们如何成为构建 AGI 应用程序的基石。而这些应用程序将如何改变您的工作和生活则是本文的另一个重要话题。
除了深入探讨 GPT-4 和 LangChain 的工作原理外,本文还给出了一些实用的建议,帮助您准备好迎接人工智能未来的过渡期。这些建议包括如何了解 GPT-4,如何把握 GPT-4 和 LangChain 的潜力,以及如何客观评估您的职业生涯,等等。此外,本文还给出了一些管理这些变化的建议,让您不必紧跟每一个新的开发或应用程序,专注于重要的事情。
如果您想了解如何使用 GPT-4 和 LangChain 构建智能应用程序,从而改变您的工作和生活,那么这篇文章一定不容错过。了解 GPT-4 和 LangChain 的工作原理,并在准备好迎接人工智能未来的过渡期前开始准备自己和您的公司。让我们一起探索这个快速发展的领域,共同创造更加智能的未来。

介绍

你工作的一切都会很快改变。
每项工作职能都会演变或消失,而新的职能又会萌芽。我们所知道的业务流程将彻底转变。遗留企业系统?大多数都会过时,公司将停止对它们的所有新开发。产品路线图将被废弃,恕不另行通知。一些部门将解散或合并,而另一些部门将出现。现有公司将逐渐消失,而新的初创公司将在短短几个月内飙升至数十亿美元的估值。这种迫在眉睫的转变归功于一种称为通用人工智能(AGI)的新兴技术,它有望彻底改变我们的工作生活,包括您的工作生活。
AGI 是一种能够在各种情况下进行推理和决策的系统,就像人类一样。当这样的系统应用于解决业务问题时,我称之为企业AGI虽然大多数公司都在使用 AI 来解决特定任务,但目前还不存在一种称为狭义 AI 的企业 AGI。这种情况即将改变,企业 AGI 预计将在 2023 年底出现,并在 2024 年缓慢加速并稳步增长。尽管确切的时间表和影响分布仍不确定,但开始准备至关重要。现在
AGI 的必然性植根于 GPT-4 在推理任务上令人印象深刻的表现。遗憾的是,这一事实尚未得到广泛认可。尽管有数百万人使用 ChatGPT,但绝大多数人并未完全理解 GPT-4 与其前身之间的区别。在那些这样做的人中,大多数人都误以为 GPT-4 必须在我们开始构建企业 AGI 之前进行改进。这个关键点经常被误解,以至于我重复一遍。又是这样:我们今天就可以开始构建企业 AGI,即使 GPT 当前存在局限性。
我希望通过解释企业 AGI 将如何到来来开始对话:通过使用GPT-4LangChain构建智能应用程序。(如果您还不熟悉,请不要担心,我会解释它们)。我希望你能带走以下内容:
  • GPT-4 是一个改变游戏规则的人,拥有将改变一切的人类推理的火花。
  • 尽管存在非常真实的缺陷,但我们今天可以通过使用其他工具克服 GPT-4 的缺点来开始构建 AGI 应用程序。
  • GPT-4 的真正影响不在于它仅作为一种工具使用,而是作为推动所有业务流程的智能大脑。
  • 今天,LangChain 提供了一个框架来开始构建这些应用程序。
除了结语之外,这篇文章不是关于谨慎的。我将把人工智能伦理、限制和风险的辩论留给政策制定者和公共知识分子这些讨论是有效且重要的,我完全赞成在其他地方参与这些讨论。
这段对话迎合了不同的人群——建设者我正在与像我一样决心尽快实现这一不可避免的未来的开发人员、企业家、投资者和企业 AI 领导者联系。我们是乐观主义者,最终相信人工智能将为人类的更大利益而彻底改变社会。
如果这引起你的共鸣,这是最后一次推动。从这场千载难逢的过渡中获胜的竞赛于 2023 年 3 月 14 日拉开帷幕。您准备好了吗?

概括

在过去的 50 年里,我们见证了显着的信息技术 (IT) 进步,这些进步彻底改变了企业的运作方式。计算机和网络通过实现大规模协作释放了人类的创造力。包括卷积神经网络、Transformer 和 GPT-3 在内的一系列研究突破,推动了狭义 AI 应用的采用。
然而,人类推理在所有业务流程和决策中仍然不可或缺。多年来,技术远见者一直推测计算机最终将具备理解和执行人类可以完成的任何智力任务的能力,这一概念通常被称为通用人工智能 (AGI)关于 AGI 出现的预测范围很广——直到 2023 年 3 月 14 日,OpenAI 发布了GPT-4,展示了初步的 AGI 并标志着人类最重大的创新之一。
GPT-4 是世界上第一个推理模型,与LangChain相结合,为早期的 AGI 系统铺平了道路,LangChain 是一个用于构建连接语言模型系统的平台。这种结合开创了一个新时代,在这个时代,像 GPT-4 这样的智能大型语言模型 (LLM) 接管了以前由人类担任的决策角色。LangChain 使 GPT-4 能够协调复杂的任务,例如搜索网络、分析和编写文档、创建和执行软件程序以及为其他 GPT-4 模型分配任务。
LangChain 还展示了 AGI 系统将如何出现:GPT-4 将通过在不确定或不正确时向我们寻求帮助来学习如何完成复杂的任务。我希望一个团队能在几个月内用 LangChain 展示这种方法。不久之后,公司将启动企业 AGI 项目,其中一小部分显示出前景的项目将在大肆宣传的情况下于 2023 年底匆忙投入生产。
现实将在 2024 年发生,因为缺乏适当的工具和技术来开发和扩展生产就绪的 AGI 系统会导致业务影响变慢。尽管如此,有几个因素将加速 AGI 的推出,包括新的研究突破、消费者 AI 的更快采用引起的媒体关注,以及从传统信息技术 (IT) 项目到 AGI 的预算转移。
您可以开始定位自己和您的公司,以便在此过渡期间蓬勃发展。了解该技术并客观地评估您的情况。尝试推动变革或启动过渡计划。最重要的是,对受此变化影响的每个人表示同情,因为许多人将无法像您一样有效应对。
第一部分中,我通过描述企业 IT 系统从 1970 年代到 2023 年 3 月 13 日的演变来提供背景信息。
第二部分,我解释了 GPT-4 和 LangChain 将如何引领企业 AGI。
第三部分,我描述了当前状态以及早期企业 AGI 将在 2023 年推出的原因。
第四部分,我给出了一些我可能错了的原因——以及为什么这并不重要。
第五部分中,我提供了一些建议,说明您可以着手做些什么来准备并顺利度过这一过渡期。
最后,我提出了一些建议,以帮助您的人类同胞渡过这个艰难的过渡期。

第一部分:企业 IT 的 50 年历史

读者注意:我以广泛的方式使用术语“IT”来包括所有企业技术系统,而不仅仅是那些由您的信息技术部门监督的系统。
在过去的 50 年里,显着的技术突破改变了商业格局。尽管受到个人电脑、互联网、智能手机和社交媒体的影响,企业通用人工智能 (AGI) 的出现在塑造企业未来方面超越了以往的所有里程碑。
为了解当下,让我们回顾过去五年的创新历程,并审视业务流程是如何演变的。

人为驱动的时代

notion image
在 20 世纪 70 年代,IT 对大多数企业来说都是稀罕物。尽管使用了大型计算机和哑终端,但它们的高成本限制了可及性。因此,几乎所有的业务流程都依赖于人类的推理和劳动。

个人电脑:提高人类效率

notion image
1981 年 IBM 个人电脑的推出引发了 IT 领域的一场革命。借助 Microsoft Word 和 Excel 等应用程序,个人可以更有效地处理和分析信息。然而,个人电脑只是人们的工具。Word 文档会一直显示闪烁的光标,直到有人开始输入为止。

连通性和协作:释放创造力

notion image
1990 年代见证了计算机网络的出现,以太网技术实现了无缝通信和协作。互联网进一步在全球范围内扩展了这些能力,促进了创造力的激增。智能手机将计算机的强大功能置于我们的掌中,并且可以即时访问电子邮件、文档和应用程序。一些应用程序,例如谷歌地图等导航应用程序,甚至表现出有限的推理和判断。但大多数这项技术并不比订书机聪明,其影响来自连接和放大人类智慧和决策。

狭义人工智能:将思考任务委托给计算机

notion image
从 2010 年到 2022 年,神经网络的发展使计算机能够执行以前人类独有的通用任务。卷积神经网络使实际的计算机视觉应用成为可能,例如面部识别。2017 年,谷歌推出了BERT 系列 NLP 转换器算法,公司开始部署它们来处理特定的 IT 任务,例如根据含义而不是关键字搜索信息。这些解决方案逐渐开始释放人力资源以从事更复杂的工作。然而,几乎所有人都接受了模仿人类推理的训练,并作为功能部署在仍然由人驱动的复杂业务流程中。

ChatGPT:生成人工智能的一大飞跃

notion image
2022 年 11 月,OpenAI 发布了 ChatGPT(基于 GPT-3.5 模型)并展示了如何通过增加模型大小、在更多数据上训练它们以及通过人工反馈改进它们来使 NLP 转换器算法变得更加强大。ChatGPT 展示了许多研究人员在未来十年都没有想到的文本生成功能。它还包含关于世界的惊人数量的知识,并展示了在许多任务中取代谷歌搜索的潜力。ChatGPT 立即成为写作和编程等任务的有用工具。不幸的是,它也经常出现“幻觉”:一个行业术语,指的是产生听起来很聪明的逻辑废话,以及一种限制,使它成为人们的另一种工具。

2023 年 3 月 13 日的世界

在过去的 50 年里,我们看到了惊人的技术进步,这些进步彻底改变了企业的运营方式。计算机和网络通过促进大规模协作释放了人类的创造力。一系列的研究突破,包括卷积神经网络、transformer 和 GPT-3,逐步推动了狭义 AI 应用的采用。
然而,在每个业务流程和决策中,人类推理仍然不可或缺。尽管我们总有一天会开发出一种能够取代人类推理的 AGI 似乎是不可避免的——尽管并不能保证——但有关这一事件的预测却大不相同。我与许多研究人员交谈过,他们认为 OpenAI 训练 GPT-3.5 的方法最终会遇到收益递减的问题,并且需要神经符号 AI等替代方法来实现 AGI。此外,Prolego已经为我们的客户对 GPT 进行了评估,得出的结论是 BERT 系列转换器仍然是大多数 NLP 任务(例如信息提取或语义搜索)的最实用选择。GPT 模型还需要将数据发送到企业外部到 OpenAI 的 API,这种设计违反了大多数公司的数据保护和安全政策。
这就是 2023 年 3 月 13 日的世界状况。我们中很少有人在那个星期一思考我们何时可以见证人工智能的突破,从而引发在企业中开发和实施 AGI 的竞赛。如果我们进行了推测,那么我们中猜到正确答案的人就更少了:
明天

第二部分:企业 AGI 黎明之前

2023 年 3 月 14 日,OpenAI 推出了一种名为 GPT-4 的全新通用大型语言模型 (LLM)。该公告将 GPT-4 主要描述为其现有模型的增强迭代,展示了改进并承认了局限性:
“在随意的谈话中,GPT-3.5 和 GPT-4 之间的区别可能很微妙。当任务的复杂性达到足够的阈值时,差异就会出现——GPT-4 比 GPT-3.5 更可靠、更有创意,并且能够处理更细微的指令。……尽管具有强大的功能,但 GPT-4 与早期的 GPT 模型具有相似的局限性。最重要的是,它仍然不完全可靠(它‘幻觉’事实并导致推理错误)。”
GPT-4 的可用性有限,导致许多人低估了它的真正潜力。用于使用 GPT-4 构建应用程序的 API 有一个候补名单,只有 ChatGPT 的付费版本才能授予访问权限。它的运行速度比 GPT-3.5 慢,并且 OpenAI 施加了使用限制。
因此,即使是我们 AI 爱好者也没有在其发布后的最初几周内完全理解其影响。

万亿维空间的惊喜

我敢肯定,亚历山大·格雷厄姆·贝尔 (Alexander Graham Bell) 从未想过他的话语,“先生。沃森——过来——我想见你”,这将成为与新技术发布相关的最著名的随意评论。
同样,微软高级首席研究经理塞巴斯蒂安·布贝克 (Sebastien Bubeck) 可能没有预见到他在 2023 年 4 月 7 日麻省理工学院演讲“AGI的火花:GPT-4 的早期实验”中开场白的影响:“当心万亿维空间及其惊喜。”
这句话是为了对抗包括 AI 专家在内的那些不加思索地驳斥任何 GPT-4 是智能的说法的人。示例声明:

GPT-4 没有内部表示或世界模型,因此它不是智能的。GPT-4?这只是大数据的统计或复制粘贴。

需要明确的是,这些下意识的反应是可以理解的。自 1950 年代以来,研究人员一直对 AGI 的到来做出极其乐观的预测。都错了。此外,AGI 代表了一种变革性和可怕的创新,以至于我们所有人都倾向于忽视它。
不幸的是,包括记者和您的同事在内的人们听到并重复了这些说法而没有进一步考虑。布贝克的随口一说,是想引起他们的注意。让我不那么随意地改写一下:

停止争论智力的学术定义并唤醒他妈的。GPT-4 在相关任务上展示了人类水平的智能,您需要注意,因为一切都将发生变化。

在他的演讲和相关论文中,Bubeck 分享了微软对 GPT-4 对特定任务执行有限推理能力的印象。从他的论文中的介绍:
在本文中,我们报告了由 OpenAI 开发的新 LLM ……展示了许多智能特征的证据。…… [T]他的早期版本的 GPT-4 在各种领域和任务上展示了卓越的能力,包括抽象、理解、视觉、编码、数学、医学、法律、对人类动机和情感的理解等等。…… [W]e 显示 GPT-4 输出的一些初步示例,要求它以诗歌的形式写出素数无限性的证明,在 TiKZ 中画独角兽……在 Python 中创建复杂的动画,并解决一个高中水平的数学问题。它很容易在所有这些任务上取得成功,并产生与人类所能产生的基本上没有区别(甚至更好)的输出。 我们还将 GPT-4 的性能与之前的 LLM 进行了比较,最引人注目的是……GPT-3……虽然系统在这两项任务上都表现出色,但无法与 GPT-4 的输出进行比较。这些初步观察将在整篇论文中针对各种各样的任务不断重复。GPT-4 能力的普遍性,跨越广泛领域的众多能力,以及它在广泛任务中达到或超过人类水平的表现的结合,让我们可以说 GPT-4 是重要的一步走向通用人工智能。
(强调我的)
读者注意:本文对比了 GPT-4 和 ChatGPT。在撰写本文时,GPT-4 在 ChatGPT 中不可用,因此目的是比较 GPT-3.5 和 GPT-4。GPT-4 目前在 ChatGPT 订阅中可用。这也是您每月可以花费的最好的 20 美元。

GPT-4 通用智能的示例

Bubek 的演示文稿、论文和OpenAI中有数十个示例我强烈建议您花一两个小时浏览它们并尝试自己复制它们,但这里有一些很棒的东西:
  • LSAT 88%,GRE verbal 99%。
  • 通过了 Amazon 和 Google 编码面试并击败了 100% 的人类候选人。
notion image
我可以继续列举更多,但我也知道很多人在亲身体验之前不会完全意识到 GPT-4 是智能的。那么让我们看看你如何对抗 GPT-4。

GPT-4 对比 GPT-3 对比你

挑战

你有一本书、9 个鸡蛋、一台笔记本电脑、一个瓶子和一个钉子。编写一组指令,以稳定的方式将它们堆叠在一起。

花点时间思考一下这个难题。现在,考虑以下问题:
谁能解决?
我们知道,如果您愿意投入时间,您有能力破解这个难题,或者您可以简单地寻找答案。这同样适用于大多数成年人。我们也知道订书机无法胜任这项任务。Microsoft Word 也不是。而 Siri——请注意,尽管在你的 iPhone 上已经使用了 12 年——只是不适合它。
让我们同意解决这个问题需要智慧它要求的推理水平超过我们预期的计算机能力。
请参阅附录并查看 GPT-3 和 GPT-4 的回复。
读者注意:您可能无法使用 GPT-4 完全复制这些结果。请参阅 Bubek 的介绍或第 3 部分中提到的挑战。
GPT-4 不仅能够解决这个问题,而且比我更快。它能够做到这一点,是因为 GPT-4 具有智能和推理能力。

GPT-4 的局限性

  • 它可以“产生幻觉”:提供有说服力的、精心设计的反应,但实际上是不正确的。
  • 它与数学斗争。
  • 它可能会在难题上失败。
  • 它的记忆仅限于它在训练中学到的东西。
  • 它的规划能力非常有限。
乍一看,这些障碍似乎严重阻碍了 AGI 的发展——而且它们确实很大。任何一个缺点都会使一个人失去大多数工作的资格,而拥有所有缺点会使他们无法自给自足。
评估 GPT-4 作为企业 AGI 独立解决实际业务问题的能力,人们可能会认为这种对话不值得。如果 AGI 说谎、犯错和忘记,它能起到什么作用?从这个角度来看,GPT-4 只是比 GPT-3 更好的工具。

将您的注意力从模型转移到解决方案

遗憾的是,讨论常常在这里停滞不前。大多数追踪 OpenAI 进展的人都认为我们正在逐渐接近 AGI,但首先必须克服它的重大局限性。
布贝克在他的演讲中驳斥了这一假设。
通常,GPT-4 的功能是单独检查的,这是意料之中的,因为研究人员优先考虑发现突破性的智能模型。然而,企业——可能还有你——只关心使用企业 AGI 构建解决方案。正如我们将很快讨论的那样,尽管 GPT-4 存在缺点,但它可以启用企业 AGI,主要是因为它将利用其他工具来克服这些缺点

你的 CEO 不明白的事:GPT-4 是第一个推理模型

许多业务专业人士将 GPT-4 简单地视为一种工具,而大多数数据科学家和机器学习工程师认为它是执行传统 NLP 任务(例如信息提取、对话或摘要)的更有效解决方案。这就像将 IBM PC 视为一个较小的大型机。尽管这些观点有一定的道理,但它们严重低估了技术的变革潜力,并最终错过了大局。
GPT-4是世界上第一个推理模型。
推理模型可以以模仿人类推理能力的方式分析和解释数据。它掌握上下文,形成推论,解决复杂问题,并根据可用信息做出决策。
推理模型是一个出色的工具吗?绝对地。但真正挖掘 GPT-4 潜力的方法是将其部署为代理——一个能够自主执行任务的软件实体。
具有推理能力的代理人可以充当为您的业务流程提供动力的聪明大脑。我们所需要的只是一个解决 GPT-4 缺点的策略,以及一个以 GPT-4 作为代理来构建 AGI 系统的框架。
解决方案是LangChain

LangChain:使用 LLM 代理构建企业 AGI 系统的框架

顾名思义,LangChain 是一个旨在创建互连语言模型系统的平台。它不是像 GPT-4 这样的突破性创新,而是一个六个月大的开源软件项目,最近转型为一家由Benchmark Capital 支持的公司。LangChain 的强大之处在于通过两个基本功能为开发早期企业 AGI 系统提供了一个简单的框架:
  • 使用 GPT-4 等 LLM 作为代理来制作应用程序。
  • 将工具与 LLM 集成以增强他们的能力并解决限制。
现在,让我们更深入地研究这个问题。
notion image
LangChain 充当连接无数工具的粘合剂,这些工具由代理人协调和分配。虽然这种设计理念并不是特别独特——软件工程师几十年来一直在构建类似的系统——但它的不同之处在于使用 GPT-4 作为代理。GPT-4 可以自主行动,具有推理、做出复杂决策和委派任务的能力。
此外,LangChain 还提供了克服 GPT-4 局限性的工具。
notion image
尽管我冒着强调这一点的风险,但 GPT-4 限制的含义经常被误解。克服这些限制可能具有挑战性,但它们远非无法克服的障碍。没有必要在等待更高级的模型时推迟我们对企业 AGI 的追求。
此外,在评估 GPT-4 的局限性时,并没有明确说明“参与物理世界”的局限性,因为它很明显:GPT-4 无法煮一壶新咖啡并为您的同事倒一杯。但它可以让人类执行此类操作。
我真的不喜欢将自己——或任何人——视为由计算机执行任务的工具。我只是准确描述了LangChain README中概述的我们的角色。
notion image
LangChain API 版本 0.0.146
这种特征没有任何险恶之处,尤其是当计算机正在处理繁琐的工作并将最吸引人的部分留给人类时。更有可能的是,它会发出诸如“嘿乔,你能清理一下过道 5 上的溢出物吗?”之类的命令。” 至少在 Roomba 与 LangChain 的 API 集成之前会如此。

一切都变了。

我回顾了过去 50 年的 IT 历史,以帮助您理解为什么现在如此独特。我们不仅仅是在发展 Prolego 在过去六年中开发的狭义人工智能解决方案,我们也不仅仅是通过新工具提高我们的效率。我们正在进入一个新的计算时代,它重新定义了人类在企业 IT 系统中所扮演的独特角色;我们将不再是唯一的决策者。
花点时间考虑一下您公司中的任何业务流程,并问问自己有多少是以人类推理为中心的。以下是一些供您考虑的内容:
  • 根据客户数据推荐产品
  • 自动路由客户请求
  • 审查信贷或贷款申请
  • 生成发票
  • 处理付款和付款对账
  • 优化供应链路线和库存管理
  • 收集和分析客户反馈
  • 收入和销售预测
  • 安排和发布社交媒体内容
  • 使用 AI 和规则引擎进行合规性监控
  • 预算跟踪和差异分析
  • 基于行为数据的客户细分
  • 通过自动报告进行绩效评估
  • 通过预测分析提供决策支持
  • 使用物联网设备和传感器进行工作场所安全监控
虽然您可能有许多复杂的软件应用程序来自动执行这些过程并且看似自主工作,但它们真的是独立运行的吗?他们的主要目标是增强人类推理和协作,因为它们都是由人创建和维护的。不要忘记 GPT-4 可以立即生成软件脚本来执行直接的数据处理任务,正如 Bubeck 所展示的那样。
我可以重新设想,至少目前在理论上,使用前面提到的 LangChain 和 GPT-4 框架的每一个流程,我计划将我余下的职业生涯都投入到这样做。每个流程、工作和系统都假定人类推理是其运作的核心。基于 LangChain 和 GPT-4 的系统已经准备好接管这个推理功能。
该系统标志着企业 AGI 的开始,正如我们稍后将讨论的那样,它的到来速度比您的任何同事想象的都要快。

第三部分:2023 年及以后的企业 AGI 之路

到现在为止,您应该理解为什么企业 AGI 是不可避免的。在第 3 部分中,我将阐明它为何近在咫尺,以及它将如何发生。

人类顾问挑战

在过去的几周里,我一直在测试基于 LangChain 构建的流行开源应用程序。到目前为止,我还没有遇到一个可以为我们的客户转化为企业解决方案的例子。
大多数团队都在使用 LLM 开发完全自主的应用程序,例如babyAGIAuto-GPT虽然这些项目很吸引人,但智能体经常会在与复杂任务的目标不一致的随机方向上迷失方向。GPT-4 的推理仍然太有限,我怀疑任何公司都会在黑客马拉松之外追求它们。
notion image
我们需要一种方法让人类充当 LLM 代理的顾问或指南。尽管 GPT-4 智能体可以提供建议,但如果没有人为干预,它还不能做出决定来引导它达到预期的结果。该指导必须被记录、存储在内存中,并被 GPT-4 推理代理用来学习并在未来遇到类似情况时做出改进的决策。
该解决方案必须使用 LangChain 的记忆工具(例如,嵌入)来提供清晰的人工建议,而无需重新训练模型。尽管边缘或复杂案例可能需要定制,但如果我们必须为每个决策重新训练和支持模型,我们就不会走上企业 AGI 的轨道。这种方法太昂贵了。
我将人类顾问视为启动企业 AGI 的重要工具。人在环中使我们能够开始自动化最简单、重复的任务并稳步加强工作流程。

示例:复杂且模糊的分析任务

假设您想创建一个应用程序,通过分析公司的 SEC 10-Q 文件、包含数百个数据点的详细财务报告来比较公司从第一季度到第二季度的进展。GPT-4 可以执行跨信息提取和推理等特定任务,但它无法协调这些任务以达到预期的结果,尤其是当“比较公司的进展”任务不明确时。
但是,如果人类可以建议和指导 GPT-4 代理,则不需要明确定义任务。人类可以将代理引导至 10-Q 的相关部分,并评估其见解是否有用。GPT-4 代理可以将此建议存储在内存中(在此类系统中通常称为“策略”)并在以后引用它。
[TODO:概述代理启动流程和调用工具的分步工作流程]
人们可能想知道随着代理人每天问的问题越来越少,人类顾问在多大程度上继续合作。让我们在结语中重新讨论这个问题。

应该很快就会有解决方案

有可能某个团队已经解决了这个问题,只是我还没有找到。如果是这样,我希望你指出它,以便我可以对其进行评估。Prolego 团队也一直在进行实验以克服这一挑战。如果还没有解决方案,我希望我们或其他团队能在几个月内开发出一个解决方案。

2023 年:初始 AGI 系统发布

一旦团队发布了一个开源项目,展示了人类顾问挑战的解决方案,选定的公司将启动概念验证 (POC)。由于 POC 可以在可自由支配的预算支出内完成,我预计它们将于 2023 年底开始。在精心设计的 POC 中,LLM 将充当代理人,在人工顾问的协助下完成一项简单、可重复的任务。前面总结 SEC 文件之间差异的例子就是一个合适的例子。
这些 POC 的一个子集将显示出足够的潜力,公司将加快将它们投入生产。毫无疑问,会有很多炒作,首席执行官们会在财报电话会议上提到它们。虽然实际的业务影响可以忽略不计,但它将为实际工作的开始奠定基础。

2024 年:AGI 上线的真正工作开始

在发布最初的 AGI 应用程序后不久,现实就会到来。与 ChatGPT 交互轻而易举。然而,创建解决真正业务问题的企业解决方案要困难得多。Chip Huyen 概括了为生产构建 LLM 应用程序的许多挑战
考虑一下被大肆宣传的提示工程主题,这是一个奇特的术语,用于改变您询问 GPT-4 问题的方式,以便以正确的格式获得所需的结果。ChatGPT 中的提示工程很容易 — 只需不断提出不同的问题,直到获得所需的结果。但是构建具有如此模棱两可和不一致结果的企业应用程序要困难得多。
目前,我们缺乏设计和扩展生产就绪 AGI 系统所需的工具和技术。虽然我们无疑会取得快速进步,但应用程序开发仍然需要时间。GPT-4 也不会神奇地请求政策豁免、招募团队和确保预算分配。可能要过一两年,我们才能见证 AGI 在企业领域产生重大影响。
尽管如此,有几股力量将加快这一进程。

AGI 的突破将加速

随着每个熟练的团队都进入 AGI 竞赛,GPT-4 很快就会过时。信不信由你,GPT-4 甚至不是最好的模型!GPT-4 的早期迭代拥有卓越的推理能力,但 OpenAI 通过实施安全措施的过程使其变得更加笨拙。当然,这是 OpenAI 负责任的举动,但它也凸显了模型还有改进空间的事实。无论如何,苹果、亚马逊、谷歌、Salesforce、Facebook 和英特尔将不惜重金开发和发布 OpenAI 模型的开源竞争对手,只是为了防止微软垄断市场。数十家初创公司,如 LangChain,将推出工具来协助开发人员。

首席执行官将因媒体报道而被迫改变

消费者应用程序有望超越企业应用程序,而 AGI 将成为热门话题。变化将以如此之快的速度发生,以至于我们的机构将无法跟上。GPT-4 或 Sam Altman 将被评为 2023 年时代周刊年度人物。AGI 恐惧将成为 2024 年美国总统大选的主题,任何一方都无法在这种转变中制定出连贯的政策。在这种背景下,每个董事会都会问他们的 CEO,“你对 AGI 做了什么?” 那些没有得到满意答复的人可能会发现自己参加了最后一次董事会会议。

预算将转移到 AGI 项目

CIO 将负责审查每个 IT 预算项目,取消任何不符合 AGI 的项目。具体来说,主要功能是为人类决策组织和处理信息的系统的新开发工作将停止。管理人员也将被拒绝批准通过正常减员过程回补入门级知识工作者职位。相反,资金将流向 AGI 项目。与我交谈过的大多数技术专家都对预算转向投机项目持怀疑态度。但是,我知道有几家大公司已经在这样做了。

第四部分:我可能哪里错了,为什么这无关紧要

以下是对我的大胆主张持怀疑态度的两个原因:
  • 和所有的企业家一样,我对未来往往过于乐观,把所有的障碍都看作是要解决的问题。
  • 作为构建企业 AI 系统的公司 Prolego 的创始人,我自然对我们的前景感到兴奋,因此某种程度的动机推理是不可避免的。
尽管我根据 GPT-4 的性能误认为企业 AGI 的到来似乎不太可能,但我的时间可能会推迟一两年。这里有一些潜在的原因,我欢迎其他人。

法学硕士代理人可能是烦人的害虫

我可能低估了解决人类顾问问题的挑战。如果不求助于特定任务的模型再训练,GPT-4 可能不擅长寻求建议或制定政策。在这种情况下,LLM 代理可能会不断向人类顾问询问不相关的问题,直到人类忽略它为止。这种情况类似于发布具有如此多误报的预测模型,以至于用户认为这是无益的麻烦。

生产化挑战可能会破坏投资回报率

狭义的 AI 解决方案没有得到更广泛采用的原因之一是构建、部署和支持它们所涉及的困难和费用。投资仅在有限数量的用例中是合理的。可能这些工具和方法还需要几年的开发才能适用于广泛的应用程序。

AGI 可能会出现更大的突破

我也可能低估了我们创建优秀 LLM 的速度。一家公司可以推出一种比 GPT-4 具有更好推理能力的模型,从而引发更多暂停 AI 开发的要求虽然我怀疑这些努力是否会成功,但它们可能会延迟企业 AGI 的推出。

第五部分:你可以做些什么来准备

[TODO:扩展和修改本节]
我知道这个话题会让人感到不知所措,甚至令人恐惧。它可能看起来像死亡或税收一样不可避免。如果我造成了任何焦虑,我深表歉意。实际上,对于许多人来说,这一刻提供了一个决定职业生涯的机会,您今天可以采取一些简单、低风险的步骤,例如开始学习和评估您的职业前景。
下面是一些管理这种变化的建议,而不用紧跟每一个新的开发或应用程序。

从我这里获取更新

万一你没弄清楚,我对这个话题相当着迷。如果你喜欢这篇文章,你可以订阅我的免费更新

了解 GPT-4

注册 GPT+ 订阅并开始使用 GPT-4。观看Bubeck 的演讲浏览论文为自己配备知识以应对即将到来的信息洪流,并辨别那些有议程的人(包括我)的偏见。

把握 GPT-4 和 LangChain 的潜力

仔细阅读我在第二部分中的分析,考虑其中的含义,并检查LangChain 文档如果可能,探索一个基于此技术的开源项目,例如Auto-GPT

专注于重要的事情,不要关注每一个新的发展

炒作周期将很快加剧,每个人都在讨论最新的模型/框架/应用程序/用例/工具。其中大部分将变得过时。目前,我正在跟踪两项活动:
  1. 鉴于许多政策禁止与 OpenAI 的 API 共享数据,客户可以在其环境中部署和自定义 GPT-4 的开源替代方案。我预计创新将超过政策变化。
  1. 第三部分中讨论的人类顾问问题的解决方案。

客观评估你的职业生涯

不要恐慌或仓促做出判断。你不会立即被神奇的 AI 取代。虽然过渡即将开始,但企业 AGI 不会像 COVID-19 那样迅速席卷整个社会。
尽管如此,还是开始计划吧。反思您的工作对业务流程的依赖,这些业务流程将通过企业 AGI 进行改进。评估你的现状,考虑你的专业知识以及你的工作是否专注于增强人类推理。
会有多少变化?你的工作、部门、产品或公司还会存在吗?撇开时间不谈,预测太具有挑战性。简单地接受潜在的结果。

与领导和同事互动

你为某人工作:股东、董事会、副总裁、经理或客户。就这些发展和贵公司的回应发起对话。
如果您向 CEO 报告,请采取行动,为他们的下一次董事会会议准备谈话要点。他们可能不会要求它,但你会准备好。
让你周围的每个人都参与进来,并确定你的团队是否能生存下来。如果您的公司阻止 OpenAI 访问,请不要惊慌;这是对潜在颠覆性技术的初步反应,这是可以理解的。评估他们是否会足够快地适应。

开始将自己定位为赢家

理想情况下,您将与领导层和同事合作,为这一转变奠定基础。如果您的部门面临过时,请领导重新设计过程。您可以为未来更新产品路线图。
然而,如果你缺乏改变工作职能的能力,或者属于一个不太可能在这种转变中茁壮成长的团队,那么在无数其他人得出相同结论之前探索替代方案。

结语:加倍同情

我最近在一个美丽的春日带着我的狗漫步在佐治亚州萨凡纳市中心。在成群结队的欢快游客、一场户外婚礼和一位用萨克斯管演奏星球大战主题曲的街头艺人的包围下,我发现自己在这些令人愉快的人们无忧无虑的欢乐中思考着他们的未来。我与几位同事分享了这篇文章的草稿,许多人报告了同样的经历。一旦他们掌握了即将发生的事情,就好像面纱被揭开了,他们对其他人产生了深深的同理心。
许多人都尝试过 ChatGPT,但尚未完全了解即将发生的变化的幅度和速度。他们不知道的是,人类正在开发的技术将很快取代许多工作职能。虽然有些工作会变得更有趣,但其他工作会消失。新的会出现。对于许多人来说,这种巨大的社会转变将是难以置信的挑战。通过阅读这篇文章,您属于少数可能表现最好的人。
一旦我们度过了 AGI 过渡的初始阶段,我实际上对我们的未来非常乐观。正如我的朋友蒂格霍普金斯最近告诉我的那样,最不可能被取代的工作是那些依赖同理心和同情心的工作。我们仍然希望被其他人“看到”,随着机器做更多机器擅长的事情,人类可能会有更多的认知能力来投入同理心。在许多情况下,即使机器效率更高,我们也希望与人互动。25 年前,加里·卡斯帕罗夫 (Gary Kasparov) 在输给深蓝 (Deep Blue) 后预言了国际象棋的终结。然而,今天国际象棋比以往任何时候都更受欢迎。
我关心的不是长期,而是过渡。即使是那些最有能力在这种变化中茁壮成长的人也会感到紧张,我们需要开始倾听人们的恐惧。他们会怎样?他们能像你我一样尽快适应这些变化吗?我不知道。但我知道很少有人为此做好准备。
您和我必须准备好以理解和同情心共同驾驭这些变化,承认未来的挑战。我希望我们能做到。

致谢

特别感谢那些给我早期草稿反馈的人:Russ RandsTeague HopkinsCraig DewaltGuy SivanTod NewmanPatrick SmithJacques MathieuChiara CokiengKevin YamJacob ZaxYlan Kazi ……
最后,我想感谢 GPT-4 的作用。感谢您帮助进行基本的文案编辑和总结。虽然你的写作风格真的很无聊,但你至少在被问到时模仿了我的风格。目前,你仍然是我的工具。

附录

来自 Sparks of Artificial General Intelligence 的 GPT-4 示例:GPT-4 的早期实验
notion image

作者:Kevin Dewalt,联合创始人兼首席执行官Prolego
 

评论