我们用于图像识别等任务的典型模型如何工作? 目前最流行、最成功的方法是使用神经网络。 神经网络发明于 20 世纪 40 年代,与今天使用的形式非常接近,可以被认为是大脑工作方式的简单理想化。 人脑中大约有1000亿个神经元(神经细胞),每...
到目前为止,我们一直在讨论“已经知道”如何执行特定任务的神经网络。但神经网络(可能在大脑中也可能)如此有用的原因在于,它们不仅原则上可以执行各种任务,而且还可以逐步“通过示例进行训练”来执行这些任务。 当我们创建一个区分猫和狗的神经网络时...
在过去的十年中,神经网络训练技术取得了许多进步。而且,是的,它通常很漂亮。有时,尤其是当你思考时,你至少可以找到所做的事情的“科学解释”。但大多数内容都是通过反复试验发现的,添加了一些想法和技巧,慢慢积累了有关神经网络使用的重要知识。 有...
神经网络的概念(至少在当前设置中)基本上基于数字。因此,如果我们要将它们用于文本之类的内容,我们需要一种方法来用数字表示文本。 当然,我们可以通过为字典中的每个单词分配一个数字来开始(基本上像 ChatGPT 一样)。然而,有一个重要的想法...
终于准备好讨论 ChatGPT 的底层内容了。是的,它最终是一个巨大的神经网络——目前是所谓的 GPT-3 网络的一个版本,拥有 1750 亿个权重。在很多方面,它与我们讨论过的另一个神经网络非常相似。然而,它是专门为解决语言问题而设计的...
现在我们已经概述了 ChatGPT 建立后的工作情况。但它是如何建立的呢?它的神经网络中的1750亿个权重是如何确定的?基本上,它们是大规模训练的结果,基于人类编写的大量文本(在网络上、书籍中等)。 正如我们所说,即使考虑到所有训练数据,神...
训练 ChatGPT 的很大一部分工作就是向它“展示”大量来自网络、书籍等的现有文本。但事实证明,还有另一个看似重要的部分。 一旦完成了对原始语料库的“原始训练”,ChatGPT 中的神经网络就可以开始生成自己的文本、继续提示等。然而,虽然...
人类语言——以及产生它的思维过程——似乎总是代表着复杂性的顶峰。事实上,人类大脑——“仅”有约 1000 亿个神经元(或许还有 100 万亿个连接)的网络——可能对此负有责任,这一事实似乎有些引人注目。也许你可以想象大脑中不仅仅是神经元网络...
如上所述,在 ChatGPT 中,任何一段文本都由一系列数字有效表示,我们可以将其视为一种“语言特征空间”坐标的要点。 所以当ChatGPT延续一段文本时,就相当于在语言特征空间中追踪一条路径。 但是现在我们可以问是什么让这条路径对应于我们...
如何产生“有意义的人类语言”?过去我们可能认为这不是人脑。但现在我们知道 ChatGPT 神经网络可以做得很好。然而,这可能是我们唯一的选择,对于人类来说,没有什么比这更简单或更容易取得成功的了。 但我主要担心的是,ChatGPT 的成功隐...