ChatGPT 的工作原理：模型是什么？

terry 3年前 (2023-09-23) 阅读数 218 #AI人工智能

假设您想知道（就像 15 世纪末的伽利略一样）从比萨斜塔每一层投下的炮弹需要多长时间才能落地。无论如何，您都可以对其进行测量并将结果处理到表格中。或者你可以做理论科学的本质：建立一个模型，提供某种计算答案的程序，而不仅仅是测量和记住每个案例。

让我们想象一下，我们有（有点理想化的）关于炮弹从不同楼层落下需要多长时间的数据。

我们如何计算从没有明确数据的地板上跌落需要多长时间？在这种特殊情况下，我们可以使用已知的物理定律进行计算。但是，如果我们得到的只是数据，而我们不知道管辖它的基本法则怎么办？然后我们可以进行数学猜测，例如，也许我们应该使用直线作为模型。

我们可以选择不同的直线。但这是平均最接近我们报告的数据的数据。根据这条直线，我们可以估计任何楼层的下降时间。

我们怎么知道我们应该在这里尝试一条直线？我们在某种程度上不知道。这只是数学上简单的东西，我们已经习惯了这样一个事实：我们测量的许多数据非常适合数学上简单的东西。我们可以尝试一些数学上更复杂的东西 - 比如 a + bx + cx2，在这种情况下我们会做得更好：

但是，事情可能会变得非常错误。例如，以下是我们可以使用 + b/c + x sin(x) 最大程度地完成的操作：

值得理解的是，永远不存在“没有模型的模型”。无论您使用什么模型，都有一些特定的基本结构，然后是一组“您可以转动的旋钮”（即您可以调整的参数）以使其适合您的数据。就 ChatGPT 而言，有很多这样的“旋钮”在使用中——实际上有 1750 亿个。

但值得注意的是，ChatGPT 的基本结构——“仅仅”有这么多参数——足以创建一个模型，计算下一个单词“足够好”以获得合理文章长度的概率。文本。

本文仅代表作者观点，不代表Code前端网立场。
本文系作者Code前端网发表，如需转载，请注明页面地址。

Microsoft TypeScript 开发人员解释为什么他们选择 Go 而不是 Rust、C#

微软的 Anders Hejlsberg 解释说，选择 Go 作为其 TypeScript 编译器端口是因为它的原生代码...

TypeScript

1年前 (2025-04-14) 556阅读 #AI人工智能
人工智能时代投资软技能的重要性

我会摆好我的摊位，让你知道我仍然是人工智能怀疑论者。哎呀，我很多时候仍然在谈论“人工智能”时用引号括起来。然...

人工智能

1年前 (2025-01-14) 760阅读 #AI人工智能
4GB/8GB/16GB RAM 足够用于 Windows 11 吗？

Windows 11 使用多少 RAM？4GB、8GB 或 16GB RAM 对于 Windows 11 来说足够吗？M...

Windows 11

2年前 (2024-01-26) 956阅读 #AI人工智能
谷歌的新人工智能搜索功能正在改变移动用户（包括iOS）的游戏规则

想用谷歌搜索一些东西吗？只需拍照即可获得人工智能生成的响应。谷歌正试图利用其在搜索引擎领域的主导地位在人工智能（AI）竞...

人工智能搜索

2年前 (2024-01-24) 950阅读 #AI人工智能
这个人工智能只需看几张照片就能找到你的位置

安全的社交媒体做法包括不发布展示个人信息（例如车牌号、街道名称或门牌号）的照片。但如果我告诉你，生成式人工智...

Google

2年前 (2024-01-22) 948阅读 #AI人工智能