DeepMind 的专家写了一篇 8 万字的文章介绍自己如何使用 AI

我认为“AI”模型(我的意思是:大型语言模型)并没有被过度炒作。
诚然,任何新技术都会吸引骗子。许多公司喜欢说他们“使用 AI”,就像之前说他们由“区块链”驱动一样,这肯定是真的。(正如我们一次又一次看到的那样。)我们可能处于泡沫之中,这也是事实。互联网在 2000 年曾是一个破裂的泡沫,但我们现在拥有的互联网应用程序以前是纯科幻小说里的东西。
但我认为我们最近取得的进展不仅仅是炒作的原因是,在过去的一年里,我每周至少花几个小时与各种大型语言模型互动,并一直对它们解决我交给它们的日益困难的任务的能力印象深刻。因此,我可以说,由于这些模型,我为研究项目和副项目编写代码的速度至少快了 50%。
我在网上发现的大多数谈论大型语言模型效用的人要么极度乐观,声称所有工作将在三年内实现自动化,要么极度悲观,说它们没有贡献,永远也不会有。
所以在这篇文章中,我只是想尝试让对话接地气。我不会对未来的情况进行任何争论。我只是想提供一份我(一位研究机器学习的程序员和研究科学家)与不同的大型语言模型进行的 50 次对话的清单,以切实提高我的研究能力,并帮助我从事随机编码的副项目。其中包括:
使用我以前从未使用过的技术构建整个网络应用程序。
教我如何使用以前从未使用过的各种框架。
将数十个程序转换为 C 或 Rust 以提高 10 – 100 倍的性能。
大幅精简大型代码库以显著简化项目。
为我去年写的几乎每一篇研究论文编写初始实验代码。
自动化几乎每一个单调的任务或一次性脚本。
几乎完全取代网络搜索来帮助我设置和配置新的软件包或项目。
大约 50%取代网络搜索来帮助我调试错误消息。
如果我要将这些例子分为两大类,它们将是“帮助我学习”和“自动化枯燥任务”。帮助我学习显然很重要,因为这意味着我现在可以做以前觉得有挑战性的事情;但对我来说,自动化枯燥任务实际上同样重要,因为它让我专注于我最擅长的事情,并解决难题。
最重要的是,这些例子是我使用大型语言模型帮助自己的真实方式。它们不是为了展示一些令人印象深刻的能力;它们来自于我完成实际工作的需求。这意味着这些例子并不迷人,但我每天做的大部分工作也不是,而如今我可用的大型语言模型让我几乎自动化了所有这些工作。
在这篇文章中,我的希望实际上是用一个又一个例子让您感到疲惫,说明我在过去一年中如何具体使用大型语言模型来提高我的生产力。要知道,在您看够了我提供的例子之后,我只向您展示了我使用大型语言模型帮助自己的不到 2%的情况。
所以当您感到疲惫时——您肯定会——请随意使用左边新的导航菜单跳过,这是我(读作:一个大型语言模型)专门为这篇文章新写的,因为它太长了。

细微差别
如果互联网在某方面做得不好,那就是细微差别。我不会声称当今的大型语言模型将接管世界。我不会谈论未来的模型可能或不可能做什么。我只会讨论当今的模型对我是否有帮助。
您可能会想——为什么有人会写一整篇文章来证明语言模型是有用的?!这不是显而易见的吗?!但似乎有一大批人——在学术文献中,在软件工程领域,以及在媒体领域——广泛宣称大型语言模型毫无贡献,只是另一个炒作周期,几年后将毫无影响地消亡。我将论证这些人是错误的,因为当前的大型语言模型已经有用。

……

原文:

https://nicholas.carlini.com/writing/2024/how-i-use-ai.html

本文地址:https://www.163264.com/9044

(1)
上一篇 2024年8月2日 上午9:04
下一篇 2024年8月7日 上午11:23

相关推荐