DeepMind 的专家写了一篇 8 万字的文章介绍自己如何使用 AI

我认为“AI”模型（我的意思是：大型语言模型）并没有被过度炒作。
诚然，任何新技术都会吸引骗子。许多公司喜欢说他们“使用 AI”，就像之前说他们由“区块链”驱动一样，这肯定是真的。（正如我们一次又一次看到的那样。）我们可能处于泡沫之中，这也是事实。互联网在 2000 年曾是一个破裂的泡沫，但我们现在拥有的互联网应用程序以前是纯科幻小说里的东西。
但我认为我们最近取得的进展不仅仅是炒作的原因是，在过去的一年里，我每周至少花几个小时与各种大型语言模型互动，并一直对它们解决我交给它们的日益困难的任务的能力印象深刻。因此，我可以说，由于这些模型，我为研究项目和副项目编写代码的速度至少快了 50%。
我在网上发现的大多数谈论大型语言模型效用的人要么极度乐观，声称所有工作将在三年内实现自动化，要么极度悲观，说它们没有贡献，永远也不会有。
所以在这篇文章中，我只是想尝试让对话接地气。我不会对未来的情况进行任何争论。我只是想提供一份我（一位研究机器学习的程序员和研究科学家）与不同的大型语言模型进行的 50 次对话的清单，以切实提高我的研究能力，并帮助我从事随机编码的副项目。其中包括：
使用我以前从未使用过的技术构建整个网络应用程序。
教我如何使用以前从未使用过的各种框架。
将数十个程序转换为 C 或 Rust 以提高 10 – 100 倍的性能。
大幅精简大型代码库以显著简化项目。
为我去年写的几乎每一篇研究论文编写初始实验代码。
自动化几乎每一个单调的任务或一次性脚本。
几乎完全取代网络搜索来帮助我设置和配置新的软件包或项目。
大约 50%取代网络搜索来帮助我调试错误消息。
如果我要将这些例子分为两大类，它们将是“帮助我学习”和“自动化枯燥任务”。帮助我学习显然很重要，因为这意味着我现在可以做以前觉得有挑战性的事情；但对我来说，自动化枯燥任务实际上同样重要，因为它让我专注于我最擅长的事情，并解决难题。
最重要的是，这些例子是我使用大型语言模型帮助自己的真实方式。它们不是为了展示一些令人印象深刻的能力；它们来自于我完成实际工作的需求。这意味着这些例子并不迷人，但我每天做的大部分工作也不是，而如今我可用的大型语言模型让我几乎自动化了所有这些工作。
在这篇文章中，我的希望实际上是用一个又一个例子让您感到疲惫，说明我在过去一年中如何具体使用大型语言模型来提高我的生产力。要知道，在您看够了我提供的例子之后，我只向您展示了我使用大型语言模型帮助自己的不到 2%的情况。
所以当您感到疲惫时——您肯定会——请随意使用左边新的导航菜单跳过，这是我（读作：一个大型语言模型）专门为这篇文章新写的，因为它太长了。

细微差别
如果互联网在某方面做得不好，那就是细微差别。我不会声称当今的大型语言模型将接管世界。我不会谈论未来的模型可能或不可能做什么。我只会讨论当今的模型对我是否有帮助。
您可能会想——为什么有人会写一整篇文章来证明语言模型是有用的？！这不是显而易见的吗？！但似乎有一大批人——在学术文献中，在软件工程领域，以及在媒体领域——广泛宣称大型语言模型毫无贡献，只是另一个炒作周期，几年后将毫无影响地消亡。我将论证这些人是错误的，因为当前的大型语言模型已经有用。

……

原文：

https://nicholas.carlini.com/writing/2024/how-i-use-ai.html

本文地址：https://www.163264.com/9044

DeepMind 的专家写了一篇 8 万字的文章介绍自己如何使用 AI

相关推荐