如何选择趁手的兵器(大模型和配套的工具)

J.sky
VOICE 「口述·语音转文字,AI负责修正」
7 分钟阅读

就像老莫写的《与 AI 如何保持”社交安全距离”?》文中所说:每隔一段时间,我就会把 AI 的话题拿出来重新聊聊。

什么是大模型?

大模型(Large Language Model,简称 LLM)是 AI 的一种,简单说就是”能理解文字、也能生成文字的 AI”。 它通过学习海量文本,掌握了语言中的规律和知识,所以你可以跟它对话、让它写文章、改代码、翻译、总结等等。 现在大家说的”AI”,基本指的就是大模型。它就像一个读过很多书、什么都知道一点的”万能助手”,但它并不”真正理解”——只是在概率上把最合适的字接上去。 所以一句话总结:大模型是 AI 的一种,是当前最主流的 AI 形态。

如何选择

人们对大模型的认识应该是在 2022 年底 ChatGPT 的发布吧。OpenAI 的 ChatGPT 着实让大模型在整个世界的面前惊艳了一把!而国人对大模型的认识应该是在 2025 年的春节前后,DeepSeek 发布了它的最新版本 DeepSeek-R1,这是一个带有推理类型的大模型的版本,当时着实在国内火了一把,甚至连 DeepSeek 的官方网站一度都处于瘫痪状态,无法打开。那个时候使用大模型还处在仅限于聊天对话的阶段,但是对于人类来说,这也算是一个很重要的突破了。

2025 年很远吗?这才是去年的事情。再看看现在的大模型都能干什么?可以说,目前我们使用电脑操作的事情,大模型基本上都可以代替人来完成了,例如文档、图片生成,以及视频生成、PPT、语音生成等等。

我小标题写的是”如何选择”,这个选择的意思是我们要如何选择使用哪个大模型,而不是选择使用或是不使用大模型,我并不反对那些坚持抵制 AI 和大模型的小众群体。每个人都有自己的想法。大模型对于我来说,它只是一个工具而已。任何人都有选择使用和不使用它的权利。

陈真:技击的目标是讲究击倒对方。 船越文夫:你完全错了,年轻人,我告诉你,击倒对方最好的方法就是用手枪。练武的目的是将人的体能推高至极限,如果你想达到这种境界,就必须要了解宇宙苍生。

—— 《精武英雄》(1994),陈真与船越文夫对白。

我引用这段对白,是想讲讲大模型在我们生活里的位置。 如果把写作和编码比作陈真说的”技击”——那我们努力学写作、学编码,初衷就是为了写出更好的文章、做出更有用的工具。 但船越文夫如果活在今天,他一定会这样反驳:年轻人,你错了。写出更好的文章和代码,靠的就是大模型;你平时那些下功夫的学习,不过是为了把自己逼到能力的极限——只有到了那个程度,你才更有可能悟出写作和编码的本质与最高境界。

关于要不要使用大模型,每个人都有自己的见解。不过我想说,你的见解远远比不上大模型发展的速度。2026 年应该是 AI 智能体的元年吧。依托大模型,AI 智能体得到了迅猛的发展,从年初的 OpenClaw、Hermes Agent 等开源项目的火热程度来看,大模型+智能体这个领域已经成为当下 AI 领域中最受瞩目的方向之一。你还在研究用或是不用、用哪个的时候,那些开源项目已经迭代了好几个版本。曾经有句话说道,关于 AI 智能体大模型的学习,你几天没有关注这些开源软件和大模型的信息,和几个月没有关注是一样的,因为它们的更新和发展实在是太快了。

那么绕了半天,我也没说到底如何选择。其实很简单。我告诉你一个非常简单的选择方法,无论是大模型还是与之配套的工具,选择的方式就是国外的大于国内的,付费的大于免费的。你只要遵循这个原则,就会节省大量的时间成本。我并不是说免费的、开源的不能用,只是那些免费的、开源的,你得付出一些其他的成本,例如时间。

如何组合?

经常使用智能体的朋友可能会觉得在大模型的选择和工具的选择上很是费时间,因为你需要把它们组合到一起进行试用和调试,需要用一段时间之后你才能了解这个大模型和当前的工具组合到一起是否适合自己。对于当下的大模型和工具来说,它们的搭配组合已经有很多文章介绍过了,这里我就不再赘述了。

对于智能体,我觉得你一定要根据自己的使用场景来选择,而不是盲目的跟风。之前有一段时间 OpenClaw 非常火,搞得大家都要去试一试,现在为什么没有人提了?因为一部分人不再使用了,另一部分人可能是换了 Hermes Agent。这些工具当你使用一段时间之后,你就会发现它们并不一定适合你。比如说你想写文章,那么你直接使用 ChatGPT 或者是一些其他的在线的大模型,你把你要写的内容大纲发给它,几乎就可以完成任务了。如果你需要编写代码,那么你使用一些专业的编码工具,然后配合大模型就可以,而且在性能上要强于 OpenClaw。因为专业编码工具的运行方式和 OpenClaw 不一样,每一次发送给它们的命令,它们的执行方式也不一样,相对来说专业的编码工具,要比 OpenClaw 那种龙虾的智能体。性能和效率要更强一些。所以有的时候你在选择使用大模型和工具的时候,一定要考虑到自己的应用场景,不必强求使用某一种智能体软件。

另外,大家最常讨论的就是哪个大模型最强。当然,从舆论上来说,国外的普遍的要比国内的好。但是国内的就不能用了吗?国内的也可以。怎么说呢?一件兵器到手之后,我们的目的是什么?所以我们要在实际中使用它,来磨合,来了解它。我总结就是大模型普遍都是智障,无论是难题还是简单的计算,它们都会有出错的地方。所以我们的目标是要发挥它们的长处。大模型在处理很小的需求的时候非常快,而且非常准确。但是如果你给它一个非常笼统、非常巨大的需求,那么它的推理和分析就会非常慢,而且结果也会与你想的非常远,因为你给它提供的细节越少,它做出来的产品就会离需求越远。所以有的时候并不是大模型不行,而是你的需求不行,是你的需求没有拆得更细一些,你把需求拆分成更多的小需求,扔给大模型,或许你会发现,这些大模型在处理这些小问题的时候,几乎都差不多。

对于每个大模型都会有人在骂,也会有人说好。这个怎么说呢?每个人的使用方式和使用习惯不一样。这又让我想起了以前玩游戏的时候,有一句话是这么说的,没有最强的职业,只有最强的玩家。也就是说,在相同的工具面前,最终影响结果的还是使用工具的人。所以,我们在使用大模型、使用智能体的同时,也不要忘记提升自己的原力,只有自己强了,使用趁手的兵器之后才会更强,并不是因为使用工具而变得更强。