理解并使用ChatGPT
这篇内容的生成方式是我和AI共创的,我产出内容, AI 负责将内容进行结构化以及语句润色,这种做法挺能提升写作效率的。不过有一些内容在 AI 化的时候丢失了,我重新进行了补全。之前我还说不会用 AI 写作,没想到打脸来的这么快。不过我想要嘴硬的说一句,在我产出内容的已经有自己的思考了,只是觉得整理文章这个步骤有点繁琐,所以交给AI处理。进入正题吧。
ChatGPT 使用感悟作为一个已经使用 ChatGPT 很久的用户,我一直没有系统地了解过它的运作原理。最近观看了 Andrej Karpathy 讲解的 How I Use LLMs 视频后,我有了一些新的收获,特此记录下来。
ChatGPT 的基本工作原理ChatGPT 在与用户对话时,本质上是人与 AI 共同在一个 Token 流中写入 Token。用户输入后,ChatGPT 会基于当前 Token 流继续生成新的 Token,最终形成一段对话内容。
需要注意的是,这个 Token 流不仅包括用户的输入,还包含一些系统自动加入的格式信息。这些并不会直接影响用户体验,但理解这个过程有助于更好地掌控 ChatGPT 的对话。
此外,ChatGPT 维护的这个 Token 流类似于一个“工作内存”或“令牌窗口”,决定了模型能够“记住”的信息范围。一旦超出这个窗口的长度,早前的内容就会被遗忘。因此,模型的能力与其支持的 Token 窗口大小直接相关。
ChatGPT 的知识来源与局限ChatGPT 的回答主要基于预训练时输入的文档,因此它的知识有一定的截止时间。换句话说,它无法准确回答最近发生的事件,除非使用联网功能。此外,被训练文档中提及较多的信息,ChatGPT 记忆会更清晰,而较冷门的信息则容易被忽略或产生“幻觉”。
提高 ChatGPT 使用体验的几个技巧结合上述原理,归纳出以下几点 ChatGPT 的最佳使用实践:
避免询问最近发生的事情,除非使用联网功能,否则 ChatGPT 并不擅长实时信息。避免询问过于冷门的知识,否则可能会得到错误或幻觉的答案。新话题开启新对话窗口,因为:旧话题的内容会影响 ChatGPT 未来的输出。过长的 Token 流(即工作记忆)会降低模型的响应效率。ChatGPT 的多种应用场景除了常规聊天,ChatGPT 在多个工作场景下都能发挥作用:
跨模型使用:不同 AI 模型(如 ChatGPT、Gemini、Grok 等)在回答同一问题时可能会有不同的表现,切换模型可以获得更多维度的答案。论文阅读助手:上传 PDF 论文,让 ChatGPT 进行摘要提取和重点解析,提高阅读效率。截图书籍阅读辅助:将部分文章内容贴给 ChatGPT,让其总结关键点,降低理解门槛。例如,在阅读 基督山伯爵 时,我直接截图扔给ChatGPT,让它帮忙解释其中涉及的历史背景或人物别称。代码和技术辅助:ChatGPT 可以将应用内的网络请求日志转换为 cURL 命令,或者自动生成 Python 代码完成时间戳转换。OCR 识别:截图上传至 ChatGPT,让它进行 OCR 识别并提取文字信息。我在想OCR相关的软件是不是就此退出历史舞台了?复杂内容解析:对于 PDF 书籍中的复杂内容,有的PDF格式文件不支持选中文字,干脆直接截图发给 ChatGPT 让它解释,可以快速理解难点。AI驱动工作生活已经是客观事实了,掌握相关工具不是可选而是必须。
