理解并使用ChatGPT

3/31/25About 4 min

这篇内容的生成方式是我和AI共创的，我产出内容, AI 负责将内容进行结构化以及语句润色，这种做法挺能提升写作效率的。不过有一些内容在 AI 化的时候丢失了，我重新进行了补全。之前我还说不会用 AI 写作，没想到打脸来的这么快。不过我想要嘴硬的说一句，在我产出内容的已经有自己的思考了，只是觉得整理文章这个步骤有点繁琐，所以交给AI处理。进入正题吧。

ChatGPT 使用感悟作为一个已经使用 ChatGPT 很久的用户，我一直没有系统地了解过它的运作原理。最近观看了 Andrej Karpathy 讲解的 How I Use LLMs 视频后，我有了一些新的收获，特此记录下来。

ChatGPT 的基本工作原理ChatGPT 在与用户对话时，本质上是人与 AI 共同在一个 Token 流中写入 Token。用户输入后，ChatGPT 会基于当前 Token 流继续生成新的 Token，最终形成一段对话内容。

需要注意的是，这个 Token 流不仅包括用户的输入，还包含一些系统自动加入的格式信息。这些并不会直接影响用户体验，但理解这个过程有助于更好地掌控 ChatGPT 的对话。

此外，ChatGPT 维护的这个 Token 流类似于一个“工作内存”或“令牌窗口”，决定了模型能够“记住”的信息范围。一旦超出这个窗口的长度，早前的内容就会被遗忘。因此，模型的能力与其支持的 Token 窗口大小直接相关。

ChatGPT 的知识来源与局限ChatGPT 的回答主要基于预训练时输入的文档，因此它的知识有一定的截止时间。换句话说，它无法准确回答最近发生的事件，除非使用联网功能。此外，被训练文档中提及较多的信息，ChatGPT 记忆会更清晰，而较冷门的信息则容易被忽略或产生“幻觉”。

提高 ChatGPT 使用体验的几个技巧结合上述原理，归纳出以下几点 ChatGPT 的最佳使用实践：

避免询问最近发生的事情，除非使用联网功能，否则 ChatGPT 并不擅长实时信息。避免询问过于冷门的知识，否则可能会得到错误或幻觉的答案。新话题开启新对话窗口，因为：旧话题的内容会影响 ChatGPT 未来的输出。过长的 Token 流（即工作记忆）会降低模型的响应效率。ChatGPT 的多种应用场景除了常规聊天，ChatGPT 在多个工作场景下都能发挥作用：

跨模型使用：不同 AI 模型（如 ChatGPT、Gemini、Grok 等）在回答同一问题时可能会有不同的表现，切换模型可以获得更多维度的答案。论文阅读助手：上传 PDF 论文，让 ChatGPT 进行摘要提取和重点解析，提高阅读效率。截图书籍阅读辅助：将部分文章内容贴给 ChatGPT，让其总结关键点，降低理解门槛。例如，在阅读基督山伯爵时，我直接截图扔给ChatGPT，让它帮忙解释其中涉及的历史背景或人物别称。代码和技术辅助：ChatGPT 可以将应用内的网络请求日志转换为 cURL 命令，或者自动生成 Python 代码完成时间戳转换。OCR 识别：截图上传至 ChatGPT，让它进行 OCR 识别并提取文字信息。我在想OCR相关的软件是不是就此退出历史舞台了？复杂内容解析：对于 PDF 书籍中的复杂内容，有的PDF格式文件不支持选中文字，干脆直接截图发给 ChatGPT 让它解释，可以快速理解难点。AI驱动工作生活已经是客观事实了，掌握相关工具不是可选而是必须。