教程更新时间:2025年12月2日 | 撰写者:Rainy | 微信号:cntheai
1. ChatGPT简介

| 名称 | ChatGPT | 语言 | 英文、中文、德文、法文、日文等67种语言 |
| 上线时间 | 2022年11月30日 | 最近更新时间 | 2025年8月13日 |
| 开发商 | OpenAI | 网址 | https://chatgpt.com |
ChatGPT(Chat Generative Pre-trained Transformer)是由美国人工智能研究实验室OpenAI研发的一款人工智能聊天机器人程序。它于2022年11月30日正式发布,并在短短两个月内月活跃用户突破1亿,成为历史上增长最快的消费级应用。
ChatGPT的强大建立在“生成式预训练变换模型”(GPT)的架构之上。简单来说,它通过阅读互联网上浩如烟海的文本数据(书籍、文章、代码等),学会了人类语言的语法、逻辑和世界知识。让ChatGPT脱颖而出的关键技术是RLHF(基于人类反馈的强化学习)。在预训练阶段结束后,OpenAI的研究人员引入人类训练师对模型的回答进行打分和修正。这就像老师批改作业一样,教会了AI什么是“有用、诚实且无害”的回答。

ChatGPT不仅具备更强的逻辑推理能力,还支持多模态交互——即不仅能读懂文字,还能看懂图片、听懂语音并进行实时对话。ChatGPT的功能早已超越了简单的问答,它正在重塑各行各业的工作方式:
- 文本创作与处理: 它可以撰写邮件、策划案、诗歌、剧本,甚至可以模仿特定作家的风格。
- 编程与代码调试:它能生成代码片段、解释复杂算法,甚至直接修复代码中的 Bug。
- 教育与学习: 它能通过对话引导学生思考,解释复杂的概念,或辅助语言学习。
- 创意辅助: 从头脑风暴到生成AI绘画的提示词(Prompt),它是激发灵感的利器。
尽管ChatGPT表现惊艳,但它并非完美无缺,还存在以下问题:
- 幻觉问题: 它有时会“一本正经地胡说八道”,捏造事实或引用不存在的文献。
- 知识截止: 虽然能联网搜索,但基础模型的训练数据仍有时间滞后性。
- 伦理与版权: 关于 AI 生成内容的版权归属、训练数据的合法性,以及可能带来的就业替代焦虑,都是目前社会激烈讨论的议题。
ChatGPT不仅仅是一个工具,它代表了人类迈向通用人工智能(AGI)的重要一步。
2. 计划对比
参考官方定价网址:https://chatgpt.com/zh-Hans-CN/pricing/
定价与核心权益对比
| 维度 | Free (免费版) | Plus (个人订阅) | Pro (个人旗舰) | Business (商业协作版) |
| 价格 | $0 /月 | $20 /月 | $200 /月 | $25 /用户/月 (年付) |
| 核心模型 | 推理权限有限(通常为轻量模型) | GPT-5.1 (进行高级推理) | GPT-5.1 Pro (进行专业推理) | GPT-5 (无限) GPT-5 Pro (可访问) |
| 消息限额 | 数量有限 | 上限更高 | 数量无限(受滥用防护约束) | 无限 GPT-5 大量 GPT-5 Thinking |
| Sora 视频 | 无 / 极受限 | Sora 1(有限使用权限) | Sora 1(高级使用权限) | 未明确提及,通常同Plus |
| 编程/智能体 | 无法使用 Codex | Codex 智能体 标准版智能体模式 |
扩展版 Codex 智能体 智能体模式最大支持 |
Codex 访问权限 可在代码库中推理 |
| 深入研究 | 有限使用 | 更多深入研究权限 | 深度研究最大支持 | 企业级知识库整合 |
| 数据隐私 | 默认可能训练 | 默认可能训练 | 默认可能训练 | 绝不训练 (企业级隐私) |
各计划详细解读
⚪ Free (免费)
- 定位: 日常任务的智能解决方案。
- 现状: 功能被严格“阉割”。
- 推理: 虽能用,但“推理使用权限有限”。
- 深入研究 (Deep Research): 仅仅是“有限使用”。
- 图片与速度: 生成受限且速度较慢。
- 局限: 记忆和上下文支持都非常有限,基本只能做简单的问答,无法进行复杂的项目级任务。
⚫ Plus ($20)
- 定位: 更为先进智能使用权限。
- 核心模型: 明确使用GPT-5.1进行高级推理。
- 新增能力:
- Sora 1: 拥有“有限使用Sora 1视频生成功能”。这意味着Plus用户可以尝鲜生成视频,但可能在时长或次数上有卡控。
- Codex智能体: 专门针对编程优化的Agent。
- 深入研究: 拥有比免费版更多的权限。
- 上下文: 记忆与上下文支持更强。
🔴 Pro ($200)
- 定位: 全面使用ChatGPT功能。
- 核心独占:
- GPT-5.1 Pro: 这是Plus没有的。图片描述为“进行专业推理”,暗示其逻辑深度和专业领域(如科研、复杂架构)的能力远超普通版5.1。
- 无限流量: 明确了 “消息和上传数量无限”、“无限制且更快速的图片生成”。
- 高级 Sora 1: 拥有“Sora 1视频生成功能的高级使用权限”(推测为生成时间更长、清晰度更高、无水印等)。
- 最大化支持: 无论是上下文记忆、深度研究还是智能体模式,Pro都是“最大支持”。
🔵 Business ($25/用户/月)
- 定位: 专为初创企业和成长中企业设计。
- 最大的惊喜:
- 模型权限越级: Business版不仅可以 “无限制使用GPT-5”,还可以 “访问GPT-5 pro”。这意味着只需 $25/月,你就能在企业环境中使用Pro级别的模型(虽然可能是在额度或共享池的基础上)。
- GPT-5 Thinking: 可“大量使用GPT-5 Thinking”。
- 企业级功能:
- 企业知识库: 可以连接Slack、Google Drive、GitHub,让 I更懂公司业务。
- 代码库推理: 可以在你的文档和代码库中运行Codex智能体。
- 数据安全: 最重要的一点——“默认情况下不会通过你的企业数据进行任何训练”。
🏢 企业 (Enterprise)
- 定位: 企业级AI、安全与全面支持(需联系销售)。
- 差异化:
- 相比Business版,它有 “扩展版上下文窗口”(支持更长的输入)。
- 支持SCIM、EKM(企业密钥管理)、域验证等高级安全控制。
- 支持数据驻留(指定数据存储在哪个国家/地区)。
购买建议
- 对于个人:
- Plus ($20) 依然是首选。它现在包含了GPT-5.1和Sora 1的基础功能,性价比极高。
- Pro ($200) 的核心卖点在于 “无限” 和 “GPT-5.1 Pro”。只有当你需要每天生成海量内容,或者处理的问题难度连GPT-5.1都搞不定时,才需要上Pro。
- 对于公司/团队:
- Business 版 ($25) 性价比极高:Business 包含GPT-5 Pro的访问权限且支持无限制GPT-5。
- 结合其“数据不训练”的隐私条款和“企业知识库”功能,任何2人以上的团队都应该果断选择 Business 版,而不是让员工各自购买Plus,因为Business版不仅便宜(对比 Pro),功能也在某些方面(如 Pro 模型访问)超越了个人Plus版。
3. 常用模型
目前ChatGPT Plus网页版默认提供GPT-5 Instant、GPT-5 Thinking、GPT-5.1 Instant、GPT-5.1 Thinking、GPT-4o模型,在设置>常规中启用显示其它模型,可以使用GPT-5 Thinking mini、GPT-4.1、o3、o4-mini模型。
GPT-4系列:多模态与长上下文
GPT-4系列模型主要奠定了“看听说”的基础能力和处理超长文本的能力。
GPT-4o
- 发布时间:2024年5月
- 核心定位:全能交互旗舰。
- 特点:
- OpenAI首个“原生多模态”模型,单一模型同时处理文本、音频、图像。
- 优势:极速的语音响应(平均320毫秒)和实时视频分析能力。
- 地位:它是后续所有模型的“感官基础”,赋予了AI“看”和“听”的能力,但在复杂逻辑推理上不如后来的Thinking系列。
GPT-4.1
- 发布时间:2025年4月
- 核心定位:开发者与长文档专家。
- 特点:
- 这是在GPT-5发布前的过渡主力模型,重点解决了GPT-4o在写代码和遵循复杂指令上的短板。
- 巨大升级:支持100万 token的超长上下文窗口(约为2000页文本),是处理整库代码或长篇小说的首选。
- 变体:除了标准版,还推出 GPT-4.1 Mini和GPT-4.1 Nano,主要服务于API开发者。
o系列:复杂问题推理
o系列模型主要解决“慢思考”的问题,让AI学会像人类一样在回答前进行逻辑推演。
o3
- 发布时间:2025年4月(与o4-mini同期大规模开放)
- 核心定位:逻辑推理的天花板(o1的继任者)。
- 特点:
- 极致智力:专攻数学竞赛、高难度科研和算法竞赛。在回答问题前会花费较长时间(几秒到几分钟)进行思维链推导。
- 工具使用:相比前代o1,o3终于学会了使用浏览器和代码解释器等工具,不仅能“想”,还能“做”。
o4-mini
- 发布时间:2025年4月
- 核心定位:多模态视觉推理的性价比之王。
- 特点:
- 命名玄机:虽然叫 “o4” 但发布时间和o3接近,它代表了新的架构分支——“视觉思维”。
- 能力:它不仅能推理文本,还能对着图片进行深度思考。例如,它可以像人类一样仔细审视一张复杂的工程图纸,并一步步推导出其中的结构问题,且成本极低、速度极快。
GPT-5系列:拟人化高性能
GPT-5系列模型将“快思考”和“慢思考”融合,并大幅提升“情商”和易用性。
GPT-5 Instant
- 发布时间:2025年8月
- 核心定位:GPT-5系列的标准速度版。
- 特点:
- 这是GPT-5的默认模式。它结合了GPT-4o的速度和o3的部分推理能力。
- 智能路由:它具备“微感知”能力,遇到简单问题秒回,遇到稍难问题会稍微停顿一下,但不会像 Thinking 模型那样进行长篇大论的推导。
- 性能:幻觉率比GPT-4o降低了约45%。
GPT-5 Thinking
- 发布时间:2025年8月
- 核心定位:GPT-5的深度思考模式。
- 特点:
- 当你开启此模式,模型会显式地展示“思考过程”。
- 相比o3,它的思考过程更具适应性,不会为了简单数学题思考半天。它是处理复杂编程任务、法律文书撰写和科学研究的主力。
GPT-5 Thinking mini
- 发布时间:2025年8月
- 核心定位:轻量级推理模型(平民版“慢思考”)。
- 特点:
- 这是一个非常特殊的模型,通常用于API或作为免费用户的“高智商”体验版。
- 性价比:它保留了“思维链”的核心机制,能一步步推导问题,但参数量较小。适合需要逻辑正确(如一般的数据清洗、简单的逻辑题)但不需要GPT-5旗舰级知识储备的场景。
GPT-5.1 Instant
- 发布时间:2025年11月
- 核心定位:高情商、拟人化的究极形态。
- 特点:
- 更像人:相比GPT-5 Instant,5.1版本最大的改进是**“性格”**。它不再像机器人那样冷冰冰,而是懂得幽默、安慰和闲聊。
- 自适应:进一步优化了潜意识里的推理能力,在保持秒回体验的同时,逻辑错误率极低。
GPT-5.1 Thinking
- 发布时间:2025年11月
- 核心定位:通俗易懂的智者。
- 特点:
- 去黑话:以前的Thinking模型(如 o3)喜欢用复杂的学术术语。GPT-5.1 Thinking被训练得特别擅长“把复杂的事情简单说”。
- 动态变速:它能极度精准地控制思考时间。简单代码它只思考 0.5 秒,复杂的架构设计它会思考20秒,绝不浪费用户时间。
4. 应用安装
ChatGPT提供了多种客户端应用程序,包括桌面端和移动端。
桌面应用

ChatGPT桌面应用程序目前支持macOS和Windows系统,提供了比网页版更流畅、更集中的使用体验。
下载地址:https://openai.com/chatgpt/desktop
系统要求:macOS 11或更高版本、Windows 10 (x64) 或更高版本
Windows系统建议通过winget方式进行安装:
按下 Win + R 键,然后输入powershell打开PowerShell。
输入以下命令:
winget install --id 9nt1r1c2hh7j

更多安装方法请点击访问:ChatGPT Windows 桌面版安装方法
移动应用
ChatGPT移动应用程序可在iOS和Android系统使用。
iOS 版本

系统要求:iOS 17.0或更高版本。
中国地区苹果用户安装ChatGPT,只需要切换登录苹果美区账户,搜索 chatgpt 下载安装。
Android 版本

系统要求:Android 8.0或更高版本。
中国地区安卓用户安装ChatGPT,手机上必须有Google服务框架,在Google Play商店,搜索 ChatGPT 下载安装。
三星/小米/魅族等手机安装Google框架比较简单,而华为无法安装Google框架,可以通过安装GBox虚拟机来访问Google Play商店。Gbox网址:https://gboxlab.com
5. 自定义指令
自定义指令可以让用户更好地控制ChatGPT的响应方式,可以在设置>个性化>自定义指令中进行设置。

OpenAI官网示例
下面来看几个 OpenAI官网示例,来看看它们的相关配置,以及ChatGPT提问和输出内容。
示例1:

制定课程计划的老师不再需要重复他们正在教授三年级科学。
示例2:

用golang编程语言回答问题而不是用Python、Java等其它语言。
示例3:

详细列出六人大家庭的购物指南。
通过以上示例,可以看出OpenAI官网给出的示例还是比较简单,下面会给出一些更细致的教程。
参数配置建议框架
自定义指令,允许用户向ChatGPT提供一些个人或专业背景信息,使它能够更准确和个性化地回答用户问题。你可以提供如专业领域、兴趣爱好、技能水平等信息。
你可以描述你的职业经验、正在学习的领域、希望得到的帮助等信息。例如:
-我是一名经验丰富的 Java 开发者,目前正在学习 React 和前端技术,我希望得到有关前端开发的建议和资源。
-我是分子生物学领域的研究人员,对生物信息学非常感兴趣,我希望获得有关科学研究和数据分析的帮助。
-我是一名高中生,正在为大学入学考试做准备,我需要在数学和物理方面得到辅导。
注意事项:切勿输入“希望你是一名经验丰富的 react 软件开发者”这样的 prompt 来让 ChatGPT 充当角色扮演,这里的作用是给 ChatGPT 提供个人信息让其了解个人人设,从而提供更针对性和实用的回答。
为了便于撰写自定义指令,可以参照以下框架:
# 个人信息
# 工作背景
# 兴趣偏好
# 目标愿望
# 希望帮助
# 遵循风格
# 语气风格
# 详细程度
# 输出格式
根据以上规则,下面撰写一个软件工程师的示例。
示例(软件工程师):
# 个人信息
我是李洋,27岁,在上海工作,学习能力较强
# 工作背景
我是一名工作五年的前端程序员,对recact学习才入门阶段,精通js和 php
# 兴趣偏好
无
# 目标愿望
我想一个月学会react的基本用法
# 希望帮助
希望能给我提供详细的教程和学习方法
# 遵循规则
编写高效、可读的代码,包括清晰、简洁的注释
# 语气风格
默认
# 详细程度
默认
# 输出格式
代码部分以markdown格式输出
此配置指令让ChatGPT专注于react编程学习,如下图会根据指令的人设结合提问回答相应问题。

调整输出详略程度
使用ChatGPT时,常常会遇到输出要么过度详细,要么过度简略,这种情况可以通过自定义指令,加入详略程度等级解决这个问题。建议设置从0到5的详细程度等级,其中0级最简洁,5级最详细。
其修改方法为在框架遵循规则中加入这条指令:
根据用户设置调整详细程度。
详细程度分为0至5级,其中0级最简洁,5级最详尽。详细程度用“V=级别”表示。
如果提示中没有包含详细程度,根据提示的主题内容做出假设。
修改“示例(软件工程师)“的遵循规则做个测试,修改后遵循规则为:
# 遵循规则
## 编写高效、可读的代码,包括清晰、简洁的注释
## 根据用户设置调整详细程度
详细程度分为0至5级,其中0级最简洁,5级最详尽。详细程度用“V=级别”表示。
如果提示中没有包含详细程度,根据提示的主题内容做出假设。
在下面提问中可见,“V=级别”参数可轻松控制输出复杂程度。

明显“V=3”比“V=0”输出的内容更详细具体。
设置多种角色类型
自定义指令对ChatGPT全局有效,如果只将ChatGPT用于特定任务,如写作或编程,这可能会有不错的效果。但如果想将ChatGPT用于其它工作?自定义指令可能会干扰到回应的质量,这时候就需要设置多种角色类型。
需要在框架遵循规则中进行角色设置,然后为ChatGPT预置你可能使用的多个角色,下面是参考指令:
将根据这些用户设置采用角色,R = <角色>,如果提示中没有包含角色,则根据提示主题内容做出假设。
以下是角色:
X = 写作大师:编写高质量内容并提供有关写作类型、内容结构、语气风格等的指导
S = 数据分析师:将回复格式化为表格,概述每个选项的优缺点,或将内容分解为表格中的要点
F = 法律从业者:提供基于中国法律主题、术语和原则的见解
T = 通用专家:在各种主题上提供全面的、通用的信息
你可以添加任意数量的角色描述,通常建议至少设置三个,其中包括一个“T=通用专家”角色,以便在需要通用回答而不需要特定专长的情况下使用。
示例(设置多种角色类型)
根据框架,在自定义指令中输入以下内容,测试输出结果。
# 个人信息
我是李洋,27岁,在上海工作,学习能力较强
# 工作背景
是一名工作五年的前端程序员
# 兴趣偏好
无
# 目标愿望
无
# 希望帮助
希望能给给出准确的答案
# 遵循规则
## 根据用户设置调整详细程度
详细程度分为0至5级,其中0级最简洁,5级最详尽。详细程度用“V = 级别”表示。
如果提示中没有包含详细程度,根据提示的主题内容做出假设。
## 将根据这些用户设置采用角色,R = <角色>,如果提示中没有包含角色,则根据提示主题内容做出假设。以下是角色:
X = 写作大师:编写高质量内容并提供有关写作类型、内容结构、语气风格等的指导
S = 数据分析师:将回复格式化为表格,概述每个选项的优缺点,或将内容分解为表格中的要点
F = 法律从业者:提供基于中国法律主题、术语和原则的见解
T = 通用专家:在各种主题上提供全面的、通用的信息
# 语气风格
默认
# 详细程度
默认
# 输出格式
代码部分以markdown格式输出
设置角色为“通用专家”,复杂程度设置为“2”输出:

设置角色为法律从业者,复杂程度设置为4输出:

从上面两段对话可以看到,在遵循规则中进行角色设置可以有效提高回应质量。
6. 记忆功能

记忆功能对所有用户开放,默认开启。可以在设置>个性化>记忆中开启、关闭或管理记忆。
ChatGPT的记忆功能(Memory)可在不同会话间保留信息,使 AI 更贴合用户需求。相比传统对话每次重头开始,启用记忆后,ChatGPT能记住用户背景和偏好,提供更连贯、个性化的体验。
记忆管理
添加记忆
向ChatGPT添加记忆非常简单,只需在对话中使用以下格式:
"请记住,xxx"
例如:
"请记住,我是一名产品经理,专注于AI产品开发"

当ChatGPT成功记住信息时,会显示”Memory updated”(记忆已更新)的提示。
查询记忆
可以在设置>个性化>记忆>管理中管理记忆,同时也可以直接在对话中询问:
"你记住了关于我的哪些信息?"
ChatGPT会搜索记忆库,然后列出目前记住的所有信息。
删除记忆
可以在设置>个性化>记忆>管理中删除记忆,同时也可以直接在对话中忘记特定信息,使用以下格式:
"忘记xxx"
临时无记忆对话

如果在特定情况下不希望使用记忆功能,但又不想完全关闭此功能,可以选择开启临时聊天。
记忆功能特点和限制
记忆保留时间
记忆可以长时间保留,直到用户主动删除这条记忆。记忆功能独立于聊天历史保留信息,即使聊天结束,所创建的记忆仍然可以在未来的对话中使用。
对GPTs的支持
目前记忆功能对自定义的GPTs还没有生效。根据OpenAI的说法,GPTs的记忆功能将在更广泛的推广后开放,届时开发者可以为他们的GPTs启用记忆功能。
使用技巧和应用场景
使用ChatGPT时,合理的运用记忆功能,可以到达事半功倍的效果。
| 序号 | 记忆功能使用技巧 |
|---|---|
| 1 | 明确指示记忆重要信息:使用“记住”或“Remember”开头的句子,确保ChatGPT保留关键信息。 |
| 2 | 定期检查记忆内容:通过询问ChatGPT记住了什么,确保记忆内容符合预期。 |
| 3 | 删除过时或不准确的记忆:定期清理不再需要的记忆,保持记忆库的准确性。 |
| 4 | 使用临时对话处理敏感信息:当处理不希望被记住的敏感信息时,使用临时对话模式。 |
| 5 | 利用记忆功能提高效率:将常用的背景信息、偏好和需求添加到记忆中,避免重复说明。 |
| 序号 | 记忆功能应用场景 |
|---|---|
| 1 | 个人助理:记住用户的偏好、习惯和日程安排。 |
| 2 | 学习辅助:记住用户的学习进度、难点和学习风格。 |
| 3 | 工作协作:记住项目背景、团队成员和工作流程。 |
| 4 | 健康管理:记住用户的健康状况、饮食限制和锻炼习惯。 |
| 5 | 创意写作:记住故事背景、角色设定和情节发展。 |
7. 库(Library)用法

ChatGPT库(Library)功能允许用户在一个统一的界面中浏览、管理和重访所有生成的图像,无需在漫长的历史对话中翻找。目前,所有ChatGPT用户均可在网页版和安卓/iOS 版上使用此功能。

点击图片可以对图片进行编辑,你可以描述想要添加、删除或替换的内容。
8. 项目(Projects)用法
Projects概念
| 属性 | 说明 |
|---|---|
| 核心定位 | 针对特定任务或主题的持久化工作空间 |
| 适用人群 | Plus, Pro, Team, Enterprise用户 |
| 文件记忆 | 上传的文件被视为项目的“长期记忆”,所有项目内对话均可读取 |
| 指令优先级 | 项目指令 (Project Instructions) > 全局自定义指令 (Custom Instructions) |
| 主要区别 | 普通对话是“一次性的”,Projects是“连续性的” |
Projects是ChatGPT为Plus、Team和Enterprise用户打造的专属工作空间。它解决了普通对话“上下文由于新对话而丢失”的痛点,允许你将相关的聊天、文件和指令整合在一个独立的容器中。
Projects与普通对话的对比
| 对比维度 | 普通对话 | 项目 (Projects) |
|---|---|---|
| 上下文范围 | 仅限当前这一条对话历史 | 覆盖项目内所有文件和指令 |
| 文件管理 | 每次新对话需重新上传 | 上传一次,所有对话永久可用 |
| 知识库 | 无持久知识库 | 支持构建专属知识库 (RAG) |
| 适用场景 | 临时问答、闲聊、一次性任务 | 长期项目、论文写作、代码开发、产品设计 |
创建与配置Projects

- 从侧边栏创建(推荐):
- 点击左侧边栏的
项目标题旁的文件夹图标。 - 输入项目名称(如:“2025年度营销复盘”)。
- 点击 “创建项目”。
- 点击左侧边栏的
- 从现有对话转化:
- 在任意一条高质量对话中,可以拖动至
项目创建项目。
- 在任意一条高质量对话中,可以拖动至
项目指令

项目指令设定的提示词会自动应用到该项目下的每一个新对话中,无需重复输入。
💡 提示:项目指令的优先级高于账户设置里的“自定义指令”。
项目指令使用结构化提示词效果最好。
通用指令模板
### 角色定义
[定义 ChatGPT 在此项目中的具体职位,如:资深 Java 架构师]
### 项目背景
[简述项目目标、当前进度、关键约束]
### 回复风格要求
- 语言风格:[专业/幽默/学术/简洁]
- 格式要求:[使用 Markdown/强制列表/代码块]
- 引用规范:[必须引用项目文件中的具体段落]
### 知识库使用规则
- 优先从上传的文件中查找答案。
- 如果文件中没有相关信息,请明确告知,不要编造。
实战案例:学术论文润色
### 角色
你是指向 IEEE 期刊投稿的学术编辑。
### 背景
我正在撰写关于“大模型在医疗诊断中的应用”的论文,目标期刊是 Nature Medicine。
### 任务
检查语法错误,提升学术词汇的准确性,确保符合上传的《投稿指南.pdf》格式要求。
### 约束
修改建议需用粗体标出,保持原意不变,不要过度改写。
项目文件

这是项目的“知识库”。
- 支持格式:PDF, Word, Excel, Markdown, 代码文件, 图片等。
- 容量限制:通常支持上传 10-20 个文件,单文件及总容量建议控制在512MB以内以保证检索速度。
- 功能:ChatGPT会自动对这些文件进行索引,回答问题时会优先参考这里的内容。
ChatGPT并不是把所有文件“背下来”,而是进行“检索”。为了提高准确率:
- 文件命名要清晰:使用
2024_Q3_财务报表.xlsx而不是未命名1.xlsx。 - 切分长文档:如果文档有几百页,尝试按章节拆分为较小的文件(如
第一章_绪论.pdf),有助于 AI 更精准定位。 - 包含索引文件:创建一个
项目说明.md,在里面简要概括每个文件的用途,作为AI的“指引地图”。
虽然Projects内的不同对之间不能直接互相读取聊天记录(对话B不知道对话A的内容),但它们共使用相同的知识库和指令。
操作建议:如果你在“对话 A”中得出了一个重要结论,请将这个结论整理成一个 .txt 或 .md 文件,上传到项目的知识库中。这样,“对话 B”就能知道这个结论了。
常见配置:全栈软件开发
- 文件:
API接口文档.md,数据库结构.sql,设计稿截图.png,依赖包列表.json - 指令:设定技术栈(React + Python),规定代码风格,要求每次修改代码后提供完整的代码块。
- 对话分组:
- Chat 1: 需求分析
- Chat 2: 前端开发
- Chat 3: 后端逻辑与Bug修复
常见配置:求职面试准备
指令:扮演严厉的面试官,根据 JD 和简历进行模拟面试。每次只问一个问题,等待我回答后再点评并提出下一个问题。
文件:个人简历.pdf, 作品集.pdf, 目标岗位JD.txt, 公司背景调查.docx
Projects与GPTs区别
Projects与GPTs代表了 ChatGPT 生态中两种截然不同的定制化路径:
- GPTs是 “封装好的功能应用”。它侧重于行为模式的固化,通过预设指令和静态知识库,打造一个专用的垂直领域AI Agent。
- Projects是 “上下文隔离的工作空间”。它侧重于数据环境的构建,通过集中管理文件和对话历史,为处理复杂、长周期的任务提供统一的背景信息。
💡 重要提示: 目前,两者在系统架构上是互斥的。用户无法在Projects工作区内调用GPTs。
架构逻辑对比
1. GPTs:功能导向型
- 定义:一个包含特定指令(Prompt)、知识库(Knowledge)和外部能力(Actions/API)的独立封装体。
- 运行机制:类似于一个 App。用户进入该GPT,系统会自动加载预设系统指令。无论开启多少次新对话,AI 的“人设”和“规则”保持不变,但对话之间的记忆不互通。
- 核心要素:指令逻辑。它的价值在于开发者如何调教 AI 的思维方式。
- 分发属性:具备极强的可移植性,可发布至GPT Store或在团队内部共享链接。
2. Projects:数据导向型
- 定义:一个聚合了特定文件集和多组对话的沙盒环境。
- 运行机制:类似于一个项目文件夹。用户将相关文档(如 PDF、Excel、代码库)上传至Projects文件,该环境下的所有新对话均自动获得这些文件的访问权限,无需重复上传。
- 核心要素:背景资料。它的价值在于解决长上下文的碎片化问题。
- 分发属性:创建者可以分享给指定用户进行分享协作。
功能差异矩阵
| 维度 | GPTs | Projects |
|---|---|---|
| 首要目标 | 打造工具:固化特定任务的处理流程。 | 管理语境:维持复杂任务的上下文连贯性。 |
| 模型调用 | 可锁定特定模型(如 GPT-4o 或 o1),包含特定配置。 | 仅支持调用标准模型,不支持加载GPTs。 |
| 知识库性质 | 静态参考:用于 RAG(检索增强生成),如查询规章制度。 | 动态工作:用于深度分析,如基于财报撰写多份报告。 |
| 外部连接 | 支持Actions:可配置API调用外部系统(如日历、邮箱)。 | 不支持:仅限于文件分析和文本生成。 |
| 指令 | 核心驱动:定义 AI 的角色、语气、输出格式。 | 辅助背景:定义该项目通用的背景信息(如“本项目请使用学术用语”)。 |
| 协作模式 | 通过链接分享使用权。 | 可共享整个工作区,成员可共同编辑文件和查看对话。 |
互斥与解决方案
由于底层上下文管理逻辑的冲突,Projects不支持直接集成GPTs。
- 架构冲突:GPTs依赖其独立的系统指令运行,而Projects也有自己的项目指令。如果强行融合,会导致指令优先级冲突,且知识库检索范围难以界定。
若需要在Projects中复现某个GPTs的功能(例如需要AI既懂特定的代码规范,又能读取Project里的项目文档):
- 提取GPTs指令:进入该GPTs的配置页面复制其指令。
- 配置Projects环境:进入目标Projects,将GPTs指令粘贴到项目指令。
- 结果:该Project内的标准模型将具备原GPTs的行为模式,同时拥有对Projects文件的全量访问权限。
何时使用何种工具
场景 A:建议使用GPTs
- 任务具有高度重复性(例如:每天都需要将会议纪要格式化为特定的Markdown表格)。
- 需要与外部系统交互(例如:通过API查询实时汇率或天气)。
- 需要对外分发(例如:制作一个客服机器人给客户使用)。
- 不需要长期记忆(每次使用都是全新开始,无需回顾上周的文件)。
场景 B:建议使用Projects
- 任务具有长期性和复杂性(例如:撰写一部小说、开发一个软件系统、进行季度战略分析)。
- 依赖大量特定文件(例如:需要AI交叉对比20份PDF文档的内容)。
- 多线程对话需求(例如:在同一个项目背景下,一个对话窗口用来写大纲,另一个窗口用来润色正文,两者共享同一套资料)。
- 团队协作(Team版用户需要让同事看到项目的所有相关资料和过往的分析记录)。
9. GPTs用法
更详细的教程请访问:GPTs从入门到精通
GPTs是OpenAI推出的自定义ChatGPT功能,允许用户创建针对特定任务的个性化 AI 助手,无需编程知识即可构建,GPTs允许免费用户访问使用,但是只有Plus、Team或Enterprise订阅用户可以创建。
访问GPTs

点击左侧边栏的GPTs入口,就像打开了苹果App Store。你可以在这里搜索或浏览“写作、工作效率、研究与分析”等分类下的工具,每一个GPTs实际上就是一个专门解决特定问题的App。
用户也可以分享了GPTs链接,直接点击即可使用:
格式:https://chatgpt/g/g-xxxxxxxx-name
创建GPTs
步骤1:进入创建界面

点击左上角创建按钮,找到“创建”配置。
步骤2:两种创建模式
对话式创建
通过与 GPT Builder 对话来创建:

GPT Builder: What would you like to make?
你: 我想创建一个帮助用户写周报的助手
GPT Builder: 好的!你想要创建一个专门帮助用户写周报的助手。这位助手的任务是自动化或辅助生成周报内容,还是为用户提供写作建议、结构模板等呢?
可以先明确一下这位助手的功能需求,比如:
1.自动生成周报:根据用户提供的任务进展、完成的工作和下周的计划,自动生成周报。
2.格式和模板:为用户提供标准的周报模板,帮助他们规范周报的结构。
3.写作建议:为用户提供改进周报写作风格的建议,比如让内容更简洁、清晰等。
你希望这位助手具备哪些具体功能?
手动配置
直接填写配置信息:
| 字段 | 说明 | 示例 |
|---|---|---|
| Name | GPT 名称 | 周报助手 |
| Description | 简短描述 | 帮你快速生成专业的工作周报 |
| Instructions | 详细指令 | 见下方示例 |
| Conversation starters | 对话开场白 | “帮我写本周周报” |
| Knowledge | 上传知识文件 | PDF、TXT、文档等 |
| Capabilities | 功能开关 | 网页搜索、画布、图像生成、代码解释器和数据分析 |
| Actions | API连接 | 自定义API调用 |
步骤3:编写指令(核心)
# 角色定义
你是一位专业的周报撰写助手,擅长帮助职场人士撰写清晰、专业的工作周报。
# 工作流程
1. 首先询问用户本周完成的主要工作
2. 了解遇到的困难和解决方案
3. 询问下周计划
4. 生成结构化的周报
# 输出格式
## 本周工作总结
- 完成事项 1
- 完成事项 2
## 遇到的问题及解决方案
...
## 下周工作计划
...
# 注意事项
- 语言简洁专业
- 突出工作成果
- 量化数据优先
步骤4:添加知识库(可选)
支持的文件格式:
✅ PDF
✅ TXT
✅ DOCX
✅ CSV
✅ JSON
✅ 图片文件
上传方法:
1. 在”配置”页面找到 “知识”
2. 点击”上传文件”
3. 选择相关文件
步骤5:配置模型
| 模型 | 特点 | 适用场景 |
|---|---|---|
| GPT-4o | 平衡型,速度快,多模态 | 日常对话、通用助手、图像理解 |
| GPT-5 Instant | 快速响应,成本低 | 简单任务、高频交互、客服类 |
| GPT-5 Thinking | 深度推理,会”思考” | 复杂分析、数学、编程、逻辑题 |
| GPT-5.1 | 最新基础版 | 通用任务,比4o更强 |
| GPT-5.1 Instant | 5.1的快速版 | 需要新能力但要求速度的场景 |
| GPT-5.1 Thinking | 最强推理能力 | 最复杂的推理、研究、专业分析 |
选择建议

🟢 选「无推荐」- 让用户自己选
- 你的GPTs是通用工具
- 不确定用户具体需求
🟢 不建议选择GPT-4o、GPT-5 Instant、GPT-5 Thinking模型
- 相比其它模型能力欠缺
🟢 选GPT-5.1
- 适合通用任务
🟢 选GPT-5.1 Instant
- 客服/FAQ类应用
- 简单问答、快速检索
- 高频使用、控制成本
🟢 GPT-5.1 Thinking
- 数学/编程/逻辑类 GPT
- 需要分步推理的任务
- 专业分析、复杂决策
简单决策流程
你的 GPT 需要深度思考吗?
├── 是 → Thinking系列
│ └── GPT-5.1 Thinking
│
└── 否 →
├── 要快/简单任务?→ GPT-5.1 Instant
└── 要平衡/多模态?→ GPT-5.1
步骤6:勾选功能
☑️ 网页搜索 – 允许搜索网络信息
☑️ 画布 – 允许调用画布功能
☑️ 图片生成 – 允许调用DALL·E生成图片
☑️ 代码解译器和数据分析 – 允许分析数据和执行数学运算
步骤7:预览和测试
右侧预览窗口可以实时测试你的GPTs
建议测试场景:
– 正常使用流程
– 边界情况
– 错误输入处理
步骤8:保存和发布
点击右上角”创建”按钮
发布选项:
🔒 仅自己可用
🔗 有链接即可访问
🌐 公开到GPT Store
高级功能:添加Actions
操作也就是Actions,通常指的是模型可以执行的各种功能或任务。这些Actions 允许GPTs在处理文本请求时执行更复杂的操作,而不仅仅是生成文本。
- 具体作用包括:
- 数据检索:允许模型从外部源或内置的数据库中检索信息,如查找天气预报、新闻更新或专业文章。
- 用户交互:在与用户的对话中,模型可以执行设置提醒、发送邮件或者更新日历事件等交互性操作。
- 调用 API:可以配置调用第三方 API,以获取或处理数据。例如,调用地图 API 以提供导航指导或调用翻译 API 来翻译文本。
Actions使得GPTs不只是简单的聊天机器人,而是能够执行多种任务的智能助手。通过这些功能,GPTs 能够在多种应用场景中提供更多服务,从而更全面地满足用户的需求。
这一部分比较复杂,具体教程请访问:GPTs从入门到精通
实战案例:创建「面试助手
【名称】
AI面试教练
【描述】
帮你准备技术面试,模拟真实面试场景,提供专业反馈
【指令】
# 角色
你是一位资深的技术面试官,有 10 年大厂面试经验
# 功能
1. 根据用户目标岗位生成面试题
2. 模拟真实面试对话
3. 对回答给出评分和改进建议
# 流程
1. 询问目标公司和岗位
2. 询问准备面试的类型(技术/行为/系统设计)
3. 开始模拟面试
4. 面试结束后给出总结报告
# 评分标准
- 技术准确性(40%)
- 表达清晰度(30%)
- 思维逻辑性(30%)
【对话开场白】
- "我要面试 Google 的 SDE 岗位"
- "帮我准备行为面试"
- "模拟一场系统设计面试"
【推荐模型】
GPT 5.1
GPTs使用技巧
💡 Prompt优化技巧
好的指令应包含:
1. 【角色定义】明确 GPT 的身份和专长
2. 【任务说明】详细的工作流程
3. 【输出格式】期望的回复结构
4. 【限制条件】不应该做什么
5. 【示例】具体的对话示例
常见问题
Q1: 免费用户能使用GPTs吗?
✅ 可以使用他人创建的公开GPTs
❌ 不能创建自己的GPTs
Q2: 知识文件大小限制?
单个文件:最大512MB
总容量:根据订阅等级有所不同
Q3: 如何提高GPTs的回复质量?
1. 指令写得越详细越好
2. 提供具体示例
3. 上传相关知识文档
4. 反复测试并迭代优化