ChatGPT从入门到精通

769次阅读
没有评论

教程更新时间:2025年12月2日 | 撰写者:Rainy | 微信号:cntheai

1. ChatGPT简介

ChatGPT从入门到精通
名称 ChatGPT 语言 英文、中文、德文、法文、日文等67种语言
上线时间 2022年11月30日 最近更新时间 2025年8月13日
开发商 OpenAI 网址 https://chatgpt.com

ChatGPT(Chat Generative Pre-trained Transformer)是由美国人工智能研究实验室OpenAI研发的一款人工智能聊天机器人程序。它于2022年11月30日正式发布,并在短短两个月内月活跃用户突破1亿,成为历史上增长最快的消费级应用。

ChatGPT的强大建立在“生成式预训练变换模型”(GPT)的架构之上。简单来说,它通过阅读互联网上浩如烟海的文本数据(书籍、文章、代码等),学会了人类语言的语法、逻辑和世界知识。让ChatGPT脱颖而出的关键技术是RLHF(基于人类反馈的强化学习)。在预训练阶段结束后,OpenAI的研究人员引入人类训练师对模型的回答进行打分和修正。这就像老师批改作业一样,教会了AI什么是“有用、诚实且无害”的回答。

ChatGPT从入门到精通

ChatGPT不仅具备更强的逻辑推理能力,还支持多模态交互——即不仅能读懂文字,还能看懂图片、听懂语音并进行实时对话。ChatGPT的功能早已超越了简单的问答,它正在重塑各行各业的工作方式:

  • 文本创作与处理: 它可以撰写邮件、策划案、诗歌、剧本,甚至可以模仿特定作家的风格。
  • 编程与代码调试:它能生成代码片段、解释复杂算法,甚至直接修复代码中的 Bug。
  • 教育与学习: 它能通过对话引导学生思考,解释复杂的概念,或辅助语言学习。
  • 创意辅助: 从头脑风暴到生成AI绘画的提示词(Prompt),它是激发灵感的利器。

尽管ChatGPT表现惊艳,但它并非完美无缺,还存在以下问题:

  • 幻觉问题: 它有时会“一本正经地胡说八道”,捏造事实或引用不存在的文献。
  • 知识截止: 虽然能联网搜索,但基础模型的训练数据仍有时间滞后性。
  • 伦理与版权: 关于 AI 生成内容的版权归属、训练数据的合法性,以及可能带来的就业替代焦虑,都是目前社会激烈讨论的议题。

ChatGPT不仅仅是一个工具,它代表了人类迈向通用人工智能(AGI)的重要一步。

2. 计划对比

参考官方定价网址:https://chatgpt.com/zh-Hans-CN/pricing/

定价与核心权益对比

维度 Free (免费版) Plus (个人订阅) Pro (个人旗舰) Business (商业协作版)
价格 $0 /月 $20 /月 $200 /月 $25 /用户/月 (年付)
核心模型 推理权限有限(通常为轻量模型) GPT-5.1 (进行高级推理) GPT-5.1 Pro (进行专业推理) GPT-5 (无限)
GPT-5 Pro (可访问)
消息限额 数量有限 上限更高 数量无限(受滥用防护约束) 无限 GPT-5
大量 GPT-5 Thinking
Sora 视频 无 / 极受限 Sora 1(有限使用权限) Sora 1(高级使用权限) 未明确提及,通常同Plus
编程/智能体 无法使用 Codex Codex 智能体
标准版智能体模式
扩展版 Codex 智能体
智能体模式最大支持
Codex 访问权限
可在代码库中推理
深入研究 有限使用 更多深入研究权限 深度研究最大支持 企业级知识库整合
数据隐私 默认可能训练 默认可能训练 默认可能训练 绝不训练 (企业级隐私)

各计划详细解读

⚪ Free (免费)
  • 定位: 日常任务的智能解决方案。
  • 现状: 功能被严格“阉割”。
    • 推理: 虽能用,但“推理使用权限有限”。
    • 深入研究 (Deep Research): 仅仅是“有限使用”。
    • 图片与速度: 生成受限且速度较慢。
    • 局限: 记忆和上下文支持都非常有限,基本只能做简单的问答,无法进行复杂的项目级任务。
⚫ Plus ($20)
  • 定位: 更为先进智能使用权限。
  • 核心模型: 明确使用GPT-5.1进行高级推理。
  • 新增能力:
    • Sora 1: 拥有“有限使用Sora 1视频生成功能”。这意味着Plus用户可以尝鲜生成视频,但可能在时长或次数上有卡控。
    • Codex智能体: 专门针对编程优化的Agent。
    • 深入研究: 拥有比免费版更多的权限。
    • 上下文: 记忆与上下文支持更强。
🔴 Pro ($200)
  • 定位: 全面使用ChatGPT功能。
  • 核心独占:
    • GPT-5.1 Pro: 这是Plus没有的。图片描述为“进行专业推理”,暗示其逻辑深度和专业领域(如科研、复杂架构)的能力远超普通版5.1。
    • 无限流量: 明确了 “消息和上传数量无限”“无限制且更快速的图片生成”
    • 高级 Sora 1: 拥有“Sora 1视频生成功能的高级使用权限”(推测为生成时间更长、清晰度更高、无水印等)。
    • 最大化支持: 无论是上下文记忆、深度研究还是智能体模式,Pro都是“最大支持”。
🔵 Business ($25/用户/月)
  • 定位: 专为初创企业和成长中企业设计。
  • 最大的惊喜:
    • 模型权限越级: Business版不仅可以 “无限制使用GPT-5”,还可以 “访问GPT-5 pro”。这意味着只需 $25/月,你就能在企业环境中使用Pro级别的模型(虽然可能是在额度或共享池的基础上)。
    • GPT-5 Thinking: 可“大量使用GPT-5 Thinking”。
  • 企业级功能:
    • 企业知识库: 可以连接Slack、Google Drive、GitHub,让 I更懂公司业务。
    • 代码库推理: 可以在你的文档和代码库中运行Codex智能体。
    • 数据安全: 最重要的一点——“默认情况下不会通过你的企业数据进行任何训练”。
🏢 企业 (Enterprise)
  • 定位: 企业级AI、安全与全面支持(需联系销售)。
  • 差异化:
    • 相比Business版,它有 “扩展版上下文窗口”(支持更长的输入)。
    • 支持SCIMEKM(企业密钥管理)、域验证等高级安全控制。
    • 支持数据驻留(指定数据存储在哪个国家/地区)。

购买建议

  1. 对于个人:
    • Plus ($20) 依然是首选。它现在包含了GPT-5.1Sora 1的基础功能,性价比极高。
    • Pro ($200) 的核心卖点在于 “无限” 和 “GPT-5.1 Pro”。只有当你需要每天生成海量内容,或者处理的问题难度连GPT-5.1都搞不定时,才需要上Pro。
  2. 对于公司/团队:
    • Business 版 ($25) 性价比极高:Business 包含GPT-5 Pro的访问权限且支持无限制GPT-5
    • 结合其“数据不训练”的隐私条款和“企业知识库”功能,任何2人以上的团队都应该果断选择 Business 版,而不是让员工各自购买Plus,因为Business版不仅便宜(对比 Pro),功能也在某些方面(如 Pro 模型访问)超越了个人Plus版。

3. 常用模型

目前ChatGPT Plus网页版默认提供GPT-5 Instant、GPT-5 Thinking、GPT-5.1 Instant、GPT-5.1 Thinking、GPT-4o模型,在设置>常规中启用显示其它模型,可以使用GPT-5 Thinking mini、GPT-4.1、o3、o4-mini模型。

GPT-4系列:多模态与长上下文

GPT-4系列模型主要奠定了“看听说”的基础能力和处理超长文本的能力。

GPT-4o
  • 发布时间:2024年5月
  • 核心定位全能交互旗舰
  • 特点
    • OpenAI首个“原生多模态”模型,单一模型同时处理文本、音频、图像。
    • 优势:极速的语音响应(平均320毫秒)和实时视频分析能力。
    • 地位:它是后续所有模型的“感官基础”,赋予了AI“看”和“听”的能力,但在复杂逻辑推理上不如后来的Thinking系列。
GPT-4.1
  • 发布时间:2025年4月
  • 核心定位开发者与长文档专家
  • 特点
    • 这是在GPT-5发布前的过渡主力模型,重点解决了GPT-4o在写代码和遵循复杂指令上的短板。
    • 巨大升级:支持100万 token的超长上下文窗口(约为2000页文本),是处理整库代码或长篇小说的首选。
    • 变体:除了标准版,还推出 GPT-4.1 Mini和GPT-4.1 Nano,主要服务于API开发者。

o系列:复杂问题推理

o系列模型主要解决“慢思考”的问题,让AI学会像人类一样在回答前进行逻辑推演。

o3
  • 发布时间:2025年4月(与o4-mini同期大规模开放)
  • 核心定位逻辑推理的天花板(o1的继任者)。
  • 特点
    • 极致智力:专攻数学竞赛、高难度科研和算法竞赛。在回答问题前会花费较长时间(几秒到几分钟)进行思维链推导。
    • 工具使用:相比前代o1,o3终于学会了使用浏览器和代码解释器等工具,不仅能“想”,还能“做”。
o4-mini
  • 发布时间:2025年4月
  • 核心定位多模态视觉推理的性价比之王
  • 特点
    • 命名玄机:虽然叫 “o4” 但发布时间和o3接近,它代表了新的架构分支——“视觉思维”
    • 能力:它不仅能推理文本,还能对着图片进行深度思考。例如,它可以像人类一样仔细审视一张复杂的工程图纸,并一步步推导出其中的结构问题,且成本极低、速度极快。

GPT-5系列:拟人化高性能

GPT-5系列模型将“快思考”和“慢思考”融合,并大幅提升“情商”和易用性。

GPT-5 Instant
  • 发布时间:2025年8月
  • 核心定位GPT-5系列的标准速度版
  • 特点
    • 这是GPT-5的默认模式。它结合了GPT-4o的速度和o3的部分推理能力。
    • 智能路由:它具备“微感知”能力,遇到简单问题秒回,遇到稍难问题会稍微停顿一下,但不会像 Thinking 模型那样进行长篇大论的推导。
    • 性能:幻觉率比GPT-4o降低了约45%。
GPT-5 Thinking
  • 发布时间:2025年8月
  • 核心定位GPT-5的深度思考模式
  • 特点
    • 当你开启此模式,模型会显式地展示“思考过程”。
    • 相比o3,它的思考过程更具适应性,不会为了简单数学题思考半天。它是处理复杂编程任务、法律文书撰写和科学研究的主力。
GPT-5 Thinking mini
  • 发布时间:2025年8月
  • 核心定位轻量级推理模型(平民版“慢思考”)
  • 特点
    • 这是一个非常特殊的模型,通常用于API或作为免费用户的“高智商”体验版。
    • 性价比:它保留了“思维链”的核心机制,能一步步推导问题,但参数量较小。适合需要逻辑正确(如一般的数据清洗、简单的逻辑题)但不需要GPT-5旗舰级知识储备的场景。
GPT-5.1 Instant
  • 发布时间:2025年11月
  • 核心定位高情商、拟人化的究极形态
  • 特点
    • 更像人:相比GPT-5 Instant,5.1版本最大的改进是**“性格”**。它不再像机器人那样冷冰冰,而是懂得幽默、安慰和闲聊。
    • 自适应:进一步优化了潜意识里的推理能力,在保持秒回体验的同时,逻辑错误率极低。
GPT-5.1 Thinking
  • 发布时间:2025年11月
  • 核心定位通俗易懂的智者
  • 特点
    • 去黑话:以前的Thinking模型(如 o3)喜欢用复杂的学术术语。GPT-5.1 Thinking被训练得特别擅长“把复杂的事情简单说”
    • 动态变速:它能极度精准地控制思考时间。简单代码它只思考 0.5 秒,复杂的架构设计它会思考20秒,绝不浪费用户时间。

4. 应用安装

ChatGPT提供了多种客户端应用程序,包括桌面端和移动端。

桌面应用

ChatGPT桌面应用程序目前支持macOS和Windows系统,提供了比网页版更流畅、更集中的使用体验。

下载地址:https://openai.com/chatgpt/desktop

系统要求:macOS 11或更高版本、Windows 10 (x64) 或更高版本

Windows系统建议通过winget方式进行安装:

按下 Win + R 键,然后输入powershell打开PowerShell。

输入以下命令:

winget install --id 9nt1r1c2hh7j
ChatGPT从入门到精通

更多安装方法请点击访问:ChatGPT Windows 桌面版安装方法

移动应用

ChatGPT移动应用程序可在iOS和Android系统使用。

iOS 版本

ChatGPT从入门到精通

系统要求:iOS 17.0或更高版本。

中国地区苹果用户安装ChatGPT,只需要切换登录苹果美区账户,搜索 chatgpt 下载安装。

美区Apple账户注册教程

Android 版本

ChatGPT从入门到精通

系统要求:Android 8.0或更高版本。

中国地区安卓用户安装ChatGPT,手机上必须有Google服务框架,在Google Play商店,搜索 ChatGPT 下载安装。

三星/小米/魅族等手机安装Google框架比较简单,而华为无法安装Google框架,可以通过安装GBox虚拟机来访问Google Play商店。Gbox网址:https://gboxlab.com

5. 自定义指令

自定义指令可以让用户更好地控制ChatGPT的响应方式,可以在设置>个性化>自定义指令中进行设置。

ChatGPT从入门到精通

OpenAI官网示例

下面来看几个 OpenAI官网示例,来看看它们的相关配置,以及ChatGPT提问和输出内容。

示例1:

ChatGPT从入门到精通

制定课程计划的老师不再需要重复他们正在教授三年级科学


示例2:

ChatGPT从入门到精通

用golang编程语言回答问题而不是用Python、Java等其它语言。


示例3:

ChatGPT从入门到精通

详细列出六人大家庭的购物指南。


通过以上示例,可以看出OpenAI官网给出的示例还是比较简单,下面会给出一些更细致的教程。

参数配置建议框架

自定义指令,允许用户向ChatGPT提供一些个人或专业背景信息,使它能够更准确和个性化地回答用户问题。你可以提供如专业领域、兴趣爱好、技能水平等信息。

你可以描述你的职业经验、正在学习的领域、希望得到的帮助等信息。例如:

-我是一名经验丰富的 Java 开发者,目前正在学习 React 和前端技术,我希望得到有关前端开发的建议和资源。

-我是分子生物学领域的研究人员,对生物信息学非常感兴趣,我希望获得有关科学研究和数据分析的帮助。

-我是一名高中生,正在为大学入学考试做准备,我需要在数学和物理方面得到辅导。

注意事项:切勿输入“希望你是一名经验丰富的 react 软件开发者”这样的 prompt 来让 ChatGPT 充当角色扮演,这里的作用是给 ChatGPT 提供个人信息让其了解个人人设,从而提供更针对性和实用的回答。

为了便于撰写自定义指令,可以参照以下框架:

# 个人信息
# 工作背景
# 兴趣偏好
# 目标愿望
# 希望帮助
# 遵循风格
# 语气风格
# 详细程度
# 输出格式

根据以上规则,下面撰写一个软件工程师的示例。

示例(软件工程师):

# 个人信息
  我是李洋,27岁,在上海工作,学习能力较强
 
# 工作背景
  我是一名工作五年的前端程序员,对recact学习才入门阶段,精通js和 php
 
# 兴趣偏好
  无 
 
# 目标愿望
  我想一个月学会react的基本用法
 
# 希望帮助
  希望能给我提供详细的教程和学习方法
 
# 遵循规则
  编写高效、可读的代码,包括清晰、简洁的注释
 
# 语气风格
  默认
 
# 详细程度
  默认
 
# 输出格式
  代码部分以markdown格式输出

此配置指令让ChatGPT专注于react编程学习,如下图会根据指令的人设结合提问回答相应问题。

ChatGPT从入门到精通

调整输出详略程度

使用ChatGPT时,常常会遇到输出要么过度详细,要么过度简略,这种情况可以通过自定义指令,加入详略程度等级解决这个问题。建议设置从0到5的详细程度等级,其中0级最简洁,5级最详细。

其修改方法为在框架遵循规则中加入这条指令:

根据用户设置调整详细程度。
详细程度分为0至5级,其中0级最简洁,5级最详尽。详细程度用“V=级别”表示。
如果提示中没有包含详细程度,根据提示的主题内容做出假设。

修改“示例(软件工程师)“遵循规则做个测试,修改后遵循规则为:

# 遵循规则 
## 编写高效、可读的代码,包括清晰、简洁的注释
## 根据用户设置调整详细程度
   详细程度分为0至5级,其中0级最简洁,5级最详尽。详细程度用“V=级别”表示。
   如果提示中没有包含详细程度,根据提示的主题内容做出假设。

在下面提问中可见,“V=级别”参数可轻松控制输出复杂程度。

ChatGPT从入门到精通

明显“V=3”“V=0”输出的内容更详细具体。

设置多种角色类型

自定义指令对ChatGPT全局有效,如果只将ChatGPT用于特定任务,如写作或编程,这可能会有不错的效果。但如果想将ChatGPT用于其它工作?自定义指令可能会干扰到回应的质量,这时候就需要设置多种角色类型。

需要在框架遵循规则中进行角色设置,然后为ChatGPT预置你可能使用的多个角色,下面是参考指令:

将根据这些用户设置采用角色,R = <角色>,如果提示中没有包含角色,则根据提示主题内容做出假设。
以下是角色:

X = 写作大师:编写高质量内容并提供有关写作类型、内容结构、语气风格等的指导
S = 数据分析师:将回复格式化为表格,概述每个选项的优缺点,或将内容分解为表格中的要点
F = 法律从业者:提供基于中国法律主题、术语和原则的见解
T = 通用专家:在各种主题上提供全面的、通用的信息

你可以添加任意数量的角色描述,通常建议至少设置三个,其中包括一个“T=通用专家”角色,以便在需要通用回答而不需要特定专长的情况下使用。

示例(设置多种角色类型)

根据框架,在自定义指令中输入以下内容,测试输出结果。

# 个人信息 
  我是李洋,27岁,在上海工作,学习能力较强 

# 工作背景 
  是一名工作五年的前端程序员

# 兴趣偏好 
  无 

# 目标愿望 
  无

# 希望帮助 
  希望能给给出准确的答案

# 遵循规则 
## 根据用户设置调整详细程度
   详细程度分为0至5级,其中0级最简洁,5级最详尽。详细程度用“V = 级别”表示。
   如果提示中没有包含详细程度,根据提示的主题内容做出假设。
## 将根据这些用户设置采用角色,R = <角色>,如果提示中没有包含角色,则根据提示主题内容做出假设。以下是角色:
   X = 写作大师:编写高质量内容并提供有关写作类型、内容结构、语气风格等的指导
   S = 数据分析师:将回复格式化为表格,概述每个选项的优缺点,或将内容分解为表格中的要点
   F = 法律从业者:提供基于中国法律主题、术语和原则的见解
   T = 通用专家:在各种主题上提供全面的、通用的信息

# 语气风格 
  默认 

# 详细程度 
  默认 

# 输出格式 
  代码部分以markdown格式输出

设置角色为“通用专家”,复杂程度设置为“2”输出:

ChatGPT从入门到精通

设置角色为法律从业者,复杂程度设置为4输出:

ChatGPT从入门到精通

从上面两段对话可以看到,在遵循规则中进行角色设置可以有效提高回应质量。

6. 记忆功能

ChatGPT从入门到精通

记忆功能对所有用户开放,默认开启。可以在设置>个性化>记忆中开启、关闭或管理记忆。

ChatGPT的记忆功能(Memory)可在不同会话间保留信息,使 AI 更贴合用户需求。相比传统对话每次重头开始,启用记忆后,ChatGPT能记住用户背景和偏好,提供更连贯、个性化的体验。

记忆管理

添加记忆

向ChatGPT添加记忆非常简单,只需在对话中使用以下格式:

 "请记住,xxx"

例如:

"请记住,我是一名产品经理,专注于AI产品开发"
ChatGPT从入门到精通

当ChatGPT成功记住信息时,会显示”Memory updated”(记忆已更新)的提示。

查询记忆

可以在设置>个性化>记忆>管理中管理记忆,同时也可以直接在对话中询问:

"你记住了关于我的哪些信息?"

ChatGPT会搜索记忆库,然后列出目前记住的所有信息。

删除记忆

可以在设置>个性化>记忆>管理中删除记忆,同时也可以直接在对话中忘记特定信息,使用以下格式:

"忘记xxx"

临时无记忆对话

ChatGPT从入门到精通

如果在特定情况下不希望使用记忆功能,但又不想完全关闭此功能,可以选择开启临时聊天。

记忆功能特点和限制

记忆保留时间

记忆可以长时间保留,直到用户主动删除这条记忆。记忆功能独立于聊天历史保留信息,即使聊天结束,所创建的记忆仍然可以在未来的对话中使用。

对GPTs的支持

目前记忆功能对自定义的GPTs还没有生效。根据OpenAI的说法,GPTs的记忆功能将在更广泛的推广后开放,届时开发者可以为他们的GPTs启用记忆功能。

使用技巧和应用场景

使用ChatGPT时,合理的运用记忆功能,可以到达事半功倍的效果。

序号 记忆功能使用技巧
1 明确指示记忆重要信息:使用“记住”或“Remember”开头的句子,确保ChatGPT保留关键信息。
2 定期检查记忆内容:通过询问ChatGPT记住了什么,确保记忆内容符合预期。
3 删除过时或不准确的记忆:定期清理不再需要的记忆,保持记忆库的准确性。
4 使用临时对话处理敏感信息:当处理不希望被记住的敏感信息时,使用临时对话模式。
5 利用记忆功能提高效率:将常用的背景信息、偏好和需求添加到记忆中,避免重复说明。

序号 记忆功能应用场景
1 个人助理:记住用户的偏好、习惯和日程安排。
2 学习辅助:记住用户的学习进度、难点和学习风格。
3 工作协作:记住项目背景、团队成员和工作流程。
4 健康管理:记住用户的健康状况、饮食限制和锻炼习惯。
5 创意写作:记住故事背景、角色设定和情节发展。

7. 库(Library)用法

ChatGPT从入门到精通

ChatGPT库(Library)功能允许用户在一个统一的界面中浏览、管理和重访所有生成的图像,无需在漫长的历史对话中翻找。目前,所有ChatGPT用户均可在网页版和安卓/iOS 版上使用此功能。

ChatGPT从入门到精通

点击图片可以对图片进行编辑,你可以描述想要添加、删除或替换的内容。

8. 项目(Projects)用法

Projects概念

属性 说明
核心定位 针对特定任务或主题的持久化工作空间
适用人群 Plus, Pro, Team, Enterprise用户
文件记忆 上传的文件被视为项目的“长期记忆”,所有项目内对话均可读取
指令优先级 项目指令 (Project Instructions) > 全局自定义指令 (Custom Instructions)
主要区别 普通对话是“一次性的”,Projects是“连续性的”

Projects是ChatGPT为Plus、Team和Enterprise用户打造的专属工作空间。它解决了普通对话“上下文由于新对话而丢失”的痛点,允许你将相关的聊天、文件和指令整合在一个独立的容器中。

Projects与普通对话的对比

对比维度 普通对话 项目 (Projects)
上下文范围 仅限当前这一条对话历史 覆盖项目内所有文件和指令
文件管理 每次新对话需重新上传 上传一次,所有对话永久可用
知识库 无持久知识库 支持构建专属知识库 (RAG)
适用场景 临时问答、闲聊、一次性任务 长期项目、论文写作、代码开发、产品设计

创建与配置Projects

ChatGPT从入门到精通
  1. 从侧边栏创建(推荐)
    • 点击左侧边栏的 项目 标题旁的文件夹图标。
    • 输入项目名称(如:“2025年度营销复盘”)。
    • 点击 “创建项目”。
  2. 从现有对话转化
    • 在任意一条高质量对话中,可以拖动至项目创建项目。
项目指令
ChatGPT从入门到精通

项目指令设定的提示词会自动应用到该项目下的每一个新对话中,无需重复输入。

💡 提示:项目指令的优先级高于账户设置里的“自定义指令”。

项目指令使用结构化提示词效果最好。

通用指令模板
### 角色定义
[定义 ChatGPT 在此项目中的具体职位,如:资深 Java 架构师]

### 项目背景
[简述项目目标、当前进度、关键约束]

### 回复风格要求
- 语言风格:[专业/幽默/学术/简洁]
- 格式要求:[使用 Markdown/强制列表/代码块]
- 引用规范:[必须引用项目文件中的具体段落]

### 知识库使用规则
- 优先从上传的文件中查找答案。
- 如果文件中没有相关信息,请明确告知,不要编造。
实战案例:学术论文润色
### 角色
你是指向 IEEE 期刊投稿的学术编辑。

### 背景
我正在撰写关于“大模型在医疗诊断中的应用”的论文,目标期刊是 Nature Medicine。

### 任务
检查语法错误,提升学术词汇的准确性,确保符合上传的《投稿指南.pdf》格式要求。

### 约束
修改建议需用粗体标出,保持原意不变,不要过度改写。

项目文件
ChatGPT从入门到精通

这是项目的“知识库”。

  • 支持格式:PDF, Word, Excel, Markdown, 代码文件, 图片等。
  • 容量限制:通常支持上传 10-20 个文件,单文件及总容量建议控制在512MB以内以保证检索速度。
  • 功能:ChatGPT会自动对这些文件进行索引,回答问题时会优先参考这里的内容。

ChatGPT并不是把所有文件“背下来”,而是进行“检索”。为了提高准确率:

  • 文件命名要清晰:使用 2024_Q3_财务报表.xlsx 而不是 未命名1.xlsx
  • 切分长文档:如果文档有几百页,尝试按章节拆分为较小的文件(如 第一章_绪论.pdf),有助于 AI 更精准定位。
  • 包含索引文件:创建一个项目说明.md,在里面简要概括每个文件的用途,作为AI的“指引地图”。

虽然Projects内的不同对之间不能直接互相读取聊天记录(对话B不知道对话A的内容),但它们共使用相同的知识库和指令。

操作建议:如果你在“对话 A”中得出了一个重要结论,请将这个结论整理成一个 .txt.md 文件,上传到项目的知识库中。这样,“对话 B”就能知道这个结论了。


常见配置:全栈软件开发
  • 文件API接口文档.md, 数据库结构.sql, 设计稿截图.png, 依赖包列表.json
  • 指令:设定技术栈(React + Python),规定代码风格,要求每次修改代码后提供完整的代码块。
  • 对话分组
    • Chat 1: 需求分析
    • Chat 2: 前端开发
    • Chat 3: 后端逻辑与Bug修复
常见配置:求职面试准备

指令:扮演严厉的面试官,根据 JD 和简历进行模拟面试。每次只问一个问题,等待我回答后再点评并提出下一个问题。

文件个人简历.pdf, 作品集.pdf, 目标岗位JD.txt, 公司背景调查.docx


Projects与GPTs区别

ProjectsGPTs代表了 ChatGPT 生态中两种截然不同的定制化路径:

  • GPTs“封装好的功能应用”。它侧重于行为模式的固化,通过预设指令和静态知识库,打造一个专用的垂直领域AI Agent。
  • Projects“上下文隔离的工作空间”。它侧重于数据环境的构建,通过集中管理文件和对话历史,为处理复杂、长周期的任务提供统一的背景信息。

💡 重要提示 目前,两者在系统架构上是互斥的。用户无法在Projects工作区内调用GPTs。

架构逻辑对比

1. GPTs:功能导向型

  • 定义:一个包含特定指令(Prompt)、知识库(Knowledge)和外部能力(Actions/API)的独立封装体。
  • 运行机制:类似于一个 App。用户进入该GPT,系统会自动加载预设系统指令。无论开启多少次新对话,AI 的“人设”和“规则”保持不变,但对话之间的记忆不互通。
  • 核心要素:指令逻辑。它的价值在于开发者如何调教 AI 的思维方式。
  • 分发属性:具备极强的可移植性,可发布至GPT Store或在团队内部共享链接。

2. Projects:数据导向型

  • 定义:一个聚合了特定文件集和多组对话的沙盒环境。
  • 运行机制:类似于一个项目文件夹。用户将相关文档(如 PDF、Excel、代码库)上传至Projects文件,该环境下的所有新对话均自动获得这些文件的访问权限,无需重复上传。
  • 核心要素:背景资料。它的价值在于解决长上下文的碎片化问题。
  • 分发属性:创建者可以分享给指定用户进行分享协作。

功能差异矩阵
维度 GPTs Projects
首要目标 打造工具:固化特定任务的处理流程。 管理语境:维持复杂任务的上下文连贯性。
模型调用 可锁定特定模型(如 GPT-4o 或 o1),包含特定配置。 仅支持调用标准模型,不支持加载GPTs。
知识库性质 静态参考:用于 RAG(检索增强生成),如查询规章制度。 动态工作:用于深度分析,如基于财报撰写多份报告。
外部连接 支持Actions:可配置API调用外部系统(如日历、邮箱)。 不支持:仅限于文件分析和文本生成。
指令 核心驱动:定义 AI 的角色、语气、输出格式。 辅助背景:定义该项目通用的背景信息(如“本项目请使用学术用语”)。
协作模式 通过链接分享使用权。 可共享整个工作区,成员可共同编辑文件和查看对话。

互斥与解决方案

由于底层上下文管理逻辑的冲突,Projects不支持直接集成GPTs

  • 架构冲突:GPTs依赖其独立的系统指令运行,而Projects也有自己的项目指令。如果强行融合,会导致指令优先级冲突,且知识库检索范围难以界定。

若需要在Projects中复现某个GPTs的功能(例如需要AI既懂特定的代码规范,又能读取Project里的项目文档):

  1. 提取GPTs指令:进入该GPTs的配置页面复制其指令。
  2. 配置Projects环境:进入目标Projects,将GPTs指令粘贴到项目指令。
  3. 结果:该Project内的标准模型将具备原GPTs的行为模式,同时拥有对Projects文件的全量访问权限。

何时使用何种工具

场景 A:建议使用GPTs

  • 任务具有高度重复性(例如:每天都需要将会议纪要格式化为特定的Markdown表格)。
  • 需要与外部系统交互(例如:通过API查询实时汇率或天气)。
  • 需要对外分发(例如:制作一个客服机器人给客户使用)。
  • 不需要长期记忆(每次使用都是全新开始,无需回顾上周的文件)。

场景 B:建议使用Projects

  • 任务具有长期性和复杂性(例如:撰写一部小说、开发一个软件系统、进行季度战略分析)。
  • 依赖大量特定文件(例如:需要AI交叉对比20份PDF文档的内容)。
  • 多线程对话需求(例如:在同一个项目背景下,一个对话窗口用来写大纲,另一个窗口用来润色正文,两者共享同一套资料)。
  • 团队协作(Team版用户需要让同事看到项目的所有相关资料和过往的分析记录)。

9. GPTs用法

更详细的教程请访问:GPTs从入门到精通

GPTs是OpenAI推出的自定义ChatGPT功能,允许用户创建针对特定任务的个性化 AI 助手,无需编程知识即可构建,GPTs允许免费用户访问使用,但是只有Plus、Team或Enterprise订阅用户可以创建。

访问GPTs

ChatGPT从入门到精通

点击左侧边栏的GPTs入口,就像打开了苹果App Store。你可以在这里搜索或浏览“写作、工作效率、研究与分析”等分类下的工具,每一个GPTs实际上就是一个专门解决特定问题的App

用户也可以分享了GPTs链接,直接点击即可使用:

格式:https://chatgpt/g/g-xxxxxxxx-name

创建GPTs

步骤1:进入创建界面

ChatGPT从入门到精通

点击左上角创建按钮,找到“创建”配置。

步骤2:两种创建模式

对话式创建

通过与 GPT Builder 对话来创建:

ChatGPT从入门到精通
GPT Builder: What would you like to make?

你: 我想创建一个帮助用户写周报的助手

GPT Builder: 好的!你想要创建一个专门帮助用户写周报的助手。这位助手的任务是自动化或辅助生成周报内容,还是为用户提供写作建议、结构模板等呢?

可以先明确一下这位助手的功能需求,比如:

1.自动生成周报:根据用户提供的任务进展、完成的工作和下周的计划,自动生成周报。

2.格式和模板:为用户提供标准的周报模板,帮助他们规范周报的结构。

3.写作建议:为用户提供改进周报写作风格的建议,比如让内容更简洁、清晰等。

你希望这位助手具备哪些具体功能?
手动配置

直接填写配置信息:

字段 说明 示例
Name GPT 名称 周报助手
Description 简短描述 帮你快速生成专业的工作周报
Instructions 详细指令 见下方示例
Conversation starters 对话开场白 “帮我写本周周报”
Knowledge 上传知识文件 PDF、TXT、文档等
Capabilities 功能开关 网页搜索、画布、图像生成、代码解释器和数据分析
Actions API连接 自定义API调用

步骤3:编写指令(核心)

# 角色定义
你是一位专业的周报撰写助手,擅长帮助职场人士撰写清晰、专业的工作周报。

# 工作流程
1. 首先询问用户本周完成的主要工作
2. 了解遇到的困难和解决方案
3. 询问下周计划
4. 生成结构化的周报

# 输出格式
## 本周工作总结
- 完成事项 1
- 完成事项 2

## 遇到的问题及解决方案
...

## 下周工作计划
...

# 注意事项
- 语言简洁专业
- 突出工作成果
- 量化数据优先

步骤4:添加知识库(可选)

支持的文件格式:
✅ PDF
✅ TXT
✅ DOCX
✅ CSV
✅ JSON
✅ 图片文件

上传方法:
1. 在”配置”页面找到 “知识”
2. 点击”上传文件”
3. 选择相关文件

步骤5:配置模型

模型 特点 适用场景
GPT-4o 平衡型,速度快,多模态 日常对话、通用助手、图像理解
GPT-5 Instant 快速响应,成本低 简单任务、高频交互、客服类
GPT-5 Thinking 深度推理,会”思考” 复杂分析、数学、编程、逻辑题
GPT-5.1 最新基础版 通用任务,比4o更强
GPT-5.1 Instant 5.1的快速版 需要新能力但要求速度的场景
GPT-5.1 Thinking 最强推理能力 最复杂的推理、研究、专业分析

选择建议

ChatGPT从入门到精通

🟢 选「无推荐」- 让用户自己选

  • 你的GPTs是通用工具
  • 不确定用户具体需求

🟢 不建议选择GPT-4o、GPT-5 Instant、GPT-5 Thinking模型

  • 相比其它模型能力欠缺

🟢 选GPT-5.1

  • 适合通用任务

🟢 选GPT-5.1 Instant

  • 客服/FAQ类应用
  • 简单问答、快速检索
  • 高频使用、控制成本

🟢 GPT-5.1 Thinking

  • 数学/编程/逻辑类 GPT
  • 需要分步推理的任务
  • 专业分析、复杂决策

简单决策流程

你的 GPT 需要深度思考吗?
├── 是 → Thinking系列
│        └── GPT-5.1 Thinking
│        
└── 否 → 
    ├── 要快/简单任务?→ GPT-5.1 Instant
    └── 要平衡/多模态?→ GPT-5.1

步骤6:勾选功能

☑️ 网页搜索 – 允许搜索网络信息
☑️ 画布 – 允许调用画布功能
☑️ 图片生成 – 允许调用DALL·E生成图片
☑️ 代码解译器和数据分析 – 允许分析数据和执行数学运算

步骤7:预览和测试

右侧预览窗口可以实时测试你的GPTs
建议测试场景:
– 正常使用流程
– 边界情况
– 错误输入处理

步骤8:保存和发布

点击右上角”创建”按钮

发布选项:
🔒 仅自己可用
🔗 有链接即可访问
🌐 公开到GPT Store


高级功能:添加Actions

操作也就是Actions,通常指的是模型可以执行的各种功能或任务。这些Actions 允许GPTs在处理文本请求时执行更复杂的操作,而不仅仅是生成文本。

  • 具体作用包括:
    • 数据检索:允许模型从外部源或内置的数据库中检索信息,如查找天气预报、新闻更新或专业文章。
    • 用户交互:在与用户的对话中,模型可以执行设置提醒、发送邮件或者更新日历事件等交互性操作。
    • 调用 API:可以配置调用第三方 API,以获取或处理数据。例如,调用地图 API 以提供导航指导或调用翻译 API 来翻译文本。

Actions使得GPTs不只是简单的聊天机器人,而是能够执行多种任务的智能助手。通过这些功能,GPTs 能够在多种应用场景中提供更多服务,从而更全面地满足用户的需求。

这一部分比较复杂,具体教程请访问GPTs从入门到精通


实战案例:创建「面试助手

【名称】
AI面试教练

【描述】
帮你准备技术面试,模拟真实面试场景,提供专业反馈

【指令】
# 角色
你是一位资深的技术面试官,有 10 年大厂面试经验

# 功能
1. 根据用户目标岗位生成面试题
2. 模拟真实面试对话
3. 对回答给出评分和改进建议

# 流程
1. 询问目标公司和岗位
2. 询问准备面试的类型(技术/行为/系统设计)
3. 开始模拟面试
4. 面试结束后给出总结报告

# 评分标准
- 技术准确性(40%)
- 表达清晰度(30%)
- 思维逻辑性(30%)


【对话开场白】
- "我要面试 Google 的 SDE 岗位"
- "帮我准备行为面试"
- "模拟一场系统设计面试"

【推荐模型】
GPT 5.1

GPTs使用技巧

💡 Prompt优化技巧

好的指令应包含:

1. 【角色定义】明确 GPT 的身份和专长
2. 【任务说明】详细的工作流程
3. 【输出格式】期望的回复结构
4. 【限制条件】不应该做什么
5. 【示例】具体的对话示例

常见问题

Q1: 免费用户能使用GPTs吗?

✅ 可以使用他人创建的公开GPTs
❌ 不能创建自己的GPTs

Q2: 知识文件大小限制?

单个文件:最大512MB
总容量:根据订阅等级有所不同

Q3: 如何提高GPTs的回复质量?

1. 指令写得越详细越好
2. 提供具体示例
3. 上传相关知识文档
4. 反复测试并迭代优化

正文完
 0
评论(没有评论)