本教程由 THEAI 教程 Rainy 原创,希望能够对您有所帮助,作者微信号:cntheai。

1. 入门教程
1.1 Gemini简介
软件名称 | Gemini | 软件语言 | 英文、中文、日语等多种语言 |
上线时间 | 2023年12月6日 | 最近更新时间 | 2025年6月5日 |
引擎 | Gemini语言模型 | 许可协议 | 专有 |
编程语言 | 网站 | https://gemini.google.com |
Google Gemini 是 Google 开发的一系列多模态人工智能模型,旨在处理多种类型的数据,包括文本、图像、音频和视频。它不仅仅是一个大型语言模型(LLM),更是一个强大的生成式AI聊天机器人,可以理解和生成不同形式的内容。
以下是 Gemini 的一些主要特点和功能:
- 多模态能力: Gemini 能够理解、操作和结合不同模态的信息。这意味着你可以向它输入文本、图片、甚至音频和视频,并获得相应的输出。例如,你可以上传一张图片并提问关于图片内容的问题,或者上传一段视频让它总结关键信息。
- 强大的推理和编码能力: Gemini 在推理和编码方面表现出色,能够帮助用户进行复杂的思考、解决问题,并生成高质量的代码。它甚至可以在各种IDE(如VS Code、JetBrains IDEs、Android Studio)中提供代码补全和生成。
- 深入研究和信息总结: Gemini 可以通过“深度研究”功能帮助用户快速筛选大量信息,分析数百个网站,并在几分钟内生成全面的报告。它还可以总结文本内容,甚至处理长达1M tokens(约1500页)的大型文件。
- 个性化AI助手: Gemini 可以作为你的个性化AI助理,帮助你进行头脑风暴、练习面试问题、撰写草稿、创建学习计划、总结主题、生成测验等。
- 与其他Google应用的集成: Gemini 与 Google 生态系统深度集成,可以连接到你的Gmail、Google日历、Google地图、YouTube和Google相册等应用,帮助你无需切换应用就能完成任务。
- 自定义专家(Gems): 通过“Gems”功能,你可以保存详细的指令并上传文件,来创建自己的自定义AI专家,例如职业教练、头脑风暴伙伴或编码助手。
- 生成式AI能力: 除了文本生成,Gemini 还可以生成图片和视频。你可以通过描述来生成高质量的图片,甚至创建8秒的视频。
- 语音交互: 通过 Gemini Live,你可以进行语音对话,进行头脑风暴、练习口语,或者讨论你上传的文件或照片。
Gemini 不断发展,Google 也持续推出新的模型版本(如 Gemini 2.5 Flash 和 Pro),以提供更强大、更高效、更安全的AI能力,并将其应用到更多的产品和服务中,例如 Google Cloud、Google Workspace 等。
目前,Gemini 不对中国地区(包括港澳台)提供服务,中国地区需要科学上网才能访问。
1.2 注册/登录
Gemini 支持谷歌账户直接登录,中国大陆地区可使用大陆地区手机号接受验证码注册。

1.3 收费标准
-
- Gemini 采用 1.0 Pro 模型,目前免费
-
- Gemini Advanced 采用 1.5 Pro 模型,目前绑定国外信用卡可以免费试用2个月。

我绑定的Dupay虚拟信用卡,实测可以成功绑定。

2.进阶教程
2.1 Gemini Advanced与ChatGPT Plus对比
正文完