
它也是目前全球最顶尖的AI工具之一,出图、写文案、分析视频、写代码,统统不在话下。
不讲虚的,我直接把这篇《全网最全Gemini使用指南》送给你。
包含Gemini的来头、Gemini最常用的几大功能和应用场景、以及怎么低成本用上Gemini。
放心,不难,能学会!

不管你是想做副业、做自媒体,还是单纯想早点下班,这篇文章建议先收藏,再细看。
一、 Gemini 是个什么来头?
简单说,Gemini是谷歌为了在AI战场上一雪前耻,把家底掏空做出来的最强AI模型。
这背后有个小故事,可能很多人都不知道,2023年ChatGPT4.0刚出来时,震惊全球,谷歌内部就拉响了红色警报,觉得要落后了。
为了赢回这一局,谷歌做了一个疯狂的决定,把Google Brain和 DeepMind这两个世界顶尖的AI团队合并了,只为了打造一个产品。
这个产品就是Gemini。
为什么叫Gemini?
Gemini 是拉丁语“双子座”的意思,既代表了谷歌两大顶尖实验室的合体,也象征着它拥有双重能力,既能像人一样理解世界,因为它是个多模态模型,又能像计算机一样严谨推理,具备顶尖的代码能力。
二、Gemini 能帮你干什么?
作为一人公司的实践者,我其实不想太过于去关心参数,我只关心它能帮我省多少时间,搞多少钱,文章后面会有保姆级实操,一定要看到最后。
- 基础功能
- 智能对话: 聊天、写方案策划、练口语、写周报、开发工具,这些是基本。
- 图片/视频理解: 你丢一个视频给它,它能告诉你第3分20秒发生了什么。
- 超长文档分析: 你可以直接把几百页的行业报告、甚至一整套代码库扔进去,它都能高效消化完。
与其他AI相比,它无可替代的2个特点
第一,原生多模态。
很多普通AI是把图片转成文字,再理解文字,中间会丢失信息,Gemini它看到的图片就是图片,看到的视频就是视频。
它的视觉理解能力,目前是处于第一梯队的。
第二,谷歌全家桶生态。
你在Gemini里可以直接调用生图模型nanobanana、生成视频模型Veo3.1,还可以畅玩爆火的NotebookLM。

三、 3个典型的应用场景(学完这3个超过99%的人)
Gemini上面很多很多功能,我就分享我自己最常用的三个,你能掌握这3个,就超过99%使用Gemini的人了。
1、在Gemini上面搭建各种各样的智能体。
什么叫智能体呢?
你可以理解为帮你完成某个特定任务的AI助手,或者你可以把它理解帮你干活的一个一个员工。
比如帮你专门写标题的AI助手
帮你专门画手绘图的AI助手
帮你专门做表情包的AI助手
帮你专门写公众号文章的AI助手。
…
学会这个,你就可以拥有全球最强的数字军团。
下面这个图就是我在Gemini上搭建过的智能体,我只需要点开某一个智能体,它就能帮我快速完成相应的任务。

那么在Gemini上面如何搭建智能体呢?
这就需要用到Gemini里的一个功能:Gem
它在Gemini官网左上方,点击Gem就可以去创建智能体。

点进去之后,我们能看到有一个【Gem管理器】,它下面有谷歌为我们预先创建好的4个智能体,我们是可以直接用的。

在往下有一个【我的Gem】,右侧有个【新建Gem】的按钮,也就是新建智能体的按钮。

在gemini上面搭建智能体非常简单,完全不需要懂代码、不需要懂英语,会说话或者打字就行。
反正比在扣子、n8n、Dify上搭建智能体简单多了。
只需要填写4个信息,就可以搭建好。
1、智能体名称
2、智能体说明
3、智能体的指令(即提示词)
4、知识库(非必选项)
如下图所示👇 左侧是信息填写界面,右侧是预览和测试界面,填好信息,测试完没问题后,就可以点击右上角保存按钮,就算搭建完成了。

我们来实测一下,比如我们来搭建一个【朋友圈文案转手绘图】的智能体,【指令】模块的提示词如下:
# Role: 视觉思维引导师 (Visual Facilitator)
## Mission
将输入的文本信息转化为直观、极简的「视觉化笔记(Sketchnote)」。重点在于通过视觉层级降低认知负荷,让信息一目了然。
## Design Guidelines
1. **视觉风格**:
– 采用纯粹的**手绘草图风格 (Hand-drawn Sketch)**,模拟马克笔或彩铅在白纸上的质感。
– **线条美学**:线条需流畅、圆润且极简,拒绝任何3D渲染、拟物化或照片级写实,严禁使用阴影和渐变色。
– **构图逻辑**:采用散点或流程构图,元素分布需饱满且均衡,避免视觉重心过度集中。
2. **内容处理**:
– **核心提取**:识别文本中的“关键动作/角色/结果”,将其转化为视觉节点。
– **层级排版**:
– **Level 1 (主标题)**:使用艺术化手写体,字号最大,视觉冲击力强。
– **Level 2 (关键节点)**:字号至少比主标题小一级,确保主次分明。
– **图文关系**:图像为主,文字为辅。文字仅作为标签存在,保持中文书写准确。
3. **色彩规范**:
– 背景:**#FFFFFF 纯白背景**(便于后期处理)。
– 主色:深黑色/炭灰色勾勒轮廓。
– 辅色:仅使用1-2种高亮色(如荧光黄、绯红)用于强调重点。
4. **输出规格**:
– 比例:4:3
– 效果:清晰、高对比度、信息图表化。
## Workflow
读取内容 -> 提炼逻辑链条 -> 映射为手绘图标 -> 输出极简手绘图。
在搭建页面填写好名称、说明、提示词信息,然后点保存,如下👇

搭建好后怎么用呢?比如我想要把我下面这个朋友圈转成手绘图,应该怎么做呢?
直接把文案复制发给这个搭建好的智能体,它就可以在10秒钟内生成好看的手绘图,测试结果如下👇

我把它下载下来,会更清晰,如下👇怎么样?

图文并茂,中文字完成准确,这样的图放在以前人工去画,真不知道要废多少时间啊!!
再贴一些其他的效果图看看👇非常精美,用于文章配图都非常好


如果是更复杂更长的朋友圈文案也完全没问题的,智能体完全能处理。
或者你想做生成小红书图文的、各种各样的智能体都可以,我这里只是以朋友圈文案转手绘图智能体为例。

2、在Gemini上面生成图片
Gemini里面可以直接调用nanobanana生图模型,nanobanana是圈内公认的最强的AI绘画工具,对于文字处理能力非常强,出来的中文字不会乱码。
我们可以用它做很多很多事情,我就以做海报举例。
起因是我在两周前做了一个跨年的内部直播,然后我想出一些海报,我全部都是用Gemini来搞定的。
大家可以先看一下海报的效果图,我让Gemini做了两张,一张是商务风格的,一张是插画风格的,感觉如何?

给大家贴一下我和Gemini的对话过程截图,如下,基本上都是直出的,没有抽卡,图中没有一个乱码的错别字。



真正实现了用嘴做设计。
我觉得,AI不会淘汰顶尖的设计师,也就是那些能创造全新视觉语言的人,但它一定会淘汰美工,就是那些只会套模板、做排版的人。
作为一人公司,如果你今天想要得到自己想要的海报,你有以下两个选择,你会选择哪个呢?
第一,找专业设计师设计,他给你一张 95分 的完美海报,但需要 3天 时间,花费 500~1000元。
第二,找AI设计,给你一张 85分的合格海报甚至90分以上海报,只需要 30秒,花费0元。
对于我们这种需要经常做内容、做直播、做私域运营的一人公司来说,又快又好永远比慢工出细活更重要。
3、让Gemin帮你分析视频。
让Gemini帮你提修改意见,相当于请了一个顶级的短视频编导。
比如我让它帮我们分析我们的短视频怎么优化,它连第几分第几秒都帮你分析出来了,给到很专业的分析和建议。
以下是我和Gemini对话的过程截图👇


四、 如何开始使用?(保姆级入口)
正常情况下,Gemini pro订阅费是 $19.99/月,约合人民币 145元/月,但是!Google目前针对美国大学生有一个隐藏福利,可以免费试用 12 个月。
这意味着,如果你拥有这个资格,你一年能省下近 1700 元人民币。
虽然这个学生福利很香,但我不建议你自己去注册,难度极高,成功率极低。
咱们做一人公司,时间最值钱,不要为了省那几十块钱,花一整天去折腾技术。
可以去某宝或者某鱼上直接买Gemini pro成品号,也就几十块钱,能用一整年Gemini会员,能用谷歌全家桶,真的太香了。
当然,这一切的前提是要解决环境的问题。
如果你已经有了Gemini会员,那么可以按照下面这个方式去访问。
第一种方式:访问Google Gemini官网
gemini.google.com

第二种方式:访问Google Al Studio
https://aistudio.google.com/apps

五、 使用Gemini时的2点建议
1.关于幻觉
Gemini 虽然强,但它偶尔也会一本正经地胡说八道。如果是写医疗建议、或者引用具体的历史数据,一定要人工核查,AI 是副驾驶,方向盘还得在你手里。
2.别做工具的奴隶
我看到很多人,会陷入到AI信息焦虑,今天测那个AI,明天又测那个AI,测完之后呢?
业务没有任何增长,我们一定不要拿着锤子找钉子,而是为了钉钉子而去找锤子。