Gemini Pro
Google 上下文窗口: 1,000,000 tokens
Prompt 风格
Gemini 拥有超长上下文窗口(1M tokens),适合处理大量文档。对多模态输入(文本+图片+视频)支持良好。Prompt 风格偏向简洁直接,对过度复杂的指令可能表现不稳定。
模型特性
- 1M token 上下文窗口,适合超长文档处理
- 多模态能力强,可以混合文本和图片指令
- 对简短直接的指令响应更好
- Safety 过滤较严格,某些话题可能被拒绝
- 对 Grounding(基于搜索结果)有原生支持
最佳实践
- 利用超长上下文直接放入完整文档,减少 RAG 复杂度
- 多模态任务中,图片描述要与文本指令配合
- 使用 Google Search Grounding 获取实时信息
- 保持指令简洁,避免过度嵌套的结构
- 对于代码任务,指定编程语言和框架版本