Google Gemini 是谷歌推出的 下一代多模态人工智能系统,由 Google AI 和 DeepMind 联合开发。它不仅是大型语言模型(LLM),还能理解和生成 文本、图像、音频、视频、代码 等内容。Gemini 的目标是将 AI 深度集成到日常工具和服务中,为用户提供智能化、个性化的体验。
多模态能力
能同时处理文本、图像、音频和视频输入。
支持生成内容和理解复杂多模态信息。
版本与功能
Nano:高效轻量,适合设备端任务。
Pro:面向复杂对话和办公任务。
Ultra:最强版本,处理高级推理、研究和多媒体生成。
集成应用
已逐步融入谷歌搜索、Gmail、Docs、Maps、Android 等产品。
可以替代 Google Assistant,在任务规划、信息检索和个性化服务上提供支持。
高级功能
Gemini Advanced:付费版,支持长文档上下文、多媒体生成和深度分析。
Gemini Live & Voice:支持实时语音交互。
个人智能(部分地区测试):可利用用户授权的谷歌数据提供个性化建议。
自动化/代理功能:部分版本能执行应用操作或自动化任务(需关注隐私)。