首页 > 其他分享 >[AI Google] 使用 Gemini 取得更多成就:试用 1.5 Pro 和更多智能功能

[AI Google] 使用 Gemini 取得更多成就:试用 1.5 Pro 和更多智能功能

时间:2024-06-10 10:32:12浏览次数:12  
标签:1.5 Google AI Pro Gemini 上下文 Advanced

总结

Google 正在为超过 35 种语言的 Gemini Advanced 订阅者推出 Gemini 1.5 Pro。此次更新包括 100 万个 token 的上下文窗口、改进的数据分析功能和增强的多模态图像理解。新功能包括用于自然对话的 Gemini Live、先进的规划工具和可定制的 Gems。更新还集成了更多 Google 应用,如 Google Calendar、Tasks 和 Keep,以提供无缝的用户体验。


我们将 Gemini 1.5 Pro 推广到超过 35 种语言的 Gemini Advanced 订阅者,并提供 100 万个 token 的上下文窗口、全新的对话体验和让 Gemini 代表你采取行动的工具。

在黑色背景上的 Gemini 标志,上方是手机屏幕和计算机屏幕的轮廓。计算机屏幕上的文字为:“你好,Lisa。今天我能帮你做什么?”

Gemini 旨在成为你的个人 AI 助手——一个既能对话、直观又有帮助的助手。无论你是在应用中还是通过网络体验使用它,Gemini 都能帮助你处理复杂的任务,并可以代表你采取行动。

现在,我们正在进行多项更新——包括更长的上下文窗口、新的数据分析功能、与其他 Google 应用的连接以及更多可定制选项——让你能够与最智能和最个性化的 Gemini 合作。

使用世界上最长的上下文窗口分析文档

今天我们将我们最前沿的模型 Gemini 1.5 Pro 带到 Gemini Advanced。短短三个月内,已有超过 100 万人注册试用 Gemini Advanced。现在,Gemini 1.5 Pro 为你带来了我们最新的技术进步,包括一个大大扩展的上下文窗口,起始值为 100 万个 token——这是世界上任何广泛可用的消费聊天机器人中最长的上下文窗口。如此长的上下文窗口意味着 Gemini Advanced 可以理解多个大型文档,总计可达 1500 页,或总结 100 封电子邮件。不久它还将能够处理一小时的视频内容或超过 30,000 行代码库。

为了利用这个长上下文窗口,我们增加了通过 Google Drive 或直接从设备上传文件的功能,直接上传到 Gemini Advanced。现在,你可以快速获得关于密集文档的答案和见解,比如弄清楚你租赁协议中的宠物政策详情或比较多篇长篇研究论文的关键论点。不久,Gemini Advanced 将作为数据分析师,揭示见解并根据上传的数据文件(如电子表格)即时构建自定义可视化和图表。

Gemini 会将你的文件私密保留,不会用于训练我们的模型。

Gemini 原生是多模态的,1.5 Pro 在图像理解方面带来了巨大的改进。例如,你可以拍下你最喜欢的餐厅的一道菜,并请求获得食谱,或者拍下数学题并获取分步解题指南——这一切都只需通过一张图片。

Gemini 1.5 Pro 将在超过 150 个国家和 35 种语言中向 Gemini Advanced 订阅者提供。

使用 Gemini Live 进行更自然的对话

我们还增加了与 Gemini 更自然互动的新方式,无论你是在发短信还是在说话。通过 Google Messages 中的 Gemini,你现在可以在与朋友聊天的同一应用中与 Gemini 聊天。

在未来几个月内,我们将推出 Live 给 Gemini Advanced 订阅者,这是一种使用我们最先进的语音技术的新移动对话体验,使与 Gemini 交谈更为直观。使用 Gemini Live,你可以与 Gemini 交谈,并选择其回应的多种自然声音之一。你甚至可以以自己的节奏说话,或在回答中途打断以提出澄清问题,就像你在任何对话中一样。

假设你正在准备一场工作面试:只需开启 Live 并请 Gemini 帮助你准备。Gemini 可以与你排练,甚至建议在与潜在雇主交谈时突出哪些技能。今年晚些时候,当你使用 Live 时,你可以使用相机,开启关于你周围环境的对话。

简化复杂计划,如旅行行程

有时你花更多的时间研究和组织旅行,而不是享受旅行本身。Gemini Advanced 的新规划体验将不仅仅展示一系列建议活动,而是为你创建一个自定义行程。

想象一下你问 Gemini:“我的家人和我要去迈阿密过劳动节。我的儿子喜欢艺术,我的丈夫非常想要新鲜的海鲜。你能从 Gmail 中提取我的航班和酒店信息并帮我规划周末吗?”

这个提示要求 Gemini 做的不仅仅是提供其他聊天机器人那样的公开信息。Gemini 会考虑你的航班时间、餐饮偏好和当地博物馆的信息,同时还会理解每个地点的位置以及每个活动之间的旅行时间。它会从 Gmail 中提取你的航班信息,使用 Google Maps 推荐酒店附近的餐厅和博物馆,并使用搜索推荐其他活动,如设计区的步行游览或海滩时间,以填补你的一天剩余时间。它会为你合成所有这些信息,并创建一个满足你所有要求的个人定制行程。如果你做出更改或添加更多详细信息,行程将自动更新。

这种动态的新规划体验将在未来几个月内推出给 Gemini Advanced。

使用 Gems 个性化你的 Gemini

为了获得更加个性化的体验,Gemini Advanced 订阅者很快将能够创建 Gems——Gemini 的自定义版本。你可以创建任何你梦想中的 Gem:健身伙伴、副厨师、编程伙伴或创意写作指导。设置也非常简单。只需描述你希望你的 Gem 做什么以及你希望它如何回应——例如“你是我的跑步教练,给我制定每日跑步计划,并保持积极、乐观和激励人心。”Gemini 将接受这些指示,并通过一次点击,增强这些指示以创建一个满足你特定需求的 Gem。

连接更多 Google 应用

去年,我们将 Extensions 直接引入 Gemini,让你能够通过你已经使用的 Google 应用和服务完成更多事情。我们继续将 Google 应用引入 Gemini,例如现在推出的 YouTube Music Extension。通过 Gemini,你可以搜索你最喜欢的音乐,即使你不知道歌曲标题,只需提及喜欢的歌词或特色艺术家。

很快,我们将把更多的 Google 工具与 Gemini 连接,包括 Google Calendar、Tasks 和 Keep。这样你就可以做更多事情,例如拍下你孩子的学校课程表,并请求 Gemini 为每项作业创建日历条目,或拍下新食谱并将其添加到你的 Keep 购物清单中。

通过这些更新,其中许多也将提供给我们的企业客户,你将获得最个人化和最有帮助的 Gemini 体验——只需一个提示。

请关注这些新功能,并立即开始与 Gemini 聊天。


标签:1.5,Google,AI,Pro,Gemini,上下文,Advanced
From: https://blog.csdn.net/mahone3297/article/details/139573955

相关文章

  • 多商家AI智能名片O2O商城系统小程序中的市场细分策略
    摘要:随着数字化与智能化的浪潮不断推进,多商家AI智能名片O2O商城系统小程序已成为连接线上线下的新型商业模式。在这种模式下,市场细分策略显得尤为重要,它能帮助企业更精准地触达目标用户,提升营销效率和用户黏性。本文将从市场细分的角度出发,探讨如何在多商家AI智能名片O2O商城......
  • ollama qwen2 运行&openai 兼容api 测试
    qwen2模型已经发布了,各种新闻都说很不错,所以通过ollama测试下安装ollamaclicurl-fsSLhttps://ollama.com/install.sh|sh启动服务ollamaserve拉取qwen2:1.5b模型使用了api模式clicurl-XPOSThttp://localh......
  • 99AI v3.4.0开发版 基于nineai二开 可商用ChatGPT 无后门
    简介开发版v3.4.0后台-系统管理-基础配置新增【隐藏侧边菜单】选项,开启隐藏后用户端将不显示侧边菜单后台-套餐管理-积分显示新增【积分显示设置】,可自定义是否显示各种积分以及自定义名称后台-模型管理-模型全局配置新增【继承对话模型】选项,开启后,新建对话将......
  • 读AI未来进行式笔记01深度学习
    1.      AI1.1.        AI已经发展成一门涵盖许多子领域的重要学科1.2.        机器学习是迄今为止AI应用最成功的子领域1.2.1.          在这个领域中,最大的技术突破就是深度学习1.3.        “人工智能”“机器学习”和“......
  • 读AI未来进行式笔记03自然语言处理技术
    1. AI伙伴1.1. 作为AI能力的集大成者,AI伙伴融合了各种复杂的AI技术1.2. 人类唯一可能超越AI的领域,只可能在机器无法触及之处,那是属于人类感性与直觉的领域1.3. 要读懂人类,需要漫长而平缓的学习过程1.4. AI塑造了我们,我们反过来也塑造了AI1.5. AI的“思考模式”与人......
  • 博物馆展览与服务一体化平台的设计与实现(论文+源码)_kaic
     摘 要博物馆展览与服务一体化,其工作流程繁杂、多样、管理复杂与设备维护繁琐。而计算机已完全能够胜任博物馆展览与服务一体化工作,而且更加准确、方便、快捷、高效、清晰、透明,它完全可以克服以上所述的不足之处。这将给查询信息和管理带来很大的方便,从而给博物馆展览与服......
  • AI菜鸟向前飞 — LangChain系列之十七 - 剖析AgentExecutor
    AgentExecutor顾名思义,Agent执行器,本篇先简单看看LangChain是如何实现的。    先回顾AI菜鸟向前飞—LangChain系列之十四-Agent系列:从现象看机制(上篇)AI菜鸟向前飞—LangChain系列之十五-Agent系列:从现象看机制(中篇)一个Agent的“旅行”AI菜鸟向前飞—Lang......
  • [AIGC] 字典树Trie树详解及其Java实现
    字典树,也称为Trie树或前缀树,是一种常见的搜索数据结构,广泛应用于字符串查询的场景中,比如网络词典的实现,或者是搜索引擎中词语的自动补全。文章目录Trie树的概念Trie树特性Trie树的操作插入操作查询操作Java实现Trie树Trie树的概念Trie树是一种特别的n叉树模型......
  • OpenAI 推出适用于 .NET 的 OpenAI 库
    微软宣布面向.NET开发人员官方OpenAI库。OpenAI库支持完整的OpenAIAPI和OpenAI的最新旗舰模型GPT-4o,该模型可以实时推理音频、视觉和文本。OpenAI.NETAPI库目前提供第一个测试版,可通过NuGet 访问。OpenAI.NETAPI库是微软与OpenAI合作的成果,它提供了从.N......
  • [AI资讯·0609] SamAltman建立了庞大投资帝国,通义千问Qwen2发布即爆火,OpenAI泄密者公
    AI资讯奥特曼28亿「投资帝国」曝光!不要OpenAI股份,当CEO最不赚钱开源超闭源!通义千问Qwen2发布即爆火,网友:GPT-4o危OpenAI泄密者公布165页文件:2027年实现AGI、计算集群将耗资千亿美元清华系细胞大模型登Nature子刊!能对人类2万基因同时建模奥特曼百万年薪挖角谷歌TPU人才,欲砸7万......