派早报:大疆发布扫拖机器人 ROMO 2 系列等

发布于 19 天前


Google 日前宣布扩展 Google Gemini API 中的文件搜索功能,为开发者带来更加完整的多模态检索增强生成(RAG)能力,此次更新的核心包括:支持图像与文本混合检索、支持自定义元数据过滤、新增页面级引用支持,提升 AI 系统在企业知识库、文档问答以及智能体等场景中的可访问性和准确性。根据 Google 官方博客介绍,新版文件搜索功能已经不再局限于传统文本向量搜索,而是基于 Gemini Embedding 2 构建的统一多模态嵌入能力,可以同时理解图片、PDF、文档中的视觉内容与文字内容,开发者无需自行搭建复杂的向量数据库、Embedding 管线或文档切分系统,就可以直接在 Gemini API 中完成完整的 RAG 工作流。自定义元数据过滤功能可以为上传的文件增加标签、分类、时间和部门等元数据,以便在后续进行检索时按照元数据进行过滤提升准确率和效率。页面级引用功能允许 Gemini 在生成答案时可以明确标注信息来自哪一页文档,而不仅仅是模糊地引用整个文件。所有新功能已全部上线。来源

📎 本文转载自 原文链接