在代理型 AI 热潮持续升温之际,企业检索增强生成 (RAG) 依然扮演着至关重要的角色。近日,紧抓市场对代理日益增长的兴趣,专注于企业级 AI 应用的 Cohere 发布了其最新嵌入模型 Embed 4。该模型在 Embed 3 的多模态能力基础上进行了显著增强,尤其在处理非结构化数据方面表现突出,并拥有高达 128,000 个 token 的超长上下文窗口,理论上能够为约 200 页的文档生成嵌入。
性能跃升:更长上下文与多模态增强
Cohere 在官方博客中指出,现有嵌入模型在理解复杂的多模态企业数据方面存在天然缺陷,导致企业需要进行繁琐的数据预处理才能获得有限的准确性提升。Embed 4 的出现旨在解决这一痛点,助力企业及其员工高效挖掘隐藏在海量、难以搜索信息中的关键洞察。
企业级应用:安全高效,适用多种场景
据介绍,企业可以在虚拟私有云或内部技术堆栈上部署 Embed 4,以增强数据安全性。通过生成嵌入,企业能够将各类文档或其他数据转化为 RAG 用例所需的数值表示,供 AI 代理在响应用户提示时进行参考,从而提高答案的准确性,避免“幻觉”现象。
Embed 4 声称在金融、医疗保健和制造业等监管严格的行业表现出色。Cohere 强调,该模型充分考虑了受监管行业的安全需求,并对企业级应用有着深刻的理解。此外,Embed 4 经过“嘈杂的现实世界数据”训练,即使面对企业数据中常见的拼写错误和格式问题,依然能够保持较高的准确性。更值得一提的是,该模型在搜索扫描文档和手写文件方面表现优异,无需复杂的预处理流程,显著节省了企业的时间和运营成本。Embed 4 的应用场景广泛,涵盖投资者演示、尽职调查文件、临床试验报告、维修指南和产品文档等。与之前的版本一样,该模型支持超过 100 种语言。
Cohere 的客户 Agora 已在其 AI 搜索引擎中采用 Embed 4,并发现该模型能够有效展示相关产品。Agora 创始人 Param Jaggi 表示,电商数据复杂,包含图像和多方面文本描述,而 Embed 4 能够以统一的嵌入形式呈现产品,从而加快搜索速度并提高内部工具的效率。
赋能代理:提升准确性与效率
Cohere 认为,Embed 4 等模型将极大地改善代理的应用场景,并有望成为企业级代理和 AI 助手的“最佳搜索引擎”。该公司强调,Embed 4 不仅在跨数据类型的准确性方面表现强大,还具备企业级的效率,能够扩展以满足大型组织的需求,并能创建压缩数据嵌入以降低存储成本。
值得关注的是,Qodo 的 Qodo-Embed-1-1.5B 和 MongoDB 近期收购的 Voyage AI 的模型也属于 Embed 4 的竞争对手。
发评论,每天都得现金奖励!超多礼品等你来拿
登录 在评论区留言并审核通过后,即可获得现金奖励,奖励规则可见: 查看奖励规则