内容持续更新中
北京智谱华章科技有限公司近期宣布,将旗下GLM-4-Flash大型语言模型的API接口免费向公众开放,以推动大型模型技术的普及和应用。 GLM-4-Flash模型在速度和性能上都展现出显著的优势,特别…
最近的一项分析显示,越来越多的美国财富500强公司在财务报告中提到了生成性人工智能(AI),不过提到的内容并不全是积极向上的。 根据 Arize 的研究,自2022年以来,这类提及的数量增加了250%…
最近,一项新研究令人振奋,证明了大型语言模型(LLM)可以通过搜索功能来显著提升性能。特别是,参数量仅8亿的 Llama3.1模型经过100次搜索,竟然在 Python 代码生成的任务上与 GPT-4…
8月14日,Anthropic公司宣布为其Claude系列大型语言模型推出一项名为"提示缓存"的新功能,声称能大幅降低企业使用AI的成本,同时提升性能。但这项功能究竟是否能如公司所…
最近,加州大学伯克利分校的一项研究显示,由大型语言模型(LLM)进行的自动提示修改,会显著降低 DALL-E3生成图像的质量。该研究对1,891名参与者进行了一项在线实验,目的是探讨这种自动重写对图像…
近日,AI界的知名研究员Andrej Karpathy抛出了一个颇具争议的观点,他认为目前广受推崇的基于人类反馈的强化学习(RLHF)技术可能并非通往真正人类级别问题解决能力的必由之路。这一言论无疑给…
在这个智能设备无处不在的时代,我们渴望让手机、平板、甚至是智能家居设备拥有更强大的智能处理能力。但是,这些边缘设备的硬件资源有限,特别是内存和计算能力,这限制了大型语言模型(LLMs)在它们上面的部署…
最近,一个名为 “Twitter Personality” 的 AI 代理爆火,上线12天时间吸引400万用户,因为用户只需要输入推特账号名称即可分析推特人格。 这款由 Wordware 开发的工具,…
近日,阿里云重磅推出了Qwen2-Math系列大型语言模型,这一专注于数学领域的AI新秀一经亮相就引发了业界的广泛关注。 作为Qwen2系列的最新成员,Qwen2-Math和Qwen2-Math-In…
在现代科技飞速发展的今天,人工智能尤其是大型语言模型(LLMs)正逐渐成为焦点。然而,美国的网络安全法律似乎跟不上这个快速变化的领域。最近,哈佛大学的一组学者在黑帽大会上指出,现行的《计算机欺诈和滥用…
在自然语言处理领域,长语境理解一直是一个挑战。尽管大型语言模型(LLMs)在多种语言任务上表现出色,但它们在处理超出其上下文窗口大小的文本时常常受限。为了克服这一限制,研究者们一直在努力提升LLMs对…
在当今时代,自然语言处理(NLP)领域发展迅速,大型语言模型(LLMs)能够高精度地执行复杂的语言相关任务,为人机交互带来了更多可能。然而,NLP 中存在一个显著问题,那就是模型评估对人类注释的依赖。…
Groq在最新一轮融资中成功募集6.4亿美元,由全球最大资产管理公司BlackRock Inc.的基金领投,同时获得了科技巨头思科和韩国电子巨擘三星投资部门的鼎力支持。 这轮融资让Groq的估值一举飙…
在当今数字化的时代,搜索引擎的重要性不言而喻。而现在,有一款名为 MindSearch 的开源 AI 搜索引擎框架横空出世,引起了广泛关注。 MindSearch 拥有着强大的性能,号称能与 Perp…
在都市的喧嚣中,每个人都渴望一场说走就走的citywalk,穿梭于大街小巷,探索历史遗迹,沉浸在当地文化之中。然而,规划一场令人满意的城市漫步并非易事,它需要考虑旅行信息的收集、兴趣点(POI)的选择…
最近,新加坡国立大学的Wenyi Yu及其团队提出了一项名为video-SALMONN的新技术,它不仅能够理解视频中的视觉帧序列、音频事件和音乐,更重要的是,它能够理解视频中的语音内容。这项技术的提出…
在Quanta Magazine的播客中,华盛顿大学计算机教授Yejin Choi与主持人Steven Strogatz展开了一场关于人工智能的深刻对话。他们探讨了AI是否必须具备身体和情感,才能发展…
在人工智能的世界里,大型语言模型(LLM)已经成为推动自然语言处理(NLP)任务的关键力量。然而,要让这些模型真正理解并生成跨模态内容,如语音和文本,我们还有很长的路要走。复旦大学的研究团队在论文&q…
Mistral AI近日宣布推出其最新一代大型语言模型Mistral Large2,这一模型在成本效益、速度和性能方面都取得了显著突破。 模型概况 Mistral Large2是一个拥有1230亿参数…
在人工智能的世界里,大型语言模型(LLMs)以其卓越的自然语言处理能力而著称。然而,这些模型在实际应用中的部署却面临着巨大的挑战,主要是因为它们在推理阶段的高计算成本和内存占用。为了解决这一问题,研究…
加拿大企业AI初创公司Cohere与日本信息技术巨头富士通近日宣布达成战略合作,计划共同推出名为“Takane”的日语大型语言模型(LLM)。该合作旨在为企业提供强大的日语语言模型解决方案,提升客户与…
近期,麻省理工学院(MIT)的研究团队对大型语言模型(LLMs)进行了深入的研究,探讨它们在不同任务下的表现。他们发现,尽管这些模型在一些常见的任务上看起来很出色,但实际上它们的推理能力常常被高估,尤…
站长之家(ChinaZ.com) 7月9日 消息:Poe日前推出了一项名为Previews的创新功能,为用户带来前所未有的交互体验。该功能允许用户在聊天过程中直接查看和操作由AI生成的Web应用程序,…
IBM 于五月份开源了适用于企业应用场景的 Granite13B LLM 模型。现在,IBM 的 AI 平台产品副总裁阿曼德・鲁伊兹(Armand Ruiz)公开了用于训练 Granite13B 的全…
近十年科学论文分析显示,研究人员发现人工智能模型滥用了一些 “风格” 词汇,而这些词汇在几年前还很少被使用。 在一项尚未经同行评审的新研究中,研究人员采用了一种新颖的方法,类似于流行病学,通过分析生物…
OpenAI首席执行官Sam Altman近日在阿斯彭思想节的采访中就备受期待的GPT-5模型发展情况发表了看法,引发业界广泛关注。 尽管许多用户期待OpenAI在其春季更新活动中发布GPT-5,但公…
近日,在Aspen Ideas Festival的访谈中,OpenAI CEO阿尔特曼坦诚地分享了GPT-5的研发进度与挑战。 他强调,尽管团队对此项目充满信心,但通往GPT-5的道路依然漫长且充满未…
据彭博社消息,法国初创公司Dust近日宣布完成1600万美元融资,由知名风险投资机构红杉资本领投。Dust专注于为企业定制人工智能机器人,是帮助企业更便捷地使用大型语言模型的新兴公司之一。 据悉,Du…