内容持续更新中
近日,英伟达(Nvidia)悄然推出了其全新AI服务——AI Foundry,这一举措可能会引发企业定制AI模型的热潮。此服务旨在帮助企业开发和部署符合自身需求的定制大语言模型,以更高的准确度和控制力…
在人工智能领域的竞争日益激烈之际,OpenAI再次引领潮流,推出了名为GPT-4o mini的轻量级大语言模型。这一举措不仅标志着AI大模型向小型化发展的新趋势,更是OpenAI让先进AI技术&quo…
阿里通义实验室最近开源了名为FunAudioLLM的音频生成大模型项目,旨在提升人类与大型语言模型(LLMs)间的自然语音交互体验。该项目由两个核心模型组成:SenseVoice和CosyVoice。…
今日,马斯克在X(推特)平台上,公布了关于其人工智能初创公司xAI的最新进展。马斯克宣布,该公司精心打造的大语言模型Grok-2,将在今年八月正式亮相。 这一消息是在马斯克回应一则讨论当前大语言模型训…
近日,昆仑万维携手新加坡南洋理工大学成功开发了名为 Q * 的算法,能够显著提升现有大模型的推理能力。Q * 在不同数据集上帮助小模型达到参数量比其大数十倍甚至上百倍模型的推理能力,使得模型性能大幅提…
智谱宣布推出GLM-4-9B系列模型,包括基座模型、不同上下文长度的Chat模型和视觉模型,能力全面超越了LLaMA38B。据悉,GLM-4-9B系列模型已在Github上已经开源,吸引了大量开发者和…
大语言模型迎来了“1-bit时代”,微软和中国科学院大学提出的BitNet b1.58方法将参数转换成三进制表示,从根本上减少了模型的内存占用和简化了计算过程。该方法在不同大小的模型上进行了性能比较,…
腾讯的研究者们发现,大语言模型的性能会随着实例化agent数量的增加而增强,无需复杂的多LLM agents协作框架。实验结果显示多个小LM集成可以超越较大LM的性能。论文探讨了性能提升与问题难度之间…
随着多家科技巨头在AI技术领域的发展迅猛,美国马萨诸塞州民主党参议员伊丽莎白·沃伦发出反垄断呼吁,要求禁止亚马逊、微软和谷歌这三大科技巨头开发大语言模型人工智能技术,并呼吁亚马逊和谷歌将业务分拆。沃伦…
近期研究发现,大型语言模型通过在线上下文学习展现了强大能力,能够从人类反馈中学习编写机器人代码。研究团队成功通过LMPC框架提高了机器人代码编写LLMs的效率,进一步加速了机器人学习过程。实验证明LM…
MiniMax 于 2024 年 1 月 16 日发布了国内首个 MoE 大语言模型 abab6,该模型采用 MoE 架构,具备处理复杂任务的能力,并且在单位时间内能够训练更多的数据。评测结果显示,a…
上海钢联申请注册商标 “钢联宗师大语言模型”。该商标申请进一步巩固了上海钢联在大语言模型领域的地位。此前,钢联公司发布了针对大宗商品行业的定制化大语言模型 “钢联宗师”,该模型具备多种能力,可用于价格…
阿里巴巴旗下的达摩院推出了专为东南亚市场量身定制的人工智能大语言模型SeaLLM。该模型在多种东南亚语言和安全任务方面表现优异,凸显了阿里巴巴在该地区发展市场的雄心。SeaLLM被视为重要的增长市场,…
微软高管Eric Boyd透露,公司计划推出更多大语言模型,以满足企业客户需求。Boyd强调微软的AI应用及LLMs是安全可用的,但专注文本生成领域的公司能更快发展。微软已在产品中使用OpenAI模型…
麻省理工学院的 GenSim 项目利用大型语言模型,通过自动生成新任务或详细说明所需行为的每个步骤,扩大了机器人可以接受培训的仿真任务范围。该项目通过生成任务描述和模拟行为所需的代码,并利用任务库优化…
牛津大学AI研究员在最新研究中发出警告,指出大型语言模型可能对科学完整性构成威胁。研究呼吁改变LLMs使用方式,建议将其作为“零射击翻译器”以确保输出的事实准确性。然而,信任LLMs作为信息来源可能导…
Real AI在贝尔格莱德数据科学大会上成功中标ISCRA项目,将利用LEONARDO超级计算机建设欧洲首个人本主义大语言模型HOMINIS。该项目旨在构建道德、无偏见的AI系统,减少环境影响,并通过…
在Vectara排行榜中,OpenAI GPT-4以出色的97%准确率和仅有3%的幻觉率位居榜首。Vectara通过开源模型提供了一种评估大型语言模型幻觉率的方法,为企业提供更可信的生成式AI系统。谷…
来源:bilibili哔哩哔哩 作者:@钱得乐玩赚AI 视频时长/时间:00:10:10 / 2023-10-24 【内容介绍】 换个角度理解Prompt,本视频将对Prompt能力做另外一条线的梳理…
据报道,日本电信公司 NTT 计划于明年 3 月发布一款高效能大语言模型 (LLM),旨在为学习日语的生成式人工智能提供基础。NTT 通过专注于特定行业,成功降低了模型学习和运行的成本。这一举措将使 …
最近,Facebook母公司Meta发布了新一代大语言模型Llama 2,在处理长文本和复杂任务上优于此前的GPT-3.5 Turbo和Claude 2。Llama 2于2022年7月面世,提供了70…
10 月 30 日,昆仑万维宣布开源了百亿级大语言模型「天工」Skywork-13B 系列,并提供了超大规模的高质量中文数据集。该系列包括两个模型: Skywork-13B-Base 和 Skywor…
韩国SK电信宣布与德国电信合作,共同开发面向电信领域的大语言模型(LLM)。该合作旨在支持全球电信公司,加速生成式AI服务的开发,特别是AI客服应用。合作计划于2023年第一季度发布多语言LLM,支持…
2023年全球大语言模型竞赛中,中文大语言模型的表现备受瞩目。香港中文大学发布了CLEVA中文评测平台,包括全面的评测任务和指标。CLEVA注重各种指标,如准确性、鲁棒性、公平性、效率、校准、多样性等…
总部位于加利福尼亚州的创业公司Nucleus AI,日前发布了首款产品:220亿参数的大语言模型,采用开源MIT许可证,可针对不同任务进行微调。Nucleus AI计划以农业为中心,利用AI研究构建一…
谷歌DeepMind提出了OPRO框架,使用大语言模型(LLM)进行优化,利用自然语言描述解决方案。其中「深呼吸」成为最佳Prompt提示词,提高模型性能。OPRO还在数学问题中表现出潜力,验证了提示…
本文探讨了大语言模型(LLM)研究中的十大挑战,包括减少和衡量幻觉、优化上下文长度和上下文构建、融入其他数据模态、提高LLMs的速度和降低成本、设计新的模型架构、开发GPU替代方案、提高agent的可…
淘天集团联合爱橙科技开源了大模型训练框架 Megatron-LLaMA,旨在提升大语言模型的训练性能,降低训练成本,并与 LLaMA 社区保持兼容性。框架在 32 卡训练上能够取得 176% 的加速,…