内容持续更新中
在大语言模型技术发展的新潮流中,蚂蚁技术研究院于近日正式发布了 LLaDA2.0系列,这是业内首个参数规模达到100B 的离散扩散大语言模型(dLLM)。这一创新的模型不仅打破了扩散模型难以规模化的固…
在大语言模型(LLM)发展的浪潮中,阿里通义 Qwen 团队近日推出了一种创新的强化学习方法 ——Soft Adaptive Policy Optimization(SAPO)。这一方法的核心目标是解…
行业观察:大模型时代的算力“破局”之道 随着大语言模型(LLM)与生成式 AI 的爆发式增长,算力已成为数字经济时代的核心生产力。然而,对于广大中小企业研发团队及高校科研机构而言,获取高性能、高稳定性…
日前,我国首个专为盲童设计的无障碍 AI 伴读系统 —— 星光 AI 伴读 “小星” 正式上线。该系统由中国盲文出版社与科技公司联合研发,旨在满足盲童在阅读过程中的特殊需求。用户可以通过手机或电脑登录…
最近,来自意大利 Icaro Lab 的研究者发现,诗歌的不可预测性可以成为大语言模型(LLM)安全防护的一大 “隐患”。这一研究来自一家专注于伦理 AI 的初创公司 DexAI,研究团队写了20首中…
全球海拔最高的大语言模型正式诞生。西藏大学与本土创业团队联合发布的“阳光清言”V1.0今日亮相,模型参数量突破千亿,训练语料达288亿Token,覆盖新闻、法律、医学、教育、科技等全领域,…
在人工智能领域的风云变幻中,图灵奖得主 Yann LeCun 与 Meta(前 Facebook)似乎走到了分岔口。作为 Meta 的首席 AI 科学家,LeCun 长期以来一直在推动基础 AI 研究…
最近,一项引人关注的研究表明,大语言模型(LLM)在持续接触低质量数据后,会出现类似于人类的 “脑损伤” 现象,导致推理和记忆能力显著下降。研究者发现,AI 模型在接受高流行但低价值的社交媒体数据(如…
OpenAI正在推出其最新的大语言模型迭代——GPT-5.1,旨在将ChatGPT打造成一个更灵活、响应更快、且高度个性化的数字助理。此次更新不仅带来了更快的响应速度和更清晰的语言表达,还引入了能适应…
近日,Mozilla Firefox 的最新版本推出后,用户们纷纷反映其中新增的多项人工智能(AI)和大语言模型(LLM)相关功能,引发了广泛的关注和争议。这些新功能在安装后默认全部开启,用户在使用过…
近日,来自苏黎世大学、阿姆斯特丹大学、杜克大学和纽约大学的研究团队发布了一项最新研究,揭示了大语言模型生成的社交媒体帖子在内容识别方面的不足。研究表明,这些 AI 生成的帖子在各大社交平台上容易被人类…
当大语言模型还在二维对话框里“打字”时,魔珐科技直接把它的骨骼、肌肉、声带一次生成。5月30日,这家公司发布全球首个面向开发者的3D数字人开放平台“魔珐星云”,让AI从“说话”进化到“做表情、打手势、…
OpenAI 宣布推出其新产品 Aardvark,这是一款基于 GPT-5的智能安全研究助手,旨在提升软件安全性。随着每年数万种新漏洞的出现,开发者和安全团队面临着发现和修补漏洞的巨大挑战。Aardv…
【AIbase报道】2025年10月27日,中国AI初创公司MiniMax宣布开源其最新大语言模型MiniMax M2。该模型凭借突破性的效率和卓越的性能,专为代理工作流和端到端编码任务设计,其每令牌…
根据一项新研究,大语言模型(LLM)在持续接触无意义的在线内容后,可能会出现显著的性能下降。这项研究表明,这些模型的推理能力和自信心都受到影响,引发了对它们长期健康的担忧。研究团队来自多个美国大学,提…
上海人工智能实验室与浙江大学等机构近日联合推出IWR-Bench,这是首个专门评估大语言模型将视频转化为交互式网页代码能力的基准测试。该基准旨在更真实地衡量多模态大语言模型(LVLM)在动态网页重建方…
根据最新报道,谷歌公司正在积极筹备其旗舰 AI 模型 Gemini 的最新版本 ——Gemini3.0,并计划于今年12月正式发布。此版本的推出将延续谷歌过去两年在年底发布 Gemini 系列产品的传…
在近期的一项联合研究中,来自 Anthropic、英国 AI 安全研究所和艾伦・图灵研究所的科学家们揭示了一个惊人的事实:大语言模型(如 ChatGPT、Claude 和 Gemini 等)对数据中毒…
宾夕法尼亚州立大学最新发表的研究论文《Mind Your Tone》揭示了一个反常识的现象:在与大语言模型交互时,使用直白甚至粗鲁的语气,可能比礼貌用语获得更准确的答案。这项研究首次系统性地验证了提问…
近日,Google最新研究提出了一种革命性框架——“Reasoning Memory”(可学习的推理记忆),旨在让AI Agents从自我经验和错误中积累知识,实现真正的“自我进化”。这一创新有望解决…
近日,人工智能研究公司 Anthropic 发布了一项震惊业界的研究,揭示了对大语言模型进行 “数据投毒” 攻击的新可能性。以往,大家普遍认为,攻击者需要占训练数据中一定比例的 “毒药” 样本才能成功…
据《商业内幕》消息自推出以来,由 OpenAI 开发的 ChatGPT 持续在人工智能领域创造用户增长的惊人纪录,进一步巩固了其作为领先大语言模型(LLM)的霸主地位。 OpenAI 首席执行官山姆·…
在人工智能领域,尤其是大语言模型(LLM)的应用中,准确性一直是一个备受关注的话题。为了提升 LLM 在回答复杂问题时的表现,检索增强生成(RAG)技术应运而生。这项技术允许模型在回答问题之前,先从知…
客户支持行业正在经历一场前所未有的变革。Zendesk在周三的AI峰会上重磅发布了一系列由大语言模型驱动的产品,这家公司正试图彻底改变对人工技术人员的依赖模式。 新功能的核心是一个自主支持代理,Zen…
9月30日,通义千问发布基于大语言模型的多语言实时音视频翻译系统Qwen3-LiveTranslate-Flash,为跨语言交流带来革命性突破。 该系统支持18种语言的离线和实时翻译,覆盖中文、英语、…
浏览器开发商和谷歌搜索替代方案Brave周一宣布,为其AI驱动的搜索套件推出新功能Ask Brave,可根据查询提供关于某个主题的详细答案。 该搜索公司表示,这一新功能将与去年推出的AI Answer…
招聘行业正在经历一场由人工智能驱动的深刻变革。AI驱动的人才搜索引擎Juicebox周四宣布完成总计 3600 万美元融资,其中包括由红杉资本领投的 3000 万美元A轮融资,这家仅有 4 人核心团队…
近日,梅赛德斯 – 奔驰(中国)投资有限公司与字节跳动正式签署了升级战略合作备忘录,双方将共同推动人工智能技术在多个领域的应用。这次合作将覆盖自动驾驶、智能座舱、智能化研发、数字化营销和客…