内容持续更新中
2025 年 3 月 25 日,谷歌正式推出了其最新一代大语言模型Gemini 2.5,这一消息迅速在科技界引发热议。作为谷歌AI技术的一次重大升级,Gemini 2. 5 被誉为公司迄今为止&quo…
深耕行业十四年,知浪潮将至,当相向而行。本文旨在结合企业思考,探讨AI新时代下的技术与应用趋势,对内秉初心以率众,对外纳灼见而求臻。 技术分水岭:算力、算法和数据的能效博弈 随着大模型的快速更迭,人类…
据科创板日报报道,阿里云在全球范围内开展项大规模的 AI 人才校园招聘活动。这次招聘规模被认为是近年来最大的一次,主要面向全球顶尖高校,如清华大学、北京大学、浙江大学、麻省理工学院和斯坦福大学等,旨在…
近日,国家自然资源部宣布,国家海洋环境预报中心与海洋出版社有限公司以及三六零数字安全科技集团有限公司成功研发并发布了海洋垂直领域的大语言模型——“瀚海智语”(英文名称OceanDS)。 这款模型以36…
近日,OpenAI 首席产品官(CPO)Kevin Weil 在一次备受关注的访谈中透露了多个重磅消息,引发业界广泛关注。最引人瞩目的是关于备受期待的 GPT-5以及 AI 代码自动化进程的预测。 对…
在人工智能的激烈竞争中,一场耗资百万美元的大规模实验正悄然改变着大语言模型的训练方式。阶跃星辰研究团队日前发布重磅研究成果,他们通过耗费近100万NVIDIA H800GPU小时的算力,从零开始训练了…
天眼查App显示,北京硅基流动科技有限公司近日发生重大工商变更。在此次变更中,北京智谱华章科技有限公司退出股东行列,同时新增四家投资方:美团旗下天津三快科技有限公司北京星连鼎森股权投资基金合伙企业(有…
亚马逊云科技近日宣布,DeepSeek-R1大语言模型现已作为完全托管的无服务器服务在Amazon Bedrock上正式可用。作为首个将该模型作为完全托管服务推出的云服务提供商,亚马逊云科技进一步扩展…
近年来,大语言模型(LLM)在人工智能领域取得了显著进展,尤其是在多模态融合方面。华中科技大学、字节跳动与香港大学的联合团队最近提出了一种新型的多模态生成框架 ——Liquid,旨在解决当前主流多模态…
OpenAI 于2025年2月27日发布的 GPT-4.5系统卡报告(https://cdn.openai.com/gpt-4-5-system-card.pdf)的详细解读。该报告全面介绍了 GPT…
近日,国内互联网企业YY公司宣布正式接入热门开源大语言模型DeepSeek,并发布优化后的“YY-DeepSeekR1-满血版”(以下简称YYDS)。 该版本通过服务器架构升级与算法调优,彻底解决De…
2月17日,昆仑万维旗下的Opera团队在Opera Developer中接入了DeepSeek R1系列模型,实现了本地个性化部署。这一举措标志着Opera在AI技术应用方面的进一步拓展,为用户提供…
埃隆·马斯克旗下xAI公司正式发布Grok系列第三代大语言模型,在AI领域掀起新一轮技术海啸。这款被开发者称为"当下地表最强"的模型,或将重塑全球AI竞争格局。 据官方披露,Gro…
乐天集团宣布推出其首个日本大语言模型(LLM)和小语言模型(SLM),命名为Rakuten AI2.0和Rakuten AI2.0mini。 这两款模型的发布旨在推动日本的人工智能(AI)发展。Rak…
天眼查App显示,腾讯科技(深圳)有限公司近日申请了一项名为“大语言模型的训练方法、装置、计算机设备及存储介质”的专利。这项专利的摘要揭示了该方法通过引入第一摘要文本和第二摘要文本,在大语言模型的训练…
近日,腾讯科技(深圳)有限公司在天眼查 App 上公布了一项关于大语言模型的训练方法及相关设备的专利。这项专利的名称为 “大语言模型的训练方法、装置、计算机设备及存储介质”,旨在通过创新的训练方式,提…
在全球人工智能技术迅猛发展的背景下,英伟达近日宣布将免费向公众开放19门自定进度的 AI 技术课程,旨在帮助开发者和技术爱好者提升在 AI 与数据科学领域的技能。这项举措不仅为学习者提供了珍贵的学习机…
在人工智能领域,大语言模型的"幻觉问题"一直是困扰业界的关键挑战。近日,一项基于HHEM-2.1-Open评估体系的测试结果显示,智谱AI旗下的GLM-4-9B模型交出了一份令人瞩…
随着大语言模型(LLM)在现代人工智能应用中的广泛应用,诸如聊天机器人和代码生成器等工具依赖于这些模型的能力。然而,随之而来的推理过程中的效率问题也日益突出。 尤其是在处理注意力机制时,如 Flash…
在2022年全球生成式 AI 浪潮的背景下,元始智能(RWKV)于2023年12月完成数千万人民币的天使轮融资,由天际资本投资。此次融资后,公司估值翻倍,资金将用于团队扩展、新架构研发及产…
在一篇聚焦医疗AI评测的研究论文中,微软似乎再次"不经意"地披露了业界多个顶级大语言模型的参数规模。这份发布于12月26日的论文不仅揭示了包括OpenAI、Anthropic在内的…
近年来,随着大语言模型(LLM)的广泛应用,这些模型在复杂推理和问题解决任务中发挥了重要作用。其中,受 OpenAI 的 o1架构启发的 o1-like 模型以其独特的人类思维、逐步推理的能力脱颖而出…
在企业普遍对AI应用持谨慎态度的背景下,AI销售开发代表(AI SDR)领域却呈现出罕见的爆发式增长。这些运用大语言模型和语音技术的初创公司,通过自动化个性化外联邮件和电话营销,正吸引着风投的密切关注…
国内新锐AI大模型公司阶跃星辰近日传出重磅消息,完成数亿美元融资。本轮融资由上海国有资本投资运营平台旗下的私募股权投资机构Fortera Capital领投,腾讯、启明创投等知名机构跟投。 这家成立仅…
中国人工智能公司DeepSeek日前发布了一款具有里程碑意义的开源大语言模型DeepSeek V3。这款拥有6710亿参数的模型不仅规模超越Meta的Llama3.1,在多项基准测试中的表现也优于包括…
在2024年12月19日的发布会上,智源研究院与腾讯宣布推出LongBench v2,这是一个专为评估大语言模型(LLMs)在真实世界长文本多任务中的深度理解与推理能力而设计的基准测试。该平台旨在推动…
近日,人工智能领域的领先公司ElevenLabs宣布推出其全新对话式AI平台,使开发者能够在几分钟内构建高效、流畅的智能语音代理。该平台不仅具备低延迟、高可配置性和强大的可扩展性,还为用户提供了极大的…
智谱科技近日宣布开源其端侧大语言和多模态模型GLM-Edge系列,这一举措标志着公司在端侧真实落地使用场景中的一次重要尝试。GLM-Edge系列由四种不同尺寸的模型组成,包括GLM-Edge-1.5B…