内容持续更新中
法国初创公司Mistral AI计划于2024年开源GPT-4级别模型,最近获得4.15亿美元融资并推出API服务。公司正在开发表现优异的多语言模型Mistral Medium,引起业内关注。同时,关…
元象宣布开源高性能大模型 XVERSE-65B-Chat 版,无条件免费商用,为开发者构建和部署垂直领域应用提供强大且易用的工具。XVERSE-65B 在 SuperCLUE 中文通用大模型综合基准测…
Mistral最近发布了Mixtral8x7B模型,性能超越了GPT-3.5,但对安全性存在担忧。该模型开源后在AI领域引起巨大关注。
生成式AI初创平台Together AI宣布成功融资7.3亿元人民币,强调在大模型领域的开源重要性。公司发布多个备受好评的开源产品,包括RedPajama-INCITE、RedPajama-Data-…
新加坡国立大学发布 NExT-GPT 多模态语言模型,支持文本、图像、视频和音频处理,助力多媒体人工智能应用发展。模型采用三层架构,通过 MosIT 技术进行中间层训练,开源贡献为研究者和开发者创造了…
人工智能领域重要人物LeCun在最新访谈中指出,未来超级AI不会支配人类,而是成为互动中介。他强调开源是必要的,以避免公司垄断,确保每个人都能参与学习和优化。LeCun认为智能与统治无必然联系,呼吁建…
11 月 24 日,零一万物基正式发布并开源微调模型 Yi-34B-Chat,可申请免费商用。零一万物还为开发者提供了 4bit/8bit 量化版模型,Yi-34B-Chat4bit 量化版模型可以直…
魔搭社区在 Openai DEV day 上发布了开源版 GPTS “ModelScope Agents”,该工具支持用户定制和二次开发,并且具有开源开放、支持多种 LLM Agent、支持 fine…
近日,vivo AI正式开源了BlueLM-7B 基础(base)模型和7B 对话 (chat) 模型,同时开源了支持32K 的长文本基础 (base) 模型和对话 (chat) 模型。该模型规模达到…
在2023年世界互联网大会乌镇峰会上,阿里巴巴集团CEO吴泳铭宣布,阿里将开源720亿参数大模型,预计成为国内参数规模最大的开源大模型。这一举措标志着阿里云在大模型领域的领先地位,有望推动人工智能技术…
10 月 30 日,昆仑万维宣布开源了百亿级大语言模型「天工」Skywork-13B 系列,并提供了超大规模的高质量中文数据集。该系列包括两个模型: Skywork-13B-Base 和 Skywor…
近日,上海人工智能实验室(上海AI实验室)推出首个图文混合创作大模型书生·浦语灵笔(InternLM-XComposer)。浦语灵笔能进行流利的中英文图文对话,准确理解图像内容,更解锁了“一键生成”图…
Meta在美国总部外遭遇抗议示威,反对其开源发布AI模型的策略,担心这些模型权重的泄露会造成负面影响。Meta首席科学家LeCun则表示开源AI社区发展势头正猛。业内对开源与闭源仍存在分歧,开源可提高…
ctoc 是一个轻量级工具,用于分析代码库的令牌级别信息。它是基于 gocloc 的,具有极快的性能。这种工具允许开发者更深入地理解他们的代码,特别是在处理大型代码库时,它可以帮助开发者更有效地定位和…
AI 组织 LAION 和领先的 AI 开发者在给欧盟的公开信中建议,AI 领域的监管努力应该鼓励使用开源 AI 模型,以支持透明度、安全性和创新,特别是中小企业。LAION 认为,开源 AI 模型具…
站长之家报道,Colossal-AI团队通过词表扩充、数据筛选和多阶段训练策略,在15小时内用几千元成本训练出参数规模达85亿字元的中文版LLaMA2大模型。这个低成本方案使中文版LLaMA2在多项中…
Colossal-AI 团队通过低成本构建了中文版的 LLaMA-2 大模型,在多个评测榜单中取得了优异的成绩。他们开源了完整的训练流程、代码及权重,并提供了评估体系框架 ColossalEval。这…
阿联酋科技集团 G42 与 Cerebras Systems 合作推出了一款名为 Jais 的开源阿拉伯语 AI 模型,该模型拥有 130 亿个参数,可以为生成式 AI 应用提供支持。Jais 的发布…
阿里云开源了视觉语言模型Qwen-VL,这是继8月开源通用模型Qwen-7B和对话模型Qwen-7B-Chat之后,又一个开源的大模型。Qwen-VL支持中英文,可以进行知识问答、图像标题生成、图像问…
上海 AI 实验室与语料数据联盟发布了 “书生・万卷”1.0 多模态预训练语料,包含文本、图文和视频数据集。这个开源语料库总量超过 2TB,经过细粒度清洗和去重,具备多元融合、精细处理和易用高效的特点…