内容持续更新中
在于11月17日至22日举行的国际高性能计算、网络、存储与分析大会(SC24)上,戴尔正式推出了一系列新产品和服务,旨在帮助企业克服在采用生成式 AI 和大型语言模型(LLM)过程中遇到的挑战。戴尔基…
最近,AI 大型语言模型(LLM)在各种任务中表现出色,写诗、写代码、聊天都不在话下,简直是无所不能!但是,你敢相信吗?这些“天才”AI 居然是“数学菜鸟”!它们在处理简单的算术题时经常翻车,让人大跌…
一项最新研究表明,利用生成式 AI 模型,特别是大型语言模型(LLM),可以构建一种能够在多种情境下准确模拟人类行为的架构。这项研究成果为社会科学研究提供了一个强大的新工具。 研究人员首先招募了100…
随着 ServiceTitan 向美国证券交易委员会提交首次公开募股(IPO)申请文件,该公司在风险因素部分特别提到了大型语言模型(LLMs)可能带来的潜在风险。此类警告或许标志着未来 IPO 文档中…
在人工智能技术迅速发展的背景下,开发者们迫切需要一个能够灵活应用多种大型语言模型(LLM)的平台。近期推出的 AnyChat 正好满足了这一需求,它将多个领先的 AI 模型整合到一个统一的界面上,极大…
美国AI翻译平台Unbabel周三宣布推出一项由人工智能驱动的翻译服务——Widn.AI,这是该公司的新产品,基于其专有的大型语言模型(LLM)Tower。Unbabel的CEO瓦斯科·佩德罗(Vas…
微软近期发布了一款引人注目的 Python 库 ——TinyTroupe,这是一种基于大型语言模型(LLM)的多智能体人格模拟工具。 TinyTroupe 中的智能体被称为 TinyPersons,它…
根据研究公司 IDC 的最新预测,到2025年,全球人工智能(AI)相关技术的支出将达到3370亿美元,并预计到2028年这一数字将翻倍,达到7490亿美元。随着各行业 IT 领导者们不断推动 AI …
人工智能行业迎来重大转折点:领先企业纷纷改变发展方向,从追求更大规模的语言模型转向专注于提升模型的思考能力。这一转变将重塑整个AI行业的发展格局。 据路透社报道,主要AI实验室正面临困境。开发大型语言…
大型语言模型(LLM)的崛起为人工智能应用带来了革命性的变化,然而,它们在处理表格数据方面却存在着明显的不足。 浙江大学计算创新研究院的研究团队针对这一问题,推出了一款名为 TableGPT2的全新模…
近日,密歇根大学的一项新研究发现,一种训练大型语言模型的省力方法可以在相同的时间内完成,但能耗可降低30%。这种方法可以节省足够的能源,到2026年为110万美国家庭供电。 研究人员开发了一款名为 P…
埃隆马斯克的xAI今天宣布其应用程序编程接口(API)现已向公众开放,并且到今年年底每月可免费获得25美元的API积分。该API允许开发人员在xAI的Grok大型语言模型(LLM)上构建应用程序。 x…
2024年11月5日 – Anthropic正式发布了新一代快速模型Claude 3.5 Haiku。该公司表示,在与Claude 3 Haiku相似的速度下,Claude3.5…
近日,Meta AI 的研究团队与加州大学伯克利分校及纽约大学的研究人员合作,推出了一种名为思维偏好优化(Thought Preference Optimization, TPO)的方法,旨在提升经过…
麻省理工学院(MIT)本周展示了一种全新的机器人训练模型,该模型放弃了以往专注于特定数据集的训练方法,转而采用类似大型语言模型(LLMs)训练时使用的海量信息。 研究人员指出,模仿学习——即代理通过模…
Meta 近日宣布,其 MobileLLM 模型现已向研究人员开放,用户可在 Hugging Face 平台上免费下载并使用这些模型,这些模型已与 Transformers 库全面集成。 这一举措旨在…
AI 竟然开始“长脑子”了?!麻省理工学院的最新研究表明,大型语言模型(LLM)的内部结构,竟然和人脑有着惊人的相似之处! 这项研究利用稀疏自编码器技术,对LLM的激活空间进行了深入分析,发现了三个层…
大型语言模型(LLM)如GPT系列,凭借庞大的数据集,在语言理解、推理和规划方面展现出惊人的能力,在各种挑战性任务中已达到与人类相当的水平。大多数研究都集中在通过在更大的数据集上训练这些模型来进一步增…
大型语言模型(LLM)的横空出世,尤其是ChatGPT等应用的普及,彻底改变了人机交互的方式。 这些模型能够生成连贯且全面的文本,令人印象深刻。然而,尽管能力强大,LLM却容易产生“幻觉”,即生成看似…
近日,Google DeepMind 正在将其 SynthID 技术集成到其 Gemini 模型中,并将其作为开源项目发布。SynthID for Text 使用复杂的流程来干预大型语言模型 (LLM…
近日,网络安全公司 Palo Alto Networks 的 Unit42研究团队发布了一项令人瞩目的研究,揭露了一种名为 “Deceptive Delight”的新型越狱方法。 这个方法能够在仅仅两…
最近,谷歌宣布将其文本水印工具 SynthID 开源,旨在帮助开发者更好地识别 AI 生成的文本。这一工具现已通过谷歌的 “负责任生成 AI 工具包” 向公众开放使用。 谷歌 DeepMind 的研究…
近年来,大型语言模型(LLMs)在数据管理领域受到了广泛关注,应用范围不断扩大,包括数据整合、数据库调优、查询优化以及数据清洗等。然而,处理非结构化数据,尤其是复杂文档时,依然面临许多挑战。 目前一些…
《华尔街日报》的母公司道琼斯和《纽约邮报》正在起诉AI驱动的搜索创业公司Perplexity,原因是该公司使用它们的新闻内容来训练其大型语言模型。 这两家新闻集团旗下的出版物指控Perplexity侵…
在未来的2025年,生成式人工智能(GenAI)有望迎来一个关键的转折点,届时我们将更清楚地看到其真正潜力的展现。随着对其在各个行业多种应用案例的分析逐步深入,原本笼罩在噪音中的 GenAI 将逐渐显…
一项新的研究表明,大型语言模型中出于善意的安全措施可能会带来意外的弱点。研究人员发现,根据不同的人口统计学术语,模型被“越狱”的难易程度存在显著差异。这项名为“Do LLMs Have Politic…
瑞士洛桑联邦理工学院 (EPFL) 的一项最新研究比较了两种主流的大型语言模型 (LLM) 适应性训练方法:上下文学习 (ICL) 和指令微调 (IFT)。研究人员使用 MT-Bench 基准测试来评…
一项由以色列理工学院主导的最新研究表明,大型语言模型(LLM)可能“深藏不露”,掌握的知识比实际表现出来的更多。研究人员发现,LLM 的内部表征编码了关于其输出正确性的信息,即使它们最终生成了错误的答…