内容持续更新中
近日,OpenAI 推出了备受期待的 AI 模型,此前代号为 “草莓”,正式名称为 “o1-preview”。 OpenAI 承诺这款新模型在物理、化学和生物学等难度较大的基准任务上表现不亚于博士生。…
最近,OpenAI 的 ChatGPT 竟然 “主动” 给用户发消息,这让不少人感到有些惊慌。 9月15日,一位名叫 SentuBill 的用户在 ChatGPT 的 Reddit 社区分享了一张截图…
OpenAI 已向所有 ChatGPT Enterprise 和 ChatGPT Edu 客户提供其最新的 AI 模型 o1-preview 和 o1-mini。这些模型专为处理复杂推理任务而设计,有…
最近,剑桥大学等团队发表了一篇重磅论文,揭示了大模型(LLM)们的真实面目,深入剖析了当前大语言模型(LLM)的实际表现,结果令人震惊 —— 这些被寄予厚望的AI模型,在很多基本任务上的表现远不如人们…
最近,一项新研究显示,即便是先进的 AI 语言模型,比如 OpenAI 最新的 o1-preview,在复杂的规划任务中也显得力不从心。 这项研究是由复旦大学、卡内基梅隆大学、字节跳动和俄亥俄州立大学…
人工智能在医疗领域的应用再次迎来重大突破!一项由哈佛大学、斯坦福大学等多所顶尖机构联合开展的研究显示,OpenAI 的 o1-preview 模型在多项医学推理任务中表现出惊人的能力,甚至超越了人类医…
一项新研究表明,OpenAI 的 o1-preview 人工智能系统在诊断复杂医疗案例方面,可能优于人类医生。哈佛医学院和斯坦福大学的研究团队对 o1-preview 进行了全面的医疗诊断测试,结果显…
最近,OpenAI 的 “推理” 模型 o1-preview 引起了广泛关注,因为它在与顶级国际象棋引擎 Stockfish 的较量中,采用了不寻常的手段赢得了胜利。 研究人员发现,o1-previe…
微软近日宣布了其新的 rStar-Math 技术,这一创新的推理方法可以应用于小型语言模型(SLMs),显著提升它们在数学问题上的表现,甚至在某些情况下超越 OpenAI 的 o1-preview 模…