内容持续更新中
近日,九家大模型在测试中都无法解答小学奥数题,揭示了大模型的局限性。讯飞和百度大模型在测试中表现较突出,MiniMax 则垫底。
人工智能公司Poe日前与SurgeAI合作,从推理、写作、创造力和非英语语言能力4个维度对主流大模型包括GPT-4、Google PaLM、Claude 2、Llama 2 70b等进行了系统评估。结…