内容持续更新中
纽约人工智能创业公司 Arthur 发布了开源工具 ArthurBench,用于评估和比较大型语言模型的性能。ArthurBench 可以帮助企业在特定用例上测试不同语言模型的性能,并提供准确性、可读…