内容持续更新中
蚂蚁集团最近发布了 CodeFuse–CodeLlama-34B 的 4bits 量化版本,该模型经过量化后仍可用单张 A10 或 RTX4090 加载。经过量化后的模型在 Humanev…