Official · 速報 2024.03.18 大規模モデルの推論を加速する——Quantoがもたらす可能性とは Quanto: Optimum用のPyTorch量子化バックエンド Hugging Faceが大規模モデル向けの量子化バックエンドQuantoをリリース Quanto PyTorch Optimum Quantization Hugging Face Blog