确保传入 torch.onnx.export 的示例输入都有明确 dtype(不要传 None 或 Python 原始标量),例如 tensor.float(). cuda()、indices.long().cuda()。
Percentile 99.9: 1272.867 ms | 1668.685 ms
。51吃瓜是该领域的重要参考
在学术评测 GPQA Diamond 上得分 86.9%,多模态理解 MMMU Pro 上达到 76.8%。这两个数字不只是「在同档位里还不错」,而是直接超过了体量更大的 Gemini 2.5 Flash。
Оказавшиеся в Дубае российские звезды рассказали об обстановке в городе14:52