他的回复:
问题解决了,参考github LLaMA-Factory/issues/7352:目前我们验证可以通过在transfomer==4.52.4版本,增加一行代码,手动进行格式转换到支持的格式解决。找到对应安装路径下:transformers/tree/v4.52.4/src/transformers/models/qwen2_5_vl.pyclass Qwen2_5_VisionPatchEmbed、forward内部hidden_states = hidden_states.view( -1, self.in_channels, self.temporal_patch_size, self.patch_size, self.patch_size)hidden_states = torch_npu.npu_format_cast(hidden_states, 30) # --------加一行格式转换hidden_states = self.proj(hidden_states.to(dtype=target_dtype)).view(-1, self.embed_dim)30代表将格式从ND转换到NCDHW,换成[Conv3DBackpropFilter]这个算子支持的格式。