에러 잡기 - nll_loss_forward_reduce_cuda_kernel_2d: block: [0,0,0], thread: [0,0,0] Assertion `t >= 0 && t < n_classes` failed.RuntimeError: CUDA error: device-side assert triggered
AutoModelForSequenceClassification로 학습을 하는데 중간에 학습이 멈추고 다음과 같은 에러가 발생/opt/conda/conda-bld/pytorch_1712608935911/work/aten/src/ATen/native/cuda/Loss.cu:250: nll_loss_forward_reduce_cuda_kernel_2d: block: [0,0,0], thread: [0,0,0] Assertion `t >= 0 && t 에러에 n_classes 어쩌고 하는거보니 뭔가 input_ids의 인덱스나 labels의 문제인것 같았음.데이터 전처리 시 라벨이 1부터 n까지로 지정했던게 문제였음.모델이 출력하는 로짓의 인덱스와 라벨이 일치해야 하기 때문에 0부터 시작하는 정수로 지정해야..
더보기