错误现象
在使用 sd-script训练自己的Lora模型时,可能会出现“Error no kernel image is available for execution on the device at line 167 ”的错误:
steps: 0%| | 0/5040 [00:00<?, ?it/s]epoch 1/20
Error no kernel image is available for execution on the device at line 167 in file D:\ai\tool\bitsandbytes\csrc\ops.cu
Traceback (most recent call last):
File "S:\miniconda\envs\stable\lib\runpy.py", line 196, in _run_module_as_main
return _run_code(code, main_globals, None,
File "S:\miniconda\envs\stable\lib\runpy.py", line 86, in _run_code
exec(code, run_globals)
File "S:\01code\stable_diff\lora-scripts\venv\Scripts\accelerate.exe\__main__.py", line 7, in <module>
File "S:\01code\stable_diff\lora-scripts\venv\lib\site-packages\accelerate\commands\accelerate_cli.py", line 45, in main
错误原因
这是因为旧的显卡 例如10系列不支持unit8类型
解决方法
,需要在 训练的配置文件中,修改:
# use 8bit adam optimizer | 使用 8bit adam 优化器节省显存,默认启用。
# 部分 10 系老显卡无法使用,修改为 0 禁用。
$use_8bit_adam = 0
$use_lion = 0 # use lion optimizer | 使用 Lion 优化器