当前位置:AIGC资讯 > AIGC > 正文

【Lora模型训练过程报错】Error no kernel image is available for execution on the device at line

错误现象

在使用 sd-script训练自己的Lora模型时,可能会出现“Error no kernel image is available for execution on the device at line 167 ”的错误:

steps:   0%|                                                                                  | 0/5040 [00:00<?, ?it/s]epoch 1/20
Error no kernel image is available for execution on the device at line 167 in file D:\ai\tool\bitsandbytes\csrc\ops.cu
Traceback (most recent call last):
  File "S:\miniconda\envs\stable\lib\runpy.py", line 196, in _run_module_as_main
    return _run_code(code, main_globals, None,
  File "S:\miniconda\envs\stable\lib\runpy.py", line 86, in _run_code
    exec(code, run_globals)
  File "S:\01code\stable_diff\lora-scripts\venv\Scripts\accelerate.exe\__main__.py", line 7, in <module>
  File "S:\01code\stable_diff\lora-scripts\venv\lib\site-packages\accelerate\commands\accelerate_cli.py", line 45, in main

错误原因

这是因为旧的显卡 例如10系列不支持unit8类型

解决方法

,需要在 训练的配置文件中,修改:

 # use 8bit adam optimizer | 使用 8bit adam 优化器节省显存,默认启用。
 # 部分 10 系老显卡无法使用,修改为 0 禁用。
$use_8bit_adam = 0
$use_lion = 0 # use lion optimizer | 使用 Lion 优化器

更新时间 2023-12-28