AnyDoor: Zero-shot Object-level Image Customization 是一种基于扩散模型的图像生成技术,旨在通过无需额外训练即可将对象精确地放置到新的场景中。这项技术在图像编辑、游戏开发、虚拟现实等领域有广泛的应用前景。
https://github.com/sdbds/AnyDoor-for-windows
核心原理
扩散模型:AnyDoor 使用扩散模型生成图像,通过逐步去除噪声来生成高质量图像。
无需额外训练:AnyDoor 不需要为每个对象单独训练模型,只需一次训练即可应用于不同的对象和场景。
保持对象ID:在生成新的场景图像时,保持对象的ID(身份信息),确保生成的图像与原始对象一致。
主要应用
图像编辑:可以用于扩展照片或绘画的边界,使其适应不同的比例和用途。
游戏开发:在生成游戏场景时,使用这种技术可以创建更加完整和丰富的背景。
虚拟现实:在 VR 环境中,通过扩展视角范围,增强用户的沉浸感和真实感。
优势
高质量生成:生成的图像细节丰富,过渡自然。
多样性和灵活性:可以应用于不同类型的图像和场景。
自动化处理:减少了手动编辑的工作量,提高了效率。
安装
需要环境:Git,Python,anaconda3,cuda,cudnn
打开 CMD 并克隆存储库:
git clone https://github.com/sdbds/AnyDoor-for-windows
创建 venv,激活它并升级 pip:
cd AnyDoor-for-windows
python -m venv venv
venv\Scripts\Activate
python.exe -m pip install --upgrade pip
安装要求:
pip install -r requirements-windows.txt
使用 CUDA 安装炬:
pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118
安装 CUDA 的 xformers:
pip3 install -U xformers --index-url https://download.pytorch.org/whl/cu118
在AnyDoor-for-windows
文件夹中创建path
文件夹,并将所有模型下载到该path
文件夹中!
https://modelscope.cn/models/iic/AnyDoor/files
激活 venv 后运行演示 GUI:
python run_gradio_demo.py
一键运行脚本
@echo off
chcp 65001 > nul
echo ----- 欢迎使用启动器 -----
echo 关注我的油管频道@Arvinz-cm2df
call .\venv\Scripts\Activate
python run_gradio_demo.py
pause
AnyDoor一键整合包云盘下载
https://www.123pan.com/s/Xs6uVv-qar1h