RF-DETR 通用训练代码

本项目是基于RF-DETR官方文档和源码实现的通用训练代码，提供了完整的模型训练、评估和模型转换功能。RF-DETR是一个高性能的实时目标检测模型，在COCO数据集上达到了SOTA性能。

✨ 功能特性

🚀 完整的训练流程：支持从数据准备到模型训练的完整流程
📊 多种模型规格：支持RF-DETR Nano、Small、Medium、Base、Large等多种模型
🎯 灵活的配置：支持自定义训练参数、数据集配置等
💾 模型转换：提供PTH转PT格式的转换工具
📈 训练监控：集成TensorBoard和Wandb支持
🔧 优化训练：支持混合精度训练、EMA、早停等优化技术

📋 环境要求

Python 3.11
CUDA 12.8 (推荐)
16GB+ GPU显存 (训练大模型时)

🛠️ 安装说明

1. 配置镜像源

pip config set global.index-url https://mirrors.aliyun.com/pypi/simple/

2. 创建并激活环境

conda create -n DETR python=3.11
conda activate DETR

3. 安装基础依赖

# 安装ultralytics
pip install -U ultralytics

# 卸载可能存在的旧版本torch
pip uninstall torch
pip uninstall torchvision

# 安装CUDA版本的PyTorch
pip3 install torch torchvision --index-url https://download.pytorch.org/whl/cu128

4. 安装Flash Attention (可选，需要下载对应版本)

# 请根据您的系统下载对应的flash_attn wheel文件
pip install flash_attn-2.8.3+cu128torch2.8.0cxx11abiFALSE-cp311-cp311-win_amd64.whl

5. 安装其他依赖

# 安装指定版本的torch和xformers
pip install torch==2.8.0 xformers

# 安装数据增强库
pip install -U albumentations

# 安装机器学习相关库
pip install huggingface_hub datasets

# 安装UI界面库
pip install pyqt5

# 安装Web服务相关库
pip install flask flask-socketio openai

# 安装数据库相关库
pip install sqlalchemy flask_bcrypt flask_login

# 安装RF-DETR和可视化库
pip install -q rfdetr supervision

📁 项目结构

RF-DETR-Traincode/
├── README.md                 # 项目说明文档
├── requirements.txt          # 依赖包列表
├── train.py                 # 主训练脚本
├── convert_model.py         # 模型格式转换工具
├── config/                  # 配置文件目录
│   ├── training_config.yaml # 训练配置文件
│   └── model_config.yaml    # 模型配置文件
├── data/                    # 数据集目录
│   ├── train/              # 训练数据
│   ├── val/                # 验证数据
│   └── test/               # 测试数据
├── output/                  # 训练输出目录
│   ├── checkpoints/        # 模型检查点
│   ├── logs/              # 训练日志
│   └── results/           # 评估结果
└── utils/                   # 工具函数
    ├── dataset.py          # 数据集处理
    ├── visualization.py    # 可视化工具
    └── metrics.py          # 评估指标

🚀 快速开始

1. 准备数据集

将您的数据集按照COCO格式组织，或使用Roboflow格式：

data/
├── train/
│   ├── images/
│   └── _annotations.coco.json
├── val/
│   ├── images/
│   └── _annotations.coco.json
└── test/
    ├── images/
    └── _annotations.coco.json

2. 开始训练

python train.py \
    --dataset_dir ./data \
    --model_size medium \
    --epochs 100 \
    --batch_size 8 \
    --lr 1e-4 \
    --output_dir ./output

3. 模型转换

训练完成后，可以将PTH格式转换为PT格式：

python convert_model.py \
    --input_path ./output/checkpoints/best_model.pth \
    --output_path ./output/best_model.pt \
    --model_size medium

⚙️ 配置参数

训练参数

参数	类型	默认值	说明
`dataset_dir`	str	-	数据集路径
`model_size`	str	"medium"	模型规格 (nano/small/medium/base/large)
`epochs`	int	100	训练轮数
`batch_size`	int	8	批次大小
`lr`	float	1e-4	学习率
`resolution`	int	640	输入图像分辨率
`use_ema`	bool	True	是否使用EMA
`early_stopping`	bool	True	是否使用早停

模型规格对比

模型	参数量	分辨率	mAP@50	mAP@50:95	推理速度
RF-DETR-N	30.5M	384	67.6	48.4	2.32ms
RF-DETR-S	32.1M	512	72.1	53.0	3.52ms
RF-DETR-M	33.7M	576	73.6	54.7	4.52ms

📊 训练监控

TensorBoard

tensorboard --logdir ./output/logs

Wandb (可选)

在训练脚本中设置：

wandb_config = {
    "project": "rf-detr-training",
    "name": "experiment-1"
}

🔧 高级用法

自定义配置文件

# config/training_config.yaml
model:
  size: "medium"
  pretrained: True
  
training:
  epochs: 100
  batch_size: 8
  learning_rate: 1e-4
  optimizer: "AdamW"
  scheduler: "cosine"
  
data:
  resolution: 640
  augmentation: True
  multi_scale: True

断点续训

python train.py \
    --resume ./output/checkpoints/checkpoint_epoch_50.pth \
    --dataset_dir ./data

📝 注意事项

GPU显存需求：建议使用16GB+显存的GPU进行训练
数据集格式：确保数据集按照COCO格式正确组织
预训练权重：首次运行会自动下载预训练权重
模型保存：训练过程中会自动保存最佳模型和检查点

🤝 贡献

欢迎提交Issue和Pull Request来改进本项目！

📄 许可证

本项目基于Apache 2.0许可证开源。

🔗 相关链接

📞 联系方式

如有问题，请通过以下方式联系：

提交GitHub Issue
发送邮件至项目维护者

Star ⭐ 本项目如果对您有帮助！

Name		Name	Last commit message	Last commit date
Latest commit History 13 Commits
.github		.github
docs		docs
rfdetr		rfdetr
.gitattributes		.gitattributes
.gitignore		.gitignore
CITATION.cff		CITATION.cff
CNAME		CNAME
CONTRIBUTING.md		CONTRIBUTING.md
LICENSE		LICENSE
README.md		README.md
dataprocess.py		dataprocess.py
infer.py		infer.py
mkdocs.yaml		mkdocs.yaml
pth_to_pt.py		pth_to_pt.py
pyproject.toml		pyproject.toml
rf-detr-base.pth		rf-detr-base.pth
rf-detr-medium.pth		rf-detr-medium.pth
rf-detr-nano.pth		rf-detr-nano.pth
rf-detr-small.pth		rf-detr-small.pth
test1.jpg		test1.jpg
train.py		train.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

RF-DETR 通用训练代码

✨ 功能特性

📋 环境要求

🛠️ 安装说明

1. 配置镜像源

2. 创建并激活环境

3. 安装基础依赖

4. 安装Flash Attention (可选，需要下载对应版本)

5. 安装其他依赖

📁 项目结构

🚀 快速开始

1. 准备数据集

2. 开始训练

3. 模型转换

⚙️ 配置参数

训练参数

模型规格对比

📊 训练监控

TensorBoard

Wandb (可选)

🔧 高级用法

自定义配置文件

断点续训

📝 注意事项

🤝 贡献

📄 许可证

🔗 相关链接

📞 联系方式

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

RF-DETR 通用训练代码

✨ 功能特性

📋 环境要求

🛠️ 安装说明

1. 配置镜像源

2. 创建并激活环境

3. 安装基础依赖

4. 安装Flash Attention (可选，需要下载对应版本)

5. 安装其他依赖

📁 项目结构

🚀 快速开始

1. 准备数据集

2. 开始训练

3. 模型转换

⚙️ 配置参数

训练参数

模型规格对比

📊 训练监控

TensorBoard

Wandb (可选)

🔧 高级用法

自定义配置文件

断点续训

📝 注意事项

🤝 贡献

📄 许可证

🔗 相关链接

📞 联系方式

About

Resources

License

Contributing

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages