保姆级教程：用YOLOv5和DeepSORT搞定视频中的行人追踪（附完整代码）

张

张建站

2026/5/5 16:38:06

10分钟阅读

保姆级实战基于YOLOv5DeepSORT的视频行人追踪系统搭建指南在智能安防、客流统计、行为分析等场景中视频行人追踪技术正发挥着越来越重要的作用。不同于静态的目标检测追踪系统需要持续锁定特定目标并维持其身份标识ID即使目标短暂消失或相互遮挡。本文将手把手带您搭建一个基于YOLOv5检测器和DeepSORT追踪器的完整系统从环境配置到参数调优再到实际视频处理每个步骤都配有可立即运行的代码片段和避坑指南。1. 环境准备与依赖安装1.1 基础环境配置推荐使用Python 3.8和PyTorch 1.7环境。以下命令可快速创建conda环境并安装核心依赖conda create -n tracking python3.8 conda activate tracking pip install torch1.8.1cu111 torchvision0.9.1cu111 -f https://download.pytorch.org/whl/torch_stable.html1.2 专用库安装DeepSORT需要额外安装以下关键包pip install opencv-python numpy scipy tensorboard loguru git clone https://github.com/mikel-brostrom/Yolov5_DeepSort_Pytorch.git cd Yolov5_DeepSort_Pytorch pip install -r requirements.txt常见安装问题解决方案错误类型可能原因解决方法CUDA out of memory显存不足减小batch_size或降低输入分辨率No module named torchreid依赖缺失pip install torchreidOSError: [WinError 126]DLL缺失安装VC 2015-2019可再发行组件2. 快速运行官方Demo2.1 下载预训练模型将以下模型文件放入指定目录YOLOv5s模型yolov5/weights/yolov5s.ptDeepSORT特征提取器deep_sort/deep/checkpoint/ckpt.t7# 快速验证模型加载 import torch yolo_model torch.hub.load(ultralytics/yolov5, yolov5s, pretrainedTrue) print(yolo_model.names) # 应输出COCO类别列表2.2 运行基础示例执行以下命令处理测试视频python track.py --source test.mp4 --yolo_weights yolov5s.pt --show-vid关键参数说明--source: 输入源0为摄像头文件路径或URL--show-vid: 实时显示处理画面--classes: 指定追踪类别0为人2为车等3. 核心配置文件解析deep_sort.yaml是系统调参的关键主要配置项及优化建议# 特征匹配参数 max_cosine_distance: 0.4 # 余弦距离阈值越大匹配越宽松 nn_budget: 100 # 特征缓存帧数影响内存占用 # 检测过滤参数 min_confidence: 0.3 # 检测置信度阈值 nms_max_overlap: 0.5 # 非极大抑制阈值 # 轨迹管理 max_age: 70 # 最大丢失帧数 n_init: 3 # 新轨迹确认所需连续匹配次数实际调参技巧在拥挤场景应降低max_cosine_distance0.2-0.3提高min_confidence0.5对于快速移动目标需减小max_age30-504. 自定义视频处理实战4.1 处理本地视频文件创建自定义处理脚本custom_track.pyfrom tracker import Tracker import cv2 tracker Tracker( yolo_weightsyolov5s.pt, deep_sort_configdeep_sort.yaml ) cap cv2.VideoCapture(your_video.mp4) while cap.isOpened(): ret, frame cap.read() if not ret: break # 执行追踪 results tracker.track(frame) # 可视化结果 cv2.imshow(Tracking, results.render()[0]) if cv2.waitKey(1) ord(q): break4.2 多目标ID保持策略当发生目标交叉时可通过以下方法增强ID稳定性运动一致性检查比较相邻帧间目标运动方向def motion_consistency(track, detection): dx track.velocity[0] - (detection.x - track.x) dy track.velocity[1] - (detection.y - track.y) return math.sqrt(dx**2 dy**2) MOTION_THRESHOLD外观特征缓存维护每个ID的近期特征集合from collections import deque class FeatureBank: def __init__(self, maxlen50): self.features defaultdict(lambda: deque(maxlenmaxlen)) def update(self, track_id, feature): self.features[track_id].append(feature)4.3 性能优化技巧针对不同硬件环境的优化方案CPU模式优化python track.py --device cpu --half # 启用半精度推理边缘设备部署# 在树莓派等设备上建议 model torch.hub.load(ultralytics/yolov5, yolov5n, pretrainedTrue) # 使用nano版本 model model.fuse().autoshape() # 融合模型加速5. 典型问题排查指南5.1 ID频繁切换问题可能原因及解决方案特征相似度高降低max_cosine_distance增加nn_budget检测框抖动在YOLOv5中启用--augment增强鲁棒性遮挡处理不足实现自定义的遮挡检测逻辑def check_occlusion(boxes): ious compute_iou_matrix(boxes, boxes) np.fill_diagonal(ious, 0) return ious.max(axis1) OCCLUSION_THRESH5.2 高延迟处理方案分阶段优化策略输入源优化python track.py --source rtsp://example.com --imgsz 640 # 降低分辨率模型裁剪# 只保留行人检测 model.classes [0] # COCO数据集中0对应person异步处理架构from threading import Thread class AsyncTracker: def __init__(self): self.frame_queue Queue(maxsize3) self.result_queue Queue(maxsize3) Thread(targetself._worker, daemonTrue).start() def _worker(self): while True: frame self.frame_queue.get() results tracker.track(frame) self.result_queue.put(results)6. 高级功能扩展6.1 跨摄像头追踪实现方案核心要素全局特征库使用Redis存储跨摄像头的特征向量时空约束结合摄像头地理位置信息过滤不可能关联import redis r redis.Redis(hostlocalhost, port6379) def store_cross_cam_feature(cam_id, track_id, feature): r.hset(fglobal_feat:{track_id}, cam_id, feature.tobytes())6.2 行为分析集成示例检测徘徊行为from collections import defaultdict track_history defaultdict(lambda: deque(maxlen100)) def detect_loitering(track_id, current_pos): if len(track_history[track_id]) 50: return False movement sum( math.sqrt((x1-x0)**2 (y1-y0)**2) for (x0,y0), (x1,y1) in zip( track_history[track_id], list(track_history[track_id])[1:] ) ) return movement LOITERING_THRESH6.3 可视化增强技巧使用OpenCV绘制高级追踪信息def draw_custom_trail(frame, track): for i in range(1, len(track.trail)): cv2.line(frame, track.trail[i-1], track.trail[i], colorCOLORS[track.id % 10], thickness2) cv2.putText(frame, fID:{track.id}, (track.x, track.y-10), cv2.FONT_HERSHEY_SIMPLEX, 0.5, (0,255,0), 2)在完成基础系统搭建后建议先用短测试视频验证各模块功能再逐步扩展到长时间监控场景。实际部署时会发现光照变化、摄像头抖动等现实因素会带来新的挑战这时需要回到配置文件调整参数或增加预处理步骤。

DLSS Swapper 3分钟快速上手：免费游戏性能优化终极指南

DLSS Swapper 3分钟快速上手：免费游戏性能优化终极指南【免费下载链接】dlss-swapper 项目地址: https://gitcode.com/GitHub_Trending/dl/dlss-swapper DLSS Swapper是一款专为游戏玩家设计的免费工具，让你可以轻松管理游戏中的DLSS、FSR和XeS…...

2026/5/5 16:29:38 阅读更多 →

BLiveChat终极指南：3步打造专业级B站直播弹幕展示系统

BLiveChat终极指南：3步打造专业级B站直播弹幕展示系统【免费下载链接】blivechat 用于OBS的仿YouTube风格的bilibili直播评论栏项目地址: https://gitcode.com/gh_mirrors/bl/blivechat BLiveChat是一款专为B站直播设计的专业弹幕展示工具，通过…...

2026/5/5 16:26:44 阅读更多 →

开源系统优化实战：Win11Debloat如何实现Windows 11深度定制与性能提升

开源系统优化实战：Win11Debloat如何实现Windows 11深度定制与性能提升【免费下载链接】Win11Debloat A simple, lightweight PowerShell script that allows you to remove pre-installed apps, disable telemetry, as well as perform various other changes to d…...

2026/5/5 16:23:22 阅读更多 →

ColorControl：一键掌控多设备显示与智能控制的终极方案

ColorControl：一键掌控多设备显示与智能控制的终极方案【免费下载链接】ColorControl Easily change NVIDIA display settings and/or control LG TVs 项目地址: https://gitcode.com/gh_mirrors/co/ColorControl ColorControl 是一个专注于显示参数优化与智…...

2026/5/5 5:45:33 阅读更多 →

使用Taotoken CLI工具一键配置开发环境与多工具API密钥的教程

使用Taotoken CLI工具一键配置开发环境与多工具API密钥的教程 1. 安装Taotoken CLI工具 Taotoken CLI工具提供两种安装方式。对于需要频繁使用CLI的场景，推荐全局安装： npm install -g taotoken/taotoken若只需临时使用或避免全局依赖，可通…...

2026/5/5 1:47:46 阅读更多 →

C语言固件完整性保护全栈方案（含国密SM4+可信执行环境TEE落地代码）

更多请点击： https://intelliparadigm.com 第一章：Shell脚本的基本语法和命令 Shebang 与执行方式每个可执行 Shell 脚本的第一行应以 Shebang（ #!/bin/bash）开头，用于指定解释器路径。保存为 hello.sh 后&#xf…...

2026/5/4 17:36:57 阅读更多 →

在 Node.js 后端服务中集成 Taotoken 实现多模型对话路由

在 Node.js 后端服务中集成 Taotoken 实现多模型对话路由 1. 准备工作在开始集成 Taotoken 之前，需要确保您的开发环境已满足以下条件。Node.js 版本建议使用 18.x 或更高 LTS 版本。通过运行 node -v 可以检查当前版本。如果尚未安装 openai 包，可以…...

2026/5/4 5:56:10 阅读更多 →