保姆级教程：将Labelme生成的JSON标注，一键转换成YOLO格式的TXT文件（附Python脚本）

张

张建站

2026/5/17 9:49:11

10分钟阅读

保姆级教程：将Labelme生成的JSON标注，一键转换成YOLO格式的TXT文件（附Python脚本）

从Labelme到YOLO关键点标注数据格式转换实战指南在计算机视觉领域数据标注是模型训练的基础环节。许多研究者和工程师在使用Labelme完成关键点标注后常常面临如何将JSON格式转换为YOLO所需TXT格式的难题。本文将深入解析两种数据格式的结构差异提供可复用的Python转换脚本并分享关键点标注与转换中的实用技巧。1. 理解Labelme与YOLO数据格式的核心差异Labelme生成的JSON文件和YOLO所需的TXT文件在数据结构上存在本质区别。Labelme的JSON采用树状结构存储标注信息而YOLO的TXT则是基于行的扁平化格式。Labelme JSON典型结构{ version: 5.1.1, flags: {}, shapes: [ { label: person, points: [[x1,y1], [x2,y2]], group_id: 1, shape_type: rectangle }, { label: nose, points: [[x,y]], group_id: null, shape_type: point } ], imagePath: image.jpg, imageData: null, imageHeight: 1080, imageWidth: 1920 }YOLO TXT格式要求class_id x_center y_center width height x1 y1 vis1 ... xn yn visn表关键字段对应关系Labelme字段YOLO字段说明shapes[n].points[0]x_center, y_center边界框中心坐标shapes[n].points[1]width, height边界框宽高imageWidth/imageHeight-用于坐标归一化shapes[n].group_idvis关键点可见性标识2. 关键点标注的三种状态处理策略在姿态估计任务中关键点的可见性状态直接影响模型训练效果。YOLO格式将关键点分为三类可见关键点状态值2完全可见且位置明确遮挡关键点状态值1位置可推测但被遮挡缺失关键点状态值0完全不可见或位置未知处理建议对于遮挡关键点应在Labelme中标注时设置group_id1保持关键点标注顺序一致便于后续处理复杂场景下可考虑使用shape_attributes记录额外信息3. 完整Python转换脚本解析以下增强版脚本不仅实现格式转换还包含异常处理和详细注释import json import os from pathlib import Path def convert_labelme_to_yolo(json_dir, txt_dir, class_mapping): 将Labelme JSON标注转换为YOLO格式TXT文件参数: json_dir: JSON文件目录路径 txt_dir: 输出TXT目录路径 class_mapping: 类别名称到ID的映射字典 # 确保输出目录存在 Path(txt_dir).mkdir(parentsTrue, exist_okTrue) # 关键点顺序定义示例为COCO17关键点 keypoints_order [ nose, left_eye, right_eye, left_ear, right_ear, left_shoulder, right_shoulder, left_elbow, right_elbow, left_wrist, right_wrist, left_hip, right_hip, left_knee, right_knee, left_ankle, right_ankle ] for json_file in Path(json_dir).glob(*.json): with open(json_file, r, encodingutf-8) as f: try: data json.load(f) except json.JSONDecodeError: print(f警告: {json_file} 不是有效的JSON文件已跳过) continue # 准备输出文件路径 txt_path Path(txt_dir) / f{json_file.stem}.txt with open(txt_path, w, encodingutf-8) as txt_file: img_width data[imageWidth] img_height data[imageHeight] # 分离边界框和关键点 bboxes [s for s in data[shapes] if s[shape_type] rectangle] points {s[label]: s for s in data[shapes] if s[shape_type] point} for bbox in bboxes: # 处理类别和边界框 class_id class_mapping.get(bbox[label], -1) if class_id -1: continue # 计算归一化坐标 x_min, y_min bbox[points][0] x_max, y_max bbox[points][1] x_center ((x_min x_max) / 2) / img_width y_center ((y_min y_max) / 2) / img_height width (x_max - x_min) / img_width height (y_max - y_min) / img_height # 写入基础信息 line [ str(class_id), f{x_center:.6f}, f{y_center:.6f}, f{width:.6f}, f{height:.6f} ] # 处理关键点 for kp_name in keypoints_order: if kp_name in points: kp points[kp_name] x kp[points][0][0] / img_width y kp[points][0][1] / img_height vis 1 if kp.get(group_id) 1 else 2 line.extend([f{x:.6f}, f{y:.6f}, str(vis)]) else: line.extend([0.000000, 0.000000, 0]) txt_file.write( .join(line) \n) # 使用示例 class_map {person: 0, cat: 1} # 定义类别映射 convert_labelme_to_yolo( json_dirpath/to/json_files, txt_dirpath/to/output_txt, class_mappingclass_map )4. 常见问题与解决方案编码问题处理# 处理可能的中文路径问题 def safe_open(path, moder, encodingutf-8, errorsignore): return open(path, modemode, encodingencoding, errorserrors)典型错误场景坐标越界添加边界检查def normalize_coord(value, max_val): return max(0.0, min(1.0, value / max_val))关键点顺序不一致使用OrderedDict维护顺序多对象处理按group_id分组处理表常见错误及解决方法错误类型现象解决方案编码错误文件读取失败指定encodingutf-8坐标异常数值超出[0,1]范围添加归一化边界检查关键点缺失部分关键点未标注提供默认值填充顺序混乱关键点顺序不一致使用预设顺序强制对齐5. 高级技巧与性能优化对于大规模数据集转换可以考虑以下优化策略多进程处理from multiprocessing import Pool def process_file(json_path): # 单个文件处理逻辑 pass with Pool(processes4) as pool: pool.map(process_file, Path(json_dir).glob(*.json))增量处理# 记录已处理文件支持断点续传 processed set() log_file processed.log if Path(log_file).exists(): with open(log_file) as f: processed.update(f.read().splitlines())内存优化# 流式处理大文件 def iter_json_objects(file_path): with open(file_path) as f: for line in f: yield json.loads(line)在实际项目中建议先将小批量数据转换后验证效果再扩展到整个数据集。转换完成后可使用以下命令快速检查结果文件# 检查前10个转换后的文件 head -n 10 path/to/output/*.txt # 统计各类别数量 awk {print $1} path/to/output/*.txt | sort | uniq -c

ArduPilot开源框架：从工程目录到硬件总线的设计哲学

1. ArduPilot开源框架的设计哲学第一次打开ArduPilot的代码仓库时，我完全被它的规模震撼到了——超过70万行的核心代码，支持从多旋翼到潜艇的多种设备。但真正让我着迷的是它如何用清晰的架构管理如此复杂的系统。这就像走进一个设计精良的实验室&#…...

2026/5/17 9:48:32 阅读更多 →

猫抓插件：解决你浏览器资源下载的三大痛点

猫抓插件：解决你浏览器资源下载的三大痛点【免费下载链接】cat-catch 猫抓浏览器资源嗅探扩展 / cat-catch Browser Resource Sniffing Extension 项目地址: https://gitcode.com/GitHub_Trending/ca/cat-catch 你是否曾经遇到过这样的困扰：看到…...

2026/5/17 9:47:55 阅读更多 →

超声图像存储：技术、标准与实践指南

超声图像存储：技术、标准与实践指南引言超声成像作为现代医学诊断的核心技术之一，每天在全球范围内产生海量的图像数据。这些数据不仅是患者诊疗过程的直接记录，更是临床研究、教学培训和医疗质量追溯的关键依据。因此，如何高效…...

2026/5/17 9:47:50 阅读更多 →

app扫描wifi的时候需要打开GPS定位----否则扫不到

这是很奇怪的一个事情，wifi和定位有什么关系？但是就是要打开。...

2026/5/17 0:00:27 阅读更多 →

AMD Ryzen调试神器SMUDebugTool：免费开源工具让你的处理器性能飞起来！

AMD Ryzen调试神器SMUDebugTool：免费开源工具让你的处理器性能飞起来！ 【免费下载链接】SMUDebugTool A dedicated tool to help write/read various parameters of Ryzen-based systems, such as manual overclock, SMU, PCI, CPUID, MSR and Power Tab…...

2026/5/17 0:07:16 阅读更多 →

Midjourney抽象表现主义风格迁移全链路（从梵高笔触到AI熵增美学的底层逻辑解密）

更多请点击： https://intelliparadigm.com 第一章：Midjourney抽象表现主义风格迁移全链路（从梵高笔触到AI熵增美学的底层逻辑解密） 抽象表现主义并非仅关乎色彩与笔触的失控，而是神经感知系统在高维特征空间中对抗坍缩…...

2026/5/17 0:11:51 阅读更多 →

2026届毕业生推荐的AI科研方案实际效果

Ai论文网站排名（开题报告、文献综述、降aigc率、降重综合对比） TOP1. 千笔AI TOP2. aipasspaper TOP3. 清北论文 TOP4. 豆包 TOP5. kimi TOP6. deepseek 处在学术研究的起始阶段，开题报告的撰写常常令好多研究生以及青年学者觉得麻烦&…...

2026/5/17 0:12:15 阅读更多 →