03 机器视觉为什么这么准?从像素到 YOLO 一篇讲透前面两弹咱们把硬件三件套拆得七零八落,今天终于轮到“眼睛后面的大脑”了——软件怎么把一堆像素变成“这是划痕、那是漏焊、螺丝歪了”的判断?新手听了直呼“原来AI也不是魔法”,老手听了直点头“当年我手写阈值调到吐,现在YOLO一键搞定”!机器视觉的本质,是把世界拆成像素,再用算法重新理解它。先从最基础说起——像素是什么?简单粗暴:一张图片就是一张“马赛克拼图”。每个小格子叫一个像素(picture element),黑白图里它只有一个灰度值(0-255,0最黑、255最白);彩色图是RGB三通道,每个通道0-255,组合出1670万种颜色。车间比喻:就像你看电路板焊点,相机拍下来其实就是几百万个小灯泡亮暗组合。AI先把这些数字吃进去,再慢慢“看懂”。传统视觉时代(2015年前最流行):靠人工写规则。经典三板斧:灰度+阈值分割:把彩图转灰度,再设个阈值(比如亮度120算白),背景变黑、目标变白。看上面硬币例子,亮的地方全白出来了,简单粗暴但怕光线变化。边缘检测(Canny):找物体边界。算法先模糊去噪,再算梯度(哪里颜色突变),最后双阈值连线。看这张美女照片,从模糊到只剩轮廓线,车间里测螺丝边缘超好用!