【激活函数】01——小白直觉篇

张

张建站

2026/4/8 19:11:24

10分钟阅读

这是"激活函数"系列的第一篇。这篇文章不需要你有任何数学或编程基础，只要你听说过"神经网络"就够了。我们从最朴素的直觉出发，搞清楚激活函数到底在干什么、为什么重要。一、为什么需要激活函数？1.1 从一个具体问题说起假设你要教一个神经网络区分猫和狗的图片。你可能听说过，神经网络是"一层一层"堆起来的。那问题来了：堆更多层，网络就更强吗？答案是：不一定。如果每一层都只做线性变换，那堆再多层也没用。1.2 什么是线性变换？先别被这个词吓到。线性变换就是"乘一个数再加一个数"，也就是你初中学过的：y=wx+b y = wx + by=wx+b 一个神经元做的事情，本质就是这样：拿到输入xxx，乘以权重www，加上偏置bbb，得到输出yyy。如果我们把两层这样的操作叠起来呢？y=W2(W1x+b1)+b2=W2W1x+W2b1+b2 y = W_2(W_1 x + b_1) + b_2 = W_2 W_1 x + W_2 b_1 + b_2y=W2(W1x+b1)+b2=

Qwen3.5-9B实操手册：ss -tlnp端口检查+nvidia-smi显卡验证

Qwen3.5-9B实操手册：ss -tlnp端口检查nvidia-smi显卡验证 1. 项目概述 Qwen3.5-9B是一款拥有90亿参数的开源大语言模型，具备强大的逻辑推理、代码生成和多轮对话能力。该模型支持多模态理解（图文输入）和长上下文处理&#xff08…...

2026/4/8 19:09:43 阅读更多 →

Qwen3.5-2B效果惊艳：2B参数实现GIF动图内容理解与分帧描述能力

Qwen3.5-2B效果惊艳：2B参数实现GIF动图内容理解与分帧描述能力 1. 轻量化多模态模型新标杆 Qwen3.5-2B作为Qwen3.5系列的小参数版本（20亿参数），在保持轻量化的同时实现了令人惊艳的多模态能力。这个仅2B参数的模型专为低功耗、低…...

2026/4/8 19:07:43 阅读更多 →

医疗AI平台接入FHIR时C#配置突现500错误？紧急修复指南：从TLS 1.2协商失败到X.509证书链验证全路径诊断

第一章：医疗AI平台接入FHIR的典型故障场景与500错误定位当医疗AI平台通过RESTful接口调用FHIR服务器（如HAPI FHIR、IBM FHIR Server）时，HTTP 500 Internal Server Error 是高频且棘手的问题。该错误表面指向服务端异常&#xff0c…...

2026/4/8 19:05:18 阅读更多 →