Softmax Regression（多分类逻辑回归）

Softmax Regression 是用线性模型 + Softmax，把一个样本映射成“多类别概率分布”，并选择概率最大的类别作为预测结果。

Softmax Regression = Logistic Regression 的多分类版本

在 binary classification 中：

👉 P(y = 1 | x)

但在 多分类问题 中：

👉 “属于哪一个 class？”

👉 所有类别的概率加起来必须 = 1

所以：

❌ sigmoid 不够

✅ 需要 Softmax function

假设有 K 个类别：

👉 W₁, W₂, …, W_K

对每个 class 都算一个：


z_k = W_k · X

Softmax function 做了两件事：

公式不用死记，只记含义：

Softmax 把一堆 score，变成“概率分布”

输出结果是：


P(y = class_1)
P(y = class_2)
...
P(y = class_K)

并且：


所有概率之和 = 1

👉 选概率最大的那个 class


ŷ = argmax(probabilities)

分类目标（4 类）：

模型输出：


Dog     : 0.80
Cat     : 0.05
Rabbit  : 0.05
Bear    : 0.10

👉 最终预测：Dog

Softmax Regression 使用：Categorical Cross-Entropy Loss

记忆句：

它会对“把正确类别给很低概率”的情况，惩罚得非常重

（和 Logistic Regression 的 Log Loss 本质一致）