2001-A Simple Approach to Ordinal Classification

张

张建站

2026/4/17 2:00:18

10分钟阅读

2001-A Simple Approach to Ordinal Classification1.科学问题如何在不修改现有分类算法的前提下使其能够利用类别之间的顺序信息从而提升分类性能。如何在分类模型中有效引入有序关系同时保持模型的通用性和灵活性使其可以适用于能产出概率的基础分类器。2.核心思想作者将一个包含 k 个有序类别的分类问题转化为 k-1 个二分类问题。每个二分类器学习目标变量是否大于某个阈值即是否超过某一类别。最终通过组合这些二分类器的输出概率恢复原始类别的概率分布。Pr(V1)1−Pr(TargetV1) Pr(V_1) 1 - Pr(Target V_1)Pr(V1)1−Pr(TargetV1)Pr(Vi)Pr(TargetVi−1)×(1−Pr(TargetVi)),1ik Pr(V_i) Pr(Target V_{i-1}) \times \left(1 - Pr(Target V_i)\right), \quad 1 i kPr(Vi)Pr(TargetVi−1)×(1−Pr(TargetVi)),1ikPr(Vk)Pr(TargetVk−1) Pr(V_k) Pr(Target V_{k-1})Pr(Vk)Pr(TargetVk−1)把多分类问题转成 k−1 个“是否超过某个等级”的问题再通过概率差分恢复原始类别概率。3.代码importnumpyasnpimportpandasaspdfromsklearn.linear_modelimportLogisticRegressionfromsklearn.baseimportclonefromsklearn.preprocessingimportKBinsDiscretizerfromsklearn.model_selectionimportRepeatedStratifiedKFoldfromsklearn.metricsimportaccuracy_scoredefmake_ordinal_target(y_continuous:np.ndarray,n_bins:int)-np.ndarray:y_2dy_continuous.reshape(-1,1)discKBinsDiscretizer(n_binsn_bins,encodeordinal,strategyquantile)y_binneddisc.fit_transform(y_2d).astype(int).ravel()returny_binnedclassOrdinalClassifier():def__init__(self,base_estimator,class_order):self.base_estimatorbase_estimator self.class_orderclass_orderdeffit(self,X:np.ndarray,y:np.ndarray)-OrdinalClassifier:self.classes_np.array(sorted(np.unique(y)))self.thresholds_self.classes_[:-1]self.n_classes_len(self.classes_)self.models[]forthresholdinself.thresholds_:y_binary(ythreshold).astype(int)modelclone(self.base_estimator)model.fit(X,y_binary)self.models.append(model)returnselfdef_predict_gt_proba(self,X:np.ndarray)-np.ndarray:gt_probs[]formodelinself.models:probamodel.predict_proba(X)# Probability of label 1, i.e. P(y threshold)pos_idxlist(model.classes_).index(1)gt_probs.append(proba[:,pos_idx])returnnp.column_stack(gt_probs)defpredict_proba(self,X:np.ndarray)-np.ndarray:gtself._predict_gt_proba(X)n_samplesgt.shape[0]kself.n_classes_ probsnp.zeros((n_samples,k),dtypefloat)# First classprobs[:,0]1.0-gt[:,0]# Middle classesforiinrange(1,k-1):probs[:,i]gt[:,i-1]*(1.0-gt[:,i])# Last classprobs[:,k-1]gt[:,k-2]# Normalize for numerical stabilityrow_sumsprobs.sum(axis1,keepdimsTrue)nonzerorow_sums.squeeze()0probs[nonzero]probs[nonzero]/row_sums[nonzero]returnprobsdefpredict(self,X:np.ndarray)-np.ndarray:probsself.predict_proba(X)returnself.classes_[np.argmax(probs,axis1)]defevaluate_models(X:np.ndarray,y_ord:np.ndarray,random_state:int42)-None:cvRepeatedStratifiedKFold(n_splits10,n_repeats10,random_staterandom_state)ord_scores[]baseLogisticRegression()fortrain_idx,test_idxincv.split(X,y_ord):X_train,X_testX[train_idx],X[test_idx]y_train,y_testy_ord[train_idx],y_ord[test_idx]ord_modelOrdinalClassifier(base_estimatorclone(base),class_orderlist(sorted(np.unique(y_ord))))ord_model.fit(X_train,y_train)ord_predord_model.predict(X_test)ord_scores.append(accuracy_score(y_test,ord_pred))print(fOrdinal mean{np.mean(ord_scores):.4f}std{np.std(ord_scores):.4f})if__name____main__:dfpd.read_csv(datasets/Abalone.csv,headerNone)Xdf.iloc[:,:-1].to_numpy()ydf.iloc[:,-1].to_numpy()y_ordmake_ordinal_target(y,len(np.array(sorted(np.unique(y)))))OrdinalClassifier.evaluate_models(X,y_ord)

告别Turbo码：深入5G NR LDPC码的速率匹配与HARQ机制（含TBS计算避坑点）

5G NR LDPC码实战：从速率匹配到HARQ优化的工程指南当我们在实验室第一次用LDPC码跑出比Turbo码高30%的吞吐量时，整个团队都意识到——5G物理层的游戏规则真的变了。但随之而来的是一连串新问题：为什么同样的码率配置，LDPC在256QA…...

2026/4/17 1:59:28 阅读更多 →

NXP恩智浦智能车四轮组-- 2.电磁检波电路优化与运放模块实战解析

1. 电磁检波电路基础与优化思路第一次接触电磁检波电路时，我也被那一堆电容电阻绕晕了。直到在NXP智能车项目里反复调试才发现，这东西就像个"信号翻译官"——把交流电磁信号转换成单片机ADC能读懂的直流信号。组委会给的参考设计确实经典&…...

2026/4/17 1:52:25 阅读更多 →

CSS如何实现粘性定位_掌握position-sticky布局技巧

position:sticky不生效的常见原因包括：父级有overflow:hidden/auto/scroll；未设置top/bottom/left/right值；祖先元素含transform/filter/will-change；表格中thead默认不支持；flex/grid容器未设height和overflow:auto&a…...

2026/4/17 1:42:15 阅读更多 →