風控模型算法常見于金融領域,包括但不限于商業銀行、持牌消費金融公司、汽車金融公司、互聯網金融、保險公司、互聯網上市公司等各行各業。隨著NLP、機器學習算法、神經網絡技術等快速發展,大數據風控模型已經廣泛應用于各類商業領域。
一、什么是風控模型算法?
風控模型算法是一個比較泛泛的概念,包括很多內容,依據貸款流程,可以分為貸前、貸中、貸后風控模型,依據風險控制的對象又可以分為企業風控模型和個人風控模型,其中企業風控模型基于場景又可以細分為財務風險模型、稅務風險模型、擔保風險模型、訂單和庫存風險模型、進出口風險模型、關聯風險模型、僵尸企業識別模型等等,而這些模型中又包括各種各樣的算法,其如在金融風控模型中,常用的且比較經典的算法——邏輯回歸(logistic回歸)、決策樹、線性回歸、神經網絡、K均值聚類分析、極限梯度模型。
二、風控模型算法有哪些?
1、邏輯回歸模型
邏輯回歸模型最早可以追溯到 1830 年代,當時比利時統計學家 P.F. Verhulst 發明它來描述人口動態。
之所以常用于風控模型,主要在于其優點比較突出,包括但不限于該模型結果可解釋較強,模型適用性較好,可以適用于連續性和類別性自變量,此外,預測結果是介于0和1之間的概率,因此,該算法被廣泛使用。
2、風控模型算法—層次聚類算法(Hierarchical Clustering)
層次聚類算法將相似樣本合并為為一簇,并不斷迭代,生成聚類的過程,如下圖
K均值(Kmeans)聚類算法是一種無監督學習聚類算法。對數據集中在某些方面相似的數據成員進行分類組織。通過指定想要劃分的類別個數K,將沒有標注的 M 個樣本通過迭代的方式聚集成K個簇。其中,樣本間的相似度以樣本之間的距離作為指標來劃分。
備注:Kmeans算法的所有賬戶聚類結果 K=3
冰鑒科技基于K均值(Kmeans)聚類算法開發出了經偵反洗錢解決方案,基于銀行帳戶交易流水數據,為經偵在線索梳理和案件偵破過程中提供更便捷、更高效、更智能的技術方案支持。
3、XGBoostT
XGBoostT全稱極限梯度算法,是由2016年由華盛頓大學陳天奇老師帶領開發的一。XGBoost是一個可供用戶輕松解決分類、回歸或排序問題的軟件包。它內部實現了梯度提升樹(GBDT)模型,并對模型中的算法進行了諸多優化,在取得高精度的同時又保持了極快的速度。目前,已經廣泛應用于各類風控模型領域。
線性回歸、神經網絡等其他三類算法在金融風控、經濟預測等模型搭建領域也是比較常見的,再次不一一介紹。
好了,以上是對風控模型算法的介紹,歡迎交流。