每日最新頭條.有趣資訊

周誠君:構建多層次征信市場思考

  文/周誠君(中國人民銀行金融研究所所長)

  征信市場呈現多元化趨勢

  征信業是通過收集、加工信用信息以防範信息主體信用風險的行業。根據法律規定,人民銀行履行征信業監督管理職能,由下設部門征信管理局負責征信業管理。為防範金融風險、促進金融業發展提供相關信息服務,國家設立金融信用信息基礎數據庫(即征信系統),由中國人民銀行征信中心負責建設、運行和維護。征信中心通過采集、整理、保存和加工信息主體的基本信息、信用信息和反映其信用狀況的其他信息,為金融機構、信息主體、政府等對象提供征信服務。絕大多數信息主體,不管是企事業部門還是個人,原則上只要有銀行账戶、跟銀行打過交道,就都可以通過自助查詢機、手機銀行等多種查詢渠道了解其信用記錄。應該說,這個系統以及由此形成的信用記錄目前已經得到了社會的廣泛認可,在經濟社會運行中發揮著非常重要也非常基礎的作用。

  在社會各界的共同關心和支持下,人民銀行建立了覆蓋全國的企業和個人征信系統,采集了企業和個人的相關信用信息,並按法定程序為全社會提供征信服務,特別是為金融機構的信貸審批、貸後管理和其他投融資活動提供金融信用信息支持。這是目前我國征信市場的主流模式,人民銀行征信中心是目前征信市場上最重要的征信服務供應主體。隨著市場發展、技術進步,以及金融業自身的快速變革,征信市場也開始呈現出越來越多元化的趨勢。比如,2018年互聯網金融協會聯合八家機構發起組建了百行征信,該機構先後獲得了個人征信和企業征信業務資質;2020年底,樸道征信有限公司獲得人民銀行頒發的第二張個人征信牌照。同時,一些互聯網平台公司也通過運用大數據對企業和個人信用狀況進行刻畫,給出客戶畫像和評分,進行所謂的“助貸”,為金融機構信貸或其他信用活動決策提供參考。總體來看,大數據征信服務在一定範圍內和一定程度上得到了市場,特別是部分金融機構的認可,部分金融機構甚至對這些評價形成了一定的依賴性。由此我們看到,在以政府為主導建設的社會征信體系基礎上,通過社會資本特別是私人部門的參與,征信體系開始多元化,並可能逐步形成多層次、競爭性的征信市場體系。

  征信市場的三個層級結構

  多層次征信體系有利於為市場提供多樣化的征信服務,增加市場的競爭性和可選擇性,從而提高征信市場效率,這也是成熟市場國家的普遍經驗。按照國際經驗和目前我國發展狀況,征信市場總體上可形成以下三個層級。

  第一個層級:主流征信服務

  主流征信服務是由以國家行為主導為特徵的全國征信系統進行提供的,由官方運行,國家統一采集、管理和運用數據。在中國,主流征信服務由人民銀行管理運行、人民銀行征信中心具體負責。該系統負責采集所有信息主體在與金融機構打交道的過程中形成的相關信用記錄,如企業貸款有沒有及時歸還,個人信用卡或消費貸款以及住房抵押貸款抵押月供等有沒有及時足額歸還,等等。這個系統具有以下幾個重要特徵。

  第一,這是政府行為或準政府行為,由國家興建系統和數據庫,由國家強製性地采集數據,而且面向所有的金融機構采集規定數據。這個規定表現為按同一個範圍、內容、格式采集數據,換句話說,國家征信系統采集的數據是標準化的。對於企業,不管是對於國有企業還是民營企業,采集數據的標準是統一的。對於個人,不管是誰,采集數據的標準都是統一的。標準化還意味著數據的通用性,不僅數據本身是通用的,而且數據統計口徑、報送模版等也是通用的。數據及其采集的標準化和通用性為采集相關信息時獲得被采集對象的許可和授權提供了方便,為金融機構按照統一標準接入系統並上傳數據提供了便利。正因如此,這個系統廣泛連接各類金融機構,服務大多數市場主體,得到了全社會的廣泛信任和支持。

  第二,這個系統采集和處理的是結構化數據。結構化數據意味著可以用二維表格來表述和實現,用數據庫來存儲和管理。這些數據具有高度的組織性和整齊的格式化,數據信息可通過表格形式準確反映,嚴格地遵循數據格式與長度規範。一方面,標準化與結構化是有內在聯繫的,只有標準化了,有明確的格式、規範、處理標準,才能實現結構化展現和管理,以及在此基礎上的分析;另一方面,標準化、格式化的數據更容易被搜索、訪問和使用。我國現在已經形成了比較成熟的結構化數據分析、處理、加工和運用能力。

  第三,強調數據采集相關性原則。在確定采集數據的範圍時,要非常清晰地體現目標導向,即所采集的數據與所反映的信息主體信用狀況高度相關,這些數據的采集、處理結果與對象信用狀況具有相對比較直接的因果關係。或者更準確地說,可以在某個置信區間內,按多大概率來評價該信息主體的信用狀況,從而可供金融機構或其他信用評價結果用戶參考。

  第四,強調真實性和準確性原則。這也是相關性原則發揮作用的前提,即這些數據都是真實、準確反映被采集對象的行為及其結果的。比如,某個信息主體在什麽領域、哪筆業務上有違約行為,違約了多長時間、多少金額,系統都會準確記錄和反映,都可以讓該信息主體進行覆核查證。如果記錄有誤,在該信息主體有充分的證據和理由的情況下,則可按法定程序進行修改、調整。

  第五,“最少、必要”原則。高質量的數據意味著數據真實準確、精度高,與刻畫對象信用狀況高度相關,這要求數據的采集、加工和管理要有較高的資源投入和成本,而且也涉及信息主體的個人隱私或商業秘密,因此需要強調數據采集的“最少、必要”原則。要保證征信系統所采集數據的標準是清晰透明的,其內容範圍是最少且必要的,對所有對象是一視同仁、非歧視的,相應的數據庫是簡單、規則統一、結構上乾淨利落的。首先不采集不相關數據,其次即使采集相關數據,也不采集不必要的數據,或者過多的冗余數據。從國際範圍來看,凡是具有類似法律授權的征信機構,其采集的數據也都是嚴格受限的,多數情況下,用以描述和刻畫每一個被采集對象的數據一般不超過200項。

  第二個層級:替代數據征信服務

  替代數據征信服務是基於采集和使用替代數據進行提供的。現實中,並不是所有的信息主體都與銀行等金融機構發生業務聯繫。有些人從來不使用信用卡,有些企業也從來沒有獲得過銀行貸款,或者很少跟金融機構有類似的信用服務業務。這意味著這些信息主體是缺乏傳統信用信息的,按照統一標準、以“必要、最少”原則采集數據的征信系統無法采集這些信息主體的信用記錄,也難以通過對標準化、結構化數據的管理和運用來準確刻畫信息主體的信用狀況。一個結果是,這些信息主體在經濟活動中很難獲得金融支持和相關金融服務,比如無法獲得貸款、不能簽發信用票據,甚至有些保險產品都不能購買。

  為此,市場試圖尋找一些解決方案,一個途徑是采集替代數據,並通過使用替代數據給出信用評價。替代數據(Alternative Data)是相對於現有征信體系中普遍采集和運用的標準化數據而言的,是傳統信用數據之外同樣有周期性信用支付特徵的账戶及相關信息,一般也是采取先服務後付費的模式,或者在一定程度上可以賒銷,由對方定期或不定期付款結清等。比如,個人或小微企業的房租及繳付信息,通信和寬頻上網支付信息,一些水、電、氣等市政公用設施支付信息等,車險等周期性繳費保險支付信息,甚至包括账戶、資金流水、稅收和社保繳納,以及與工資支付相關的“五險一金”信息等。雖然這些信息主體沒有跟銀行等金融機構發生直接的信用業務往來,金融機構無法通過主流征信服務判斷其信用狀況,但仍然可以通過替代數據征信服務對相關信息主體的信用狀況作出判斷。

  目前一些基層地方政府正在積極推動類似的工作,其出發點是推動普惠金融發展,更好支持當地小微企業、個體工商戶獲得金融支持。在實踐中,替代數據征信服務也確實發揮了一定效果,增加了金融的可獲得性和覆蓋面,同時有助於金融機構對這類信息主體提供金融支持時進行合理的定價和風險控制。一些地方(如浙江台州、福建泉州等)探索出了各具特色的替代數據征信服務模式。基層地方人民政府參與或積極推動相關工作的另外一個重要原因是,地方政府及其部門比較全面地掌握了替代數據源,特別是與基礎設施和公共設施服務及收費相關的信息。另外,一些科技企業也積極與地方政府及其部門合作,為其提供算法、模型和相關服務,自身也獲得增值收益。

  但也要看到,替代數據的采集和使用仍然具有很大的局限性。一方面,從理論上說,即使是替代數據,其采集和管理的一個重要原則是仍然要強調其背後的信用相關性特徵,用以刻畫對象的信用狀況。而我國相當一部分公用設施服務是先付費後消費的,不太具有明顯的信用服務特徵。另一方面,替代數據與傳統征信系統采集的數據相比是非標準化的,不同地區、不同信息主體,用以分析和刻畫其信用狀況的替代數據可能不盡相同,甚至在不同的時期也會有所不同。比如,對於東部地區的小微企業、個體工商戶與西部地區的小微企業和個體工商戶,其替代數據的采集範圍、具體內容、評價方法等可能就有比較大的差異。

  即便如此,替代數據仍然是結構化數據,仍然是真實準確、具有相關性的數據,因而也要強調“最少、必要”原則,仍然需要強調其合理的邊界。這些替代數據在可追溯、可核查和可糾正方面與傳統數據類似,但不像主流征信數據那樣具有全國一致的標準和通用性,針對不同的評價對象而有所不同(如針對不同地區、不同類型的小微企業和個體工商戶),相應地,其相關數據庫結構、相應的算法模型和評價方法等也會有差異。顯然,這樣的工作交給地方或者行業協會更為合適,但解決數據采集、使用以及增值服務的法律授權和合規問題也顯得非常重要。一方面,地方政府及其部門(包括一些基礎設施、公共設施的營運機構)所掌握的涉及信息主體的各類相關信息,在多大程度上可被用作信用評價的替代數據並獲得采集對象的授權?在考慮尊重和保護信息主體個人隱私或商業秘密方面,是否也存在必要的邊界和明確的界定?另一方面,相關利益主體除了地方政府外,還涉及提供模型、算法的科技公司或第三方谘詢組織,從事系統開發、運維和增值服務的相關機構等,究竟由誰來提供最終的征信服務,進行信用評價和出具信用報告,其運行和業務模式具體怎麽開展,如何確保其公信力,如何獲得數據使用的授權,是否需要必要的準入和持牌管理?等等。這些問題需要管理部門盡早著手研究,明確監督管理規則,解決好基於征信目的的數據采集和使用的合法性問題。

  第三個層級:大數據征信服務

  一些互聯網平台公司通過運用基於一定場景的“大數據”,對相關信息主體進行“精準畫像”,作出信用評價。這個“大數據”包括該信息主體平時的上網瀏覽和搜索記錄、網上消費和相關網絡支付數據、工作場所和經常光顧的商業場所軌跡以及根據網絡數據推測出的收入、財產支出等數據。在這方面,我們並不陌生,像京東收據、美團生意貸等都與此有關。總體看,這也是一種信用評價模式,是傳統征信業的有益補充。而且,與主流征信和替代征信主要采集使用信用強相關的信息相比,大數據征信的信息采集和使用具有截然不同的特徵。

  第一,在形態上多數不屬於結構化數據。基於互聯網、被廣泛采集用以“客戶畫像”的大數據往往基於各種互聯網生態和場景,如消費記錄、瀏覽痕跡、交通行程、社交軌跡、心理測量和相關行為選擇等,個體差異非常大,相當部分屬於文本數據、圖像數據、傳感數據、衛星定位數據等非結構化數據。這些信息不像結構化數據那樣,可以用簡單清晰、標準化的二維數據表格來體現和存儲,且其數據量級要遠遠超過傳統信用信息和替代信用信息,是真正意義上的“大數據”,相應地其采集、處理、算法和模型上與傳統數據和替代數據相比也有非常大的差別。

  第二,沒有那麽強的相關性和可解釋性。上述大數據信息中包含大量的過程記錄,更多屬於過程數據而非結果數據,還包含大量相關分析、推測和評價類信息,很難說這些信息具有充分的客觀性、真實性和準確性。因此,一方面,確認這些信息、數據與被采集對象的信用狀況存在理論上的嚴格相關性比較困難,其關係往往並不是我們熟悉的大數定律、正態分布所能解釋的,可能在統計上相關性並不顯著,也不能給出明確的置信區間,但它仍然可以做到“精準畫像”,並通過實踐發現其在很大程度上是可信的。另一方面,在信息和數據的呈現方面,大數據分析及其結果很難像主流征信和替代數據征信那樣簡潔地向用戶作出展示並進行解釋。對於有些數據及其運用,用戶可能難以理解,也不一定認可系統作出的部分推測、評估信息,甚至無法對他不認可或認為有誤的信息及數據提出申辯、覆核和更正要求。

  第三,不太容易有效提升標準化和透明度。既然大數據采集的信息主要基於互聯網生態和場景,大部分屬於非結構化數據,與采集對象信用狀況的直接相關性和可解釋性不是那麽強,所以實踐中很難對這些數據的範圍、采集乃至處理進行標準化規範。對采集對象的信用評價往往基於海量數據的綜合運用、運算,這些數據的采集並非基於傳統的相關性關係,因此很難說必須遵循“最少、必要”原則,在有些領域,甚至是相關非結構化數據越多越好。此外,對采集對象作出相對準確的信用評價,除了數據本身,還在很大程度上取決於數據治理、算法和模型。由於數據本身的非結構化、非標準化和弱相關性,不同互聯網生態和場景的數據采集、存儲、治理以及算法和模型可能都有非常大的差異。這種情況下,很難要求這些互聯網平台完全公開其數據治理、算法和模型,並保持其透明度,一是沒有標準;二是差異太大,缺乏可比性;三是相關性和可解釋性不足、邊界不清晰、界定困難;四是涉及用戶隱私和企業核心競爭力有關的商業秘密。

  有效監管大數據征信業務的基本原則

  大數據征信以及相關平台的積極作用

  首先,大數據征信是多層次征信市場體系的有益補充,可以競爭性地為市場主體提供信用評價服務,特別是針對缺乏傳統信用數據或替代數據的長尾客戶和小額高頻場景。

  其次,要明確和規範互聯網平台采集和使用互聯網場景大數據並進行信用評價的合法合規問題。一方面,要明確采集客戶數據的規程、原則和運用範圍;另一方面,要認可和尊重法律授權範圍內的大數據采集和運用。總體而言,這些大數據是互聯網平台公司基於一定商業模式、從特定商業場景中采集並進行加工處理的,互聯網平台公司投入了大量資源,進行了深度的數據處理,構建了自己的算法、模型,最終為客戶“畫像”、提供信用評價,並在一定範圍內為服務對象所認可。為此,還是要尊重這些企業投入的資源、付出的勞動、作出的貢獻,特別是其中的數據治理、算法和模型等。數據治理、算法和模型很大程度上是互聯網平台作為數據采集和加工機構為客戶進行精準畫像的“看家本領”,甚至可能是核心競爭力。同樣的一堆大數據,即使是針對同一個信息主體,如果是產生於不同的互聯網生態和場景,其數據含義、生命力和市場價值也可能大相徑庭,不同的互聯網平台根據其自身的數據治理和算法模型形成的信用評價結果往往也不盡一致。因此,單純地要求進行數據共享或增加透明度,可能並沒有那麽突出的實際意義。

  對大數據征信業務要強化監管

  正確理解互聯網大數據使用的合法性。總體看,大多數互聯網平台基於一定的場景采集用戶信息,在此過程中,通常通過與客戶簽訂格式合約或相關協議的方式,獲得客戶的同意和授權。從這個意思上說,其數據采集乃至使用是有其合法性基礎的,至少在采集和使用上獲得了客戶的授權。需要強調的是,單筆數據采集的授權和合法性並不能解釋或推導出整體數據運用的合法性。經濟學有個基本原理,叫“合成謬誤(Fallacy of Composition)”,每一個局部都是合理、理性和有效的,但加起來卻成為謬誤。簡單來說,就是不能用局部的合理性解釋整體的合理性。比如,金融市場由很多金融機構組成,單個金融機構的財務健康性不等於整個金融體系的健康性,即使每個金融機構的資產負債表都不錯,都符合風控和監管要求,但並不能保證整個金融系統沒有風險。因為金融市場、金融機構廣泛連接,部分經營活動及資產估值等具有顯著相關性和順周期性,其行為往往具有非常強的相互傳染性,因此在某個金融機構受到某種突發風險事件影響或者外部衝擊時,有可能迅速擴展到整個金融系統從而引發系統性金融危機。同樣,在互聯網平台大數據采集和運用過程中,也存在類似的問題。在采集用戶數據的過程中,即使逐筆獲得了用戶授權,具有合法性,但是當這些數據匯總起來,成為包含數千萬、數億甚至數十億信息主體相關信息的超大型數據庫時,就不能用單筆的合法性解決整體合法性問題。“合成謬誤”這一基本原理告訴我們,逐筆合法采集的數據,當它匯總成超大型數據庫時,單筆的合法性並不足以解釋和推導出整體數據庫使用的合法性。因為當這些逐筆采集的數據匯集成超大型數據庫時,它在性質上就越來越具有公共品或準公共品屬性了,不再僅僅呈現為私人財產權特徵了,也不能再按照私人財產權屬性的商品對它進行監督管理了。公共品或準公共品往往具有典型的外部性,這種外部性具有非排他性和非競爭性,不容易有效界定產權,容易產生搭便車和道德風險問題。因此公共品或準公共品一般無法由私人部門提供,而通常由政府或其他公共部門提供。

  大數據的采集和處理在邏輯上恰恰和上述過程相反。一方面,互聯網平台收集了信息主體的各類相關信息,具有越來越顯著的公共社會性和系統重要性,其管理和應用可能具有廣泛的社會影響,這意味著該超大型數據庫本身就是一個公共品;另一方面,海量數據的采集、融合和大數據處理使得數據管理、運用產生了廣泛的協同效應和網絡外部性,產生了公共品所具有的典型正外部性,這種正外部性是附屬於公共品的,應該為全體社會成員或者至少是所有被采集對象所共有。但技術發展特別是大數據、人工智能等技術的發展,傳統上不太容易界定產權的公共品及其外部性已經越來越容易被清晰地界定產權。互聯網平台正是通過巨量數據采集、處理,以及相關算法、算力和模型,將上述公共品私人部門化了,將上述正外部性內部化了,而且內部化為互聯網平台公司的高額利潤。

  回到基本的經濟學原理,解決這個問題的思路有兩條。一條思路是不讓它成為公共品,對數據采集規模和範圍進行限制,這顯然不現實;另一條思路是,承認其公共品屬性,並按照公共品的基本原理和規則來管理。對於公共品,不太容易界定其外部性產權,因而一般由政府或其他公共部門提供。隨著技術進步,有效界定公共品外部性產權的能力已越來越強,因此一些公共品由私人部門通過價格機制來提供也行得通。但同時也必須認識到,公共品一定有外部性,尤其是如果有顯著的正外部性,這種正外部性應該是全社會的,不應該因為其是由私人部門提供的,就把這種屬於全社會的正外部性內部化為私人部門的營收和利潤。因此,如果允許私人部門提供公共品及其服務,必須要解決好私人部門提供公共品或準公共品的機制問題,並予以特殊管理。

  第一,特許經營、持牌管理。因為大數據征信是公共品行業,具有較強的公共和社會屬性,因此需要制定嚴格的準入條件,按特許行業要求企業持牌經營。對準入、業務開展、合規、風控等都有嚴格的監督管理要求,尤其要重點關注大數據采集和使用的合法合規性問題。

  第二,確保正外部性社會化,不內部化為超額收益和利潤。一種思路是徵收額外的稅收,收益由政府分享一部分,把私人部門經營公共品的超額收益公共化。另一種思路是限制定價,由政府對其服務定價進行管控。既然是公共品,增加一個部門服務的邊際成本幾乎是零,因此在定價上就應該有所控制,收益和利潤原則上以能覆蓋日常運維成本為主要目標。對此,最常用的定價方法是成本加成法。

  第三,解決好供給的公平和非歧視性,對所有服務對象一視同仁。公共品的一個重要特徵是,在其消費上具有非競爭性和非排他性,消費者不因出價或其他相關原因在使用和消費公共品上受到歧視。當公共品由私人部門提供時,價格機制可以發揮作用,但仍然需要體現非歧視原則,確保所有的消費者能夠按相同的市場條件和要價獲得同樣的公共品消費和使用權利。具體而言,如果是某家機構在提供大數據征信服務,一旦明確服務定價,不管是對於集團內企業,還是對非集團內企業,它們都應該可以按照相同的市場條件向該機構購買服務,如申請對某個信息主體的信用評分,這家機構應當按照為集團內企業提供服務時相同的市場條件,給其他申請企業提供相同的服務,而不應該因對方出價或與自身存在某種關係而歧視性地提供產品和服務。這時,這家機構的征信服務就不能隻提供給集團內企業,而不提供給其他非集團內企業。

  本文原發於中國金融雜誌

  (本文作者介紹:中國人民銀行金融研究所所長)

獲得更多的PTT最新消息
按讚加入粉絲團