你如何看待大數據?
(資料圖片僅供參考)
不少觀點認為,大數據即是提煉算法,通過算法設計軟件,然后從有關方面獲取大量的數據。在此過程中,將辦案邏輯運用于軟件設計中,從而實現將數據導入軟件,通過算法自動獲取大量監督線索。
雖然純熟的模型軟件會實現類似的效果,但這一定需要大量的資源投入和長期的算法打磨,在短期內實現遠非易事。這也因此會出現有的檢察院用辦理成功的個案和類案監督經驗去構建模型,但發現盡管模型邏輯明晰,但就是做不出自己“想要”的模型;或者做出一個模型,也獲取了不少數據,就是“算不出”新的監督線索。沒有模型的時候,通過電子表格作為分析方法來發現案件線索的路徑還能奏效,為什么做成模型后卻失靈了呢?
在筆者看來,某種程度上,是我們把大數據算法想得過于簡單和理想化。事實上,我們很難將司法邏輯完全數學化,因為數學化需要抽象的表達,而抽象就需要對數據進行概括,需要刪減一些看似冗余的事實和情節。比如,我們對言辭證據的判斷就很難數學化,但是如果只剩下客觀證據,案子還好不好辦、能不能辦就成了問題。而且,也并非所有客觀證據都能夠數學化,像圖片、影像就很難數學化,最容易數學化的就只有銀行流水、支付記錄這些數字化的證據。
有些時候,我們通過數字化證據的比對分析就能夠得出一條非常有價值的線索,其實這也是我們審查了相關言辭證據、社交通訊記錄、影像證據等多重證據之后得出的結論。數字化的證據可能是最重要的,但其他證據也并不是可有可無的,它們對于提高線索的成案率有著重大意義。監督線索往往并不是單純的數學化分析所得出的結論,而是需要與外圍證據進行綜合判斷才能發揮作用,需要的是司法性的審查而不是算法化的審查。
也就是說,算法工具并不是最重要的,最重要的其實是大數據思維。有了大數據思維,依托電子表格等基本的工具,再加上身處案件的具體情景之中,也在一定程度上可以為大數據的應用創設場景。如果我們抽離了具體的案件,失去了案件中所承載的外圍證據,僅僅依靠數字化證據進行純粹的數學化分析,那么監督線索的發現就會變得困難。
因此,筆者認為,在推進數字檢察工作的過程中,要尊重算法,但不能迷信算法,我們應該通過算法和思維兩條腿走路。具體來說,有三點建議:
一是在通過個案提煉算法、設計軟件的同時,要提煉大數據思維的經驗。軟件的設計有一定的研發周期。在設計軟件的同時,我們應該對案件中積累的大數據辦案思維進行文字性的總結,比如制定大數據辦案指引,提煉大數據辦案思維的精華,包括監督線索識別的具體特征、需要重點調取和審查的證據種類、發現線索的核心邏輯等。通過大數據辦案指引,可以直接引導檢察官在辦理相似案件中運用大數據思維,在暫時沒有模型軟件的情況下也能上手操作,讓大數據思維早日發揮功效。
二是注意通過大數據思維推廣所獲取的經驗,進而反向完善算法。我們從個案提煉算法,往往會遇到樣本單一的問題。因為個案雖然典型,但仍具有偶然性。而在算法推廣的過程中,我們要面對各式各樣的情況,有時會因為考慮不周全而頻頻卡殼,讓檢察官覺得不好用。因此,通過大數據辦案指引在個案上的先行先試就變得更有意義,可以為算法完善積累更多的經驗,讓算法在試用初期減少碰壁,從而有利于盡快擴大試用范圍。試用范圍越大,積累的經驗就越多,算法也就變得更加完善,從而進入使用上的良性循環。
三是算法再完善也不能完全代替思維的重要作用。大數據思維的提煉、應用和推廣并不是階段性的救急之策,它具有不可替代性。單純應用算法通過數據發現線索是不可能實現自動化監督的,它離不開具體的案件情景和證據環境,而將兩者結合起來的是辦案檢察官。一個懂大數據辦案思維的檢察官和一個不懂大數據辦案思維的檢察官在算法應用效率上是有天壤之別的,甚至可能存在有算法也不會用的問題。
算法是一種大數據的辦案工具,它可以極大地提升我們的監督能力,但前提是為具有大數據監督思維的檢察官所用。對于一個會用工具的檢察官來說,工具就可以變成生產力;而對于一個不會用工具的檢察官來說,工具只是擺設而已。對于大數據來說,算法固然重要,但讓檢察官擁有大數據思維更為重要。
(作者為北京市檢察院第一檢察部副主任、三級高級檢察官)
[版面見習編輯:高航] [責任編輯:劉蕊]關鍵詞:
推薦閱讀
關于我們 廣告服務 手機版 投訴文章:435 226 40@qq.com
Copyright (C) 1999-2020 www.ymshequn.com 愛好者日報網 版權所有 聯系網站:435 226 40@qq.com