以人工智慧協助司法官撰寫起訴書(審判書)初稿以減輕工作負荷並改善求(量)刑之刑度寬嚴不一問題
台北大學公行系兼任副教授 陳泉錫博士 2025.03.06
一、 台灣刑事案件的特性與待改善問題
我國刑事案件數量龐大,依法務部統計年報登載:民國112 年地方檢察署新收檢察案件為
248 萬 7,299 件;全國各地方檢察署第一線檢察官平均每位月分案量達164件以上。其中需耗費檢察官較多心力的偵查案件73萬 3,505 件佔29.5%,每位檢察官每月偵案分案量亦達48件[1],工作負荷沉重。而一般民眾對檢察機關辦案速度不夠快,以及對於案情類似案件之求刑刑度寬嚴不一差距懸殊現象亦深有怨言。以公務員之圖利罪為例,案情類似卻求刑寬緊迥異。起訴後,法院裁判定罪率不高,平均僅41%。從偵查發動至判決定讞,通常需歷時數年,雖最後可能判決無罪,但對當事人傷害已成。無罪判決亦難返其事業與清白,實不可不慎。
上述刑事案件中,數量最多的為觸犯毒品危害防制條例案件(特別是施用毒品案件),約佔21.3%,其次為公共危險罪,約佔15.4,再次為詐欺罪13.9%,此三類案件約占前述刑事偵查案件之50%。此類案件除少數案件具有較高之複雜度外,多數案件案情相對單純,具有相當高之重複性與可歸類性,惟檢察官仍須為每個案件依據警方移送書、民眾檢舉書等書狀於調查事實後製作起訴書或不起訴處分書,佔用檢察官珍貴的辦案資源甚多。若能使用人工智慧科技,縮短檢察官處理此類性質相對單純案件之時程,使其能將時間著力於重大案件之偵辦,乃為兩利之作法。
二、 早期運用人工智慧改善檢察官工作負荷之嘗試:文字探勘及決策樹
為改檢察官工作過荷問題,法務部資訊處自民國97年起,建立由檢察官與資訊人員組成之研發團隊,主動著手研究運用人工智慧技術(包括文字探勘、案件分類、決策樹及Cosine Similarity comparison等),嘗試由系統自動剖析警方遞交之移送書內文,並自動比對類似案件法院過往裁判之刑度後,由系統自動產製檢察官起訴書(或不起訴處分書)初稿,由檢察官審閱為必要之修正,以簡省檢察官製作書類製作時間。首階段研究係以案件量多而複雜度相對可控之違反毒品危害防制條例案件為研發領域,該研究與實際試行成果並發表於第16屆ICCEF國際研討會[2]。謹摘述規劃重點如下:
(一)檢察官毒品案件常規辦案程序:檢察機關毒品案件案源主要來自警方之移送書。移送書載有犯罪嫌疑人之年籍資料、犯罪事實、施用毒品類別、重量、施用工具等文字。檢察官須據此警方書類進行前科資料查調(初犯與再犯刑度不同)、事實偵查、判斷適用法條、撰寫起訴書(或不起訴處分書)等工作。
(二)以人工智慧協助司法官撰寫起訴書(或不起訴處分書)初稿之執行程序
由資訊系統以文字探勘技術自動剖析警方移送書內容,找出年籍資料、犯罪事實、施用毒品類別、重量、施用工具等關鍵文字,並建立關鍵字向量,以此關鍵字向量使用Cosine Similarity comparison方法找出法院過往對類似案件裁判之刑度後,再由系統自動從法務部刑案資料庫找出嫌疑人過往犯罪前科資料後,自動產製檢察官起訴書(或不起訴處分書)初稿,由檢察官審閱進行必要之修正後簽署成為正式文件。檢察官則可專注於核心偵查工作,簡省類似案件製作檢查書類時間。
(三)試行結果: 不算成功,使用率不高,檢討如下:
第一階段試辦於台北、板橋兩大地檢進行3個月,結果並不順利,經檢討原因係警方毒品案件移送書之犯罪事實錯誤甚多,影響檢察官據以產製起訴書之正確性。經與刑事局商協改善方式,決定請刑事局要求各警察局移送書內容盡量表格化,並強化移送書內容移送前之審核。
第二階段試辦:台北、板橋、桃園、台中、高雄五個地檢(101.5.1)。使用率仍不高,經分析原因乃是檢察機關文化問題。毒品案件性質多數單純,通常分案給新進檢察官,但新進檢察官有書類送審壓力,由系統自動產出之毒品案件起訴書類之產出系使標準用字,無法做為送審案件以致使用率低。
三、 運用晚近生成式人工智慧(AI)之歸納與推理能力,並運用法務部過往大數量之起訴書及法院之審判書進行專家模型訓練,可改善使用早期AI之限制大幅改善自動化生成起訴書之效果。
以ChatGPT為代表之生成式AI在2022年出現,其使用巨量資料訓練,並可導入如醫療、法律等不同領域專家系統功能,經過幾個迭代後,新出現之AI模型如google的Gemimi,DeepSeek皆已漸具備初步推理能力。因此在這個時點如法務部重新規劃起訴書初稿自動化生成系統,運用過往大數量之起訴書及法院對應之審判書類進行模型訓練,並且可納入不同檢察官個人風格之起訴書類,可克服前揭因書類送審之問題。目前生成式AI技術面已漸趨完備,法務部原規劃運用AI自動產製起訴書初稿,減輕檢察官工作負荷之理想是指日可待。
四、 司法院自民國111年起亦著手發展生成式AI應用,以撰寫刑事裁判草稿期望減輕法官工作負荷。
司法院資訊處112-08-27發布新聞稿:“司法院為減輕法官工作負擔,提升審判效能,司法院於111年4月開始發展生成式AI(以下簡稱AIGC)應用,希望以AI來撰寫上開兩類犯罪的裁判草稿,以供法官製作裁判時參考;至於認定事實、適用法律及決定量刑等核心事項,仍完全由法官自行決定”[3]。司法院此一協助法官產製書類之努力雖較法務部規劃檢察書類自動產製之努力來得晚,但是兩方資訊部門,思考利用AI資訊技術協助司法官改善工作負荷之用心並無二致。而司法院在生成式AI逐漸成熟進入實用階段的時點來規劃推動自動化撰寫刑事裁判草稿,時機掌握更為適切,值得法務部參考。
五、 改善現行個別司法官量(求)刑刑度寬嚴不一之策略雛議:訓練司法體系專家大語言模型,做為法官撰寫刑事裁判量刑或檢察官製作起訴書求刑之參考(採)。
刑事案件類近之事實但裁判結果卻天差地遠的事件層出不窮,嚴重傷害民眾之司法情感。近期立委助理費貪瀆案起訴頻仍,不同案件之拘押、判決結果差異甚大,另有柯文哲羈押案地院高院觀點不同爭議,在在皆令國人司法案件裁量之公平性。連望重士林的陳長文律師平常鮮少指名評論,近日也因柯案點名評論高等法院謝靜慧法官類似案件裁量前後不一,及地院法官缺少道德勇氣。[4]
荷蘭有鑑於該國司法官起訴寬緊不一,造成民怨,乃自1999起推動北極星(Polaris)求量刑系統。檢察官遇有承辦案件求刑時,須將案件之關鍵屬性依北極星系統要求之欄位輸入系統,由系統依案件之特性產出較具一致性之求刑標準[5]。此一追求公平起訴之制度,台灣司法界屢有派員出國參訪學習,惜尚未在台灣司法制度引進。
近期生成式AI模型技術已漸成熟並具備初步推理能力。筆者建議可參採荷蘭北極星(Polaris)求量刑系統之制度概念,運用經大數量歷史檢察機關起訴書類及各級法院審判書類資料進行模型訓練及校正(Fine tuning),建置:“司法專家系統大語言模型”及求量刑之關鍵屬性輸入介面(即有效的Prompt)。司法官在撰擬審判書或起訴書前,能運用此司法專家系統大語言模型,先輸入案情、犯罪事實、前科等關鍵資訊,由大模型推理(綜合參考過往判決刑度)後產出求較具客觀、一致之求、量刑建議刑度,法官或檢察官可直接參採此刑度建議,如為不同之刑度量刑或求刑,且超出一定比率時,即需另成立三人以上之評議小組進行該案求量刑合度與否之評議。如此應有機會改善個別司法官求量刑寬緊不一之問題。
Reference:
1. 112年法務統計年報p.4-10
https://www.rjsd.moj.gov.tw/rjsdweb/book/Book_Detail.aspx?book_id=642
2. 陳泉錫、季延平 “Use Text
Mining Method to Support Criminal Case Judgment
--- Referential Sentence Generation for Drug Abuse Judgment”
研討會名稱:16th International Conference on
Computing in Economics and Finance, 15 July, 2010
3. 司 法 院 新 聞 稿112年8月27日
發稿單位:資訊處
連 絡 人:處長 賴武志
連絡電話:02-23618577#291 /0911-706-569
“司法院審慎發展生成式 AI應用,以撰寫刑事裁判草稿初試啼
聲;期望減輕法官工作負荷,審判核心仍由法官自行決定”
https://www.judicial.gov.tw/tw/cp-1887-929494-8a9fb-1.html
4.陳長文 “法官應勇於獨立審判
羈押法治30年浮沉” 中國時報 2025.02.17
https://www.chinatimes.com/opinion/20250216002790-262104?chdtv
5. 黃玉婷 “以文字探勘技術產製求/量刑因子之研究—以我國智慧財產權法律為中心探討” 東吳大學法律學系碩士在職專班碩士論文 101年8月