在數字經濟時代背景下,審計行業正經歷從經驗驅動向數據智能驅動的范式轉變。當審計憑證躍遷云端數據庫,抽樣檢查轉變為全量分析,審計行業正經歷“計算機輔助審計”向“智能算法審計”的跨越式轉型,人工智能正以前所未有的態勢重塑審計行業的底層邏輯架構。這場以大模型為驅動的智能化變革,不僅促進審計效率的指數級提升,而且還將引發行業生態的重構轉型。本研究結合南京審計大學自主研發的AuditNova審計大模型與深度求索公司的DeepSeek通用大模型,構建融合部署技術體系,旨在破解審計智能化轉型中的核心難題。
DeepSeek作為一款通用大模型,以其強大的技術架構和廣泛的應用場景著稱。它具備高達671B參數的規模,能完成復雜數學推理、編程輔助、長文本分析等高難度任務,展現出卓越的跨領域通用能力。通過強化學習(RL)和模型蒸餾技術,DeepSeek顯著降低了訓練成本,并以開源代碼和API開放的形式推動低門檻AI應用。其高效推理能力和對邊緣計算的支持,使其特別適合預算有限但需要大規模算力的中小企業。此外,DeepSeek在高校教學、科研管理、論文速讀等領域得到了廣泛應用,體現了其高性價比和擴展性。然而,盡管DeepSeek在通用性方面表現出色,其在審計領域的專業知識處理上存在明顯不足。例如,對于問題定性、合規審查等專業邏輯的深度理解,DeepSeek難以滿足審計行業對邏輯一致性和結論可信度的嚴格要求。這使得DeepSeek在面對審計領域的復雜任務時,往往需要引入外部知識庫進行補充。
審計專業領域"外掛知識庫"建設是集知識工程與數字化轉型于一體的系統性工程,其復雜程度和專業要求遠超常規信息系統建設。以中國石化、國家電網為代表的中央企業經過近十年的持續投入,仍處于知識庫建設的深化完善階段。這充分說明審計知識體系的構建需要遵循"知識沉淀-結構轉化-智能應用"的螺旋式演進規律,具有明顯的長期性、專業性和漸進性特征。為了保證審計知識的準確性,我們采用大量專業人員“手工標注”的方式提高數據質量,同時構建專業審計“知識圖譜”來確保知識的準確性。
AuditNova大模型(中文簡稱"審元")是由南京審計大學自主研發的國內首個審計行業專用大模型,實現了人工智能技術與審計專業邏輯的深度融合。它基于南京審計大學40余年的學科積累,創新性地結合了圖神經網絡與多模態推理架構,構建了超百萬審計實體和千萬級關系的知識圖譜。通過“知識圖譜+規則引擎+概率推理”的三重驗證機制,AuditNova大模型顯著提升了審計結論的可信度,并支持動態知識演進,能及時應對審計準則與法規的變化。其典型應用場景包括審計問題定性、審計案例推薦、合規風險評估和審計證據鏈生成,展現了高度的專業溯源性和行業適配性。
DeepSeek與AuditNova的融合具有重要意義。DeepSeek的通用性使其能夠為AuditNova大模型提供強大的技術支持,例如在復雜數據處理、長文本分析等方面發揮優勢;而AuditNova大模型則可以通過其深厚的行業知識和專業邏輯,彌補DeepSeek在審計領域的短板。兩者的結合不僅能夠實現通用模型與垂直模型的優勢互補,還能推動AI技術在審計領域的深度賦能,形成“通用技術+專業能力”的雙軌發展格局。這種融合模式將有助于構建更加智能化、標準化的審計解決方案,為行業發展注入新的活力。
一、AuditNova+DeepSeek部署技術方案
DeepSeek作為通用大模型,具備強大的跨領域通用能力,而AuditNova大模型則專注于審計領域的專業邏輯與知識圖譜構建。兩者的融合能夠實現“通用技術+專業能力”的優勢互補,為審計行業提供更智能化、標準化的解決方案。以下三種可行的部署方案。
(一) 滿血版DeepSeek + AuditNova知識庫
該方案的部署主要包括兩個過程:滿血版DeepSeek的部署以及AuditNova知識庫的集成。其中滿血版DeepSeek的部署可以直接參照DeepSeek的官方文檔進行,而AuditNova知識庫的集成主要借助于RAG框架(如ragflow、Dify等)實現。該方案的核心是將滿血版DeepSeek(671B參數)直接與AuditNova大模型的知識庫結合。滿血版DeepSeek作為通用大模型,負責處理復雜任務(如財務報表數據清洗、長文本分析),而AuditNova大模型的審元知識庫則提供審計領域的專業知識支持。
具體部署技術過程,首先通過部署滿血版DeepSeek,實現了對大規模財報數據和多模態信息的高效處理能力,這得益于DeepSeek內置的復雜數學推理和長文本處理功能。其次為了彌補DeepSeek在審計領域專業知識的不足,方案巧妙地接入了AuditNova大模型的知識圖譜,實現了“通用+專業”的完美結合。此外,該方案還充分利用了審元知識庫動態更新的特性,確保知識圖譜能夠實時同步最新的審計準則和法規,從而保持方案在處理審計任務時的時效性和準確性。
該方案不足之處在于硬件算力依賴程度高,通常需要具備超算級硬件資源,主要適合于具備充足算力預算的央企、國企審計機構或政府審計部門。同時,由于其主要的分析處理能力主要依賴于滿血版Deepseek本身,模型部署后容易相對固化,后續調整和優化較為困難。此外,對于復雜邏輯的審計業務需求,需開發中間層協議,解決通用模型與專業知識庫的語義對齊問題,避免邏輯沖突。
(二)融合模型+外掛知識庫
該方案的部署包括兩大過程。首先是構建融合模型,該步驟主要以目前官方蒸餾后的DeepSeek-R1(如14B/32B等)為基礎,借助DeepSeek的蒸餾框架,進一步蒸餾AuditNova大模型,將審計專業知識融入其中,最終形成既具備通用能力,又融合審計領域專業知識的融合模型。緊接著類似方案1,通過RAG外掛知識庫的方式,提供審計準則與法律法規等相關審計知識的動態更新,確保模型能夠應對政策變化和審計行業的需求。
該方案最終部署的為蒸餾后的融合模型,實現了輕量化部署,顯著降低了對硬件的依賴,使其能夠在普通服務器或邊緣設備上高效運行,從而大幅減少了部署成本。此外,該模型采用蒸餾技術,成功地將AuditNova大模型的專業知識融入其中,形成了一個既具備通用性又兼具專業性的綜合模型。這一知識融合的特性使得DeepSeek能夠應對多種場景的需求。更令人稱道的是,其外掛知識庫支持動態擴展,確保模型能夠緊跟政策變化和行業需求,保持時效性和實用性。
該方案不足之處在于蒸餾過程中也面臨一些挑戰。AuditNova大模型的知識圖譜和規則引擎涉及復雜的行業邏輯,這可能導致在蒸餾過程中部分專業知識丟失,進而影響模型的精度。此外,多次蒸餾需要額外的訓練時間和資源,尤其是在審計領域專業知識遷移的過程中,可能面臨數據稀缺和技術上的挑戰,從而增加了訓練成本。另外,一旦蒸餾完成,模型的結構便相對固定,這限制了后續對模型進行調整和優化的靈活性,可能給長期維護和升級帶來一定困難。
(三) “AuditNova+DeepSeek”協同
智能體技術是目前大模型發展、特別是垂直應用的重要方向,為支持靈活復雜的審計業務,可以基于智能體技術,實現AuditNova+DeepSeek的雙模型協同工作。具體來說,其部署主要包括兩個過程:模型的部署和審計業務智能體的構建。模型的部署可以根據需要,選擇相應的模型,直接參考DeepSeek和AuditNova大模型的官方手冊按步驟依次部署即可。對于智能體的構建,目前很多RAG框架(如ragflow、didy等)已經集成了智能體功能,并提供圖形智能體部署功能,因此可以直接部署這些支持智能體的RAG框架,這樣不但能夠實現“AuditNova+DeepSeek”的協同工作,而且還可以擴充和更新審計知識,提高整個智能體的適應能力。
在該方案中,DeepSeek和AuditNova大模型的分工明確,DeepSeek負責通用任務(如數據清洗、長文本分析),AuditNova大模型專注于審計專業任務(如財務異常檢測、合規審查)。各自發揮所長,有效避免了單一模型負擔過重的問題,從而顯著提升了整體系統的效率。同時,這種設計賦予了系統高度的靈活性,允許兩個模型獨立運行并根據實際需求進行靈活調整和升級,無需對整個系統進行繁瑣的重新訓練。此外,該方案可以使用蒸餾后的模型,以降低對硬件的要求,使其能夠在普通服務器上順暢運行,非常適合中小企業及邊緣計算的應用場景。而且,系統外掛的知識庫也可實時更新,確保模型能夠緊跟政策變化和審計行業需求,實現動態擴展。
該方案不足之處首先在于兩個模型的集成復雜度較高,需要精心設計高效的協同機制(例如API接口、消息隊列等),以確保數據流和任務分配的無縫銜接,這無疑增加了系統設計的難度。其次由于兩個模型獨立運行,在某些特定場景下可能會產生額外的通信延遲,從而影響系統的實時性能。最后智能體技術的引入雖然增強了系統的功能,但也相應地提高了系統開發和維護的復雜性,導致初期的開發成本相對較高。
表1 三種部署方案對比
方案
滿血版DeepSeek + AuditNova知識庫
融合模型+外掛知識庫
AuditNova+DeepSeek協同
技術
實現
- 使用RAG技術,將審元知識庫和新的審計知識作為外部數據源。
- Deepseek負責語言理解和生成,審元知識庫提供專業背景信息。
- 在Deepseek蒸餾模型的基礎上,用審元知識庫微調融合模型。
- 使用RAG技術,將更新的審計知識作為外部數據源。
- 單獨部署Deepseek和審元,對外提供API訪問服務。
- 基于智能體框架,融合RAG技術,根據審計業務需要開發相應的協同智能體。
優勢
- 快速上線。
- 充分利用滿血版大模型強大的推理能力。
- 通過定期更新知識庫,確保內容時效性。
- 輕量化部署。
- 知識融合。
- 通過定期更新知識庫,確保內容時效性。
- 輕量化部署
- 靈活性和擴展性強。
- 支持復雜任務分解與多智能體協作。
劣勢
- 硬件依賴高。
- 靈活度低。
- 蒸餾微調成本高。
- 靈活性不足。
- 延遲問題。
- 開發成本較高。
三種方案的對比情況如表1所示。 如果目標用戶是大型機構且預算充足,可以選擇方案1 ,充分利用滿血版DeepSeek的強大能力。 如果需要輕量化部署并兼顧成本,建議采用方案2 ,通過蒸餾技術實現通用性和專業性的平衡。 如果追求靈活性和可持續性,方案3 是最優選擇,通過智能體技術實現AuditNova與DeepSeek大模型的高效協同,滿足動態擴展和多任務需求。 綜上,對有實力的企業,可采取第一方案,但從長遠來講,本文還是主張智能體的建設。
二、部署測試與選型:技術驗證方法
為驗證以上方案的可行性,可以結合自身的實際需求,選擇相應的軟硬件環境進行適配。表2給出了三種方案的基本配置,表3 給出了不同版本Deepseek的模型參數及基本部署顯卡需求。
在硬件上,“滿血版Deepseek +AuditNova知識庫”方案對硬件要求較高,適用于高性能場景,需要多節點分布式部署。非國產化環境下可以使用16塊A100或H100顯卡(單塊顯存80G),國產化環境下可以使用32塊華為昇騰910B顯卡(單塊顯存64G),同時配備64核以上服務器集群CPU,512GB~1TB的內存,以及1TB的SSD高速硬盤,以保障審元知識庫等其他相關模塊的融合?!叭诤夏P?外掛知識庫”方案和“AuditNova+DeepSeek協同”方案硬件需求相對較為靈活,可以根據需要選用不同參數大小的Deepseek。表2中“融合模型+外掛知識庫”方案是以32B蒸餾版的Deepseek為例,給出的基本配置。進行非國產化環境可以使用4塊RTX4090顯卡(單塊顯存24GB)或2塊A100顯卡(單塊顯存40GB),國產化環境可以使用2塊64GB的昇騰910B顯卡,對于CPU、內存和硬盤,使用主流服務器配置即可。表2中“DeepSeek + AuditNova協同”方案是以32B蒸餾量化版的Deepseek為例,給出的基本配置,AuditNova大模型也是32B量化版本。由于該方案重點在于智能體的審計邏輯設計,可以先采用輕量級的部署,根據實際業務的復雜度再逐步調整部署的模型參數大小及方式。
表2 不同部署方案的軟硬件配置情況
方案
滿血版DeepSeek + AuditNova知識庫
融合模型+外掛
知識庫
AuditNova+DeepSeek協同
硬件
GPU需求
非國產化:多節點分布式部署(16xA100/H100,單塊顯存80G);
國產化:多節點分布式部署(32x昇騰910B,單塊顯存64G);
非國產化:4xRTX4090 24GB或2xA100 40GB
國產化:2x昇騰910B
(注:此處未包括蒸餾融合模型的開銷)
非國產化:2xRTX4090 24GB
國產化:1x昇騰910B
CPU需求
64核以上服務器集群
32核以上
32核以上
內存需求
512GB~1TB
64GB以上
64GB以上
存儲需求
10TB SSD
1TB SSD
1TB SSD
軟件
大模型部署框架
vLLM、ollama
vLLM、ollama
vLLM、ollama
RAG框架
RAGFlow、Dify
RAGFlow、Dify
Dify、LangGraph、RAGFlow
表3 不同版本Deepseek的模型參數及基本部署顯卡需求
版本
名稱
參數(億個)
數值類型
模型大小(G)
模型格式
發布者
部署要求
滿血版
DeepSeek-R1
6710
BF8
700
safetensors
DeepSeek
8*Nvidia H200 (141G)
16*Nvidia A100/H100(80G)
滿血量化版
deepseck-R1:671B
6710
BF16
1300
參考昇騰官網操作指南
32*昇騰910B(64G)
滿血量化版
deepseck-R1:671B
6710
INT4
404
GGUF
ollama
8*Nvidia H100(80G)
8*昇騰910B(64G)
蒸餾版
DeepSeek-R1-Distil-Llama-70B
700
BF16
150
safetensors
DeepSeek
8*4090(24G)
4*昇騰910B(64G)
DeepSeek-R1-Distil-Qwen-32B
320
66
DeepSeek
4*4090(24G)
2*昇騰910B(64G)
DeepSeek-R1-Distil-Qwen-14B
140
30
DeepSeek
2*4090(24G)
昇騰910B(64G)
DeepSeek-R1-Distil-Llama-8B
80
16
DeepSeek
PC
DeepSeek-R1-Distil-Qwen-7B
70
15
DeepSeek
PC
DeepSeek-R1-Distil-Qwen-1.5B
15
3.5
DeepSeek
PC
蒸餾量化版
deepseck-r1:70b
700
INT4
43
GGUF
ollama
2*4090(24G)
昇騰910B(64G)
deepseek-r1:32b
320
20
ollama
4090(24G)
昇騰910B(64G)
deepseck-r1:14b
140
9
ollama
PC
deepseek-r1:8b
80
4.9
ollama
移動端或PC
deepseek-r1:7b
70
5
ollama
移動端或PC
deepseek-r1:1.5b
15
1.1
ollama
移動端或PC
在軟件方面,所有方案均可以采用 vLLM 和 ollama 作為大模型部署框架,同時利用 RAGFlow 、 Dify 等 RAG 框架集成不斷更新的 外掛 審計知識庫支持。對于最后一種方案,可以引入了 LangGraph 等專業的智能體框架以增強兩個模型協同工作的能力。使用者可根據實際需求選擇適配,以滿足不同場景下的性能和成本要求。
三、總結與展望
AuditNova+DeepSeek的部署技術方案不僅意味著技術工具的升級,更標志著審計行業從“經驗驅動”到“數據+算法驅動”的范式革命。 隨著技術紅利持續釋放,審計機構需同步構建“AI就緒”組織體系(包括人才培養、流程再造、倫理治理),方能在智能時代贏得戰略先機。
作者:徐超 周立云
單位:南京審計大學計算機學院 中國石油化工集團有限公司審計部
來源:審計觀察
編輯:孫哲
目前180000+人已關注我們,您還等什么?
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.