隨著企業 LLM 使用的加速以及人工智慧更深入地融入核心業務流程,可驗證性變得比以往任何時候都更加重要。
當談到人工智慧時,品牌信任已經不夠了。 利用 LLM 的企業需要能夠為消費者、訴訟律師、立法者和利害關係人提供以下問題的答案:
🟣 使用哪些資料集來訓練/微調 LLM ? 這些資料集是否包含任何受版權保護的內容或受保護的智慧財產權?
🟣 在訓練之前(或在填充要在提示中檢索的向量搜尋資料庫之前)是否刪除了敏感資料?
🟣 是否使用正確的 LLM 二進位檔案和權重處理使用者請求? 當使用第三方託管的 LLM 服務時,您能相信第三方沒有操縱回應嗎?
🟣 是否有任何敏感 IP 因 RAG 流程而意外傳送到第三方 LLM 服務?
🟣 我們如何制定管理流程來管理和批准使用企業資料集的程式碼庫或人工智慧代理流程中的提示?
🟣 我們如何證明某一內容對於組織來源來說是真實的並驗證其來源?
在這篇 SxT 部落格中,Space and Time 共同創辦人兼技術長 @chiefbuidl 介紹了提供端到端可驗證的 LLM 系統的過程和挑戰:從防篡改和淨化的訓練資料集開始,然後最終證明正確的模型使用和水印產生的內容。
當實現後,可驗證的法學碩士將提供更好的…
✅ 值得信賴 ✅ 準確性和可靠性 ✅ 定制 ✅ 內容真實性
Space and Time 專注於將可驗證性引入到這個過程中的幾個關鍵步驟中,使用 ZK 和區塊鏈技術來加密證明用於 LLM 訓練、微調和 RAG 的資料。
在這裡閱讀部落格文章:
Source: