在本文中,瞭解如何在 Notebooks 和 Fabric
數據代理程式中
Microsoft Copilot
(先前稱為數據代理程式)的運作方式、它如何保護您的商務數據安全且符合隱私權需求,以及如何負責任地使用衍生式 AI。 如需 Fabric 中 Copilot 的這些主題概觀,請參閱
Copilot 的隱私權、安全性和負責任用途(預覽版)。
在 Fabric 中筆記本的 Copilot 功能中使用的資料
在筆記本中,Copilot 只能存取使用者目前筆記本存取的數據,無論是在連結的 Lakehouse 中,還是由使用者直接載入或匯入該筆記本。 在筆記本中,Copilot 無法存取任何不在筆記本中可存取的數據。
根據預設,Copilot 可以存取下列資料類型:
交談歷程記錄:該使用者傳送的先前訊息及從 Copilot 收到的回復。 (如需儲存交談歷程記錄的詳細資訊,請參閱下文)
用戶已執行的儲存格內容。
用戶執行之儲存格的輸出。
筆記本中數據源的架構。
筆記本中數據源的範例數據。
附加 Lakehouse 中外部數據源的架構。
網狀架構數據代理程序中的數據使用
網狀架構數據代理程式依賴使用者的交談歷程記錄,以更妥善地回應用戶問題。 (如需儲存交談歷程記錄的詳細資訊,請參閱下文)
新增之數據源的架構資訊。 這包括表格和欄位名稱。 (數據代理程式的建立者會選取應包含的數據表。
處理交談歷程記錄的方式
針對 Notebooks 和 Fabric
數據代理程式中
的
Copilot
,我們會跨用戶會話儲存交談歷程記錄。
為什麼我們會儲存交談歷程記錄及其儲存位置?
若要使用完整對話型代理 AI 體驗,代理程式必須跨使用者工作階段儲存交談歷程記錄,才能維持上下文。 這確保 AI 代理程式保持使用者在先前會話中的上下文,並且這種行為通常是在許多具有主動性 AI 經驗中所希望的。 Notebooks 和 Fabric 數據代理程式中的 Copilot 這類體驗是 AI 體驗,可跨使用者會話儲存對話歷程記錄。
此歷程記錄會儲存在 Azure 安全性界限、相同區域,以及處理所有網狀架構 AI 要求的相同 Azure OpenAI 資源中。
在此情況下,差異在於只要使用者允許,對話歷程記錄即會儲存。 針對不會跨會話儲存交談歷程記錄的體驗,不會儲存任何數據。 提示只會由 Fabric 使用的 Azure OpenAI 資源處理。
您的使用者只要清除聊天紀錄,即可隨時刪除其聊天紀錄。 此選項在筆記本中的 Copilot 和數據代理程式中均存在。
如果未手動移除交談記錄,則會儲存 28 天。
筆記本中的 Copilot:負責任 AI 常見問題
透過 Microsoft Fabric 中適用於資料科學和數據工程的筆記本中的 Copilot,我們提供 AI 助理來協助轉換、探索及建置筆記本內容中的解決方案。
如需考慮和限制,請參閱
限制
。
如何在筆記本中評估 Copilot,以進行數據科學和數據工程?
產品小組測試了 Copilot,以了解系統在筆記本情境中的表現,以及 AI 回應是否具見解且有用。
該小組還投資於其他危害風險降低措施,包括將 Copilot 的輸出聚焦於數據科學相關主題的技術方法。
如何最佳地在數據科學和數據工程的筆記本中與 Copilot 一同合作?
Copilot 最適合用來處理數據科學主題,因此請將您的問題限制在此領域。
明確描述您想要 Copilot 檢查的數據。 如果您描述數據資產-例如,藉由命名檔案、數據表或數據行 -Copilot 可能會更可能擷取相關數據併產生有用的輸出。
如需更細微的回應,請將資料載入筆記本作為資料框,或將資料釘選在您的數據湖倉中。 這讓 Copilot 有更多內容可用來執行分析。 如果資產太大而無法載入,將其釘選是一個有用的替代方案。
Fabric 數據代理程式:負責任的 AI 常見問題解答
什麼是網狀架構數據代理程式?
數據代理程式是新的 Microsoft Fabric 功能,可讓您使用產生式 AI 建置自己的交談式 Q&A 系統。 網狀架構資料代理程式可讓組織中的每個人更容易存取資料見解且更可採取動作。 使用 Fabric 數據代理程式時,您的小組可以就儲存在 Fabric OneLake 中的數據,使用純英文問題進行交談,然後接收相關的解答。 即使是沒有 AI 技術專長或對數據結構沒有深入了解的人員,也可以接收精確且內容豐富的解答。
數據代理程式可以做什麼?
網狀架構數據代理程式可讓自然語言與結構化數據互動,讓使用者提出問題並接收豐富的內容感知答案。 它可讓使用者從 Lakehouse、Warehouse、Power BI 數據集、KQL 資料庫等數據源連線並取得見解,而不需要撰寫複雜的查詢。 數據代理程式旨在協助用戶輕鬆存取和處理數據,透過交談介面加強決策,同時維持數據安全性和隱私權的控制。
數據代理程式的用途為何?
Fabric 數據代理程式旨在簡化數據查詢程式。 它可讓使用者透過自然語言與結構化數據互動。 它支援使用者深入解析、決策和對複雜問題的解答產生,而不需要特殊的查詢語言知識。 數據代理程序特別適用於商務分析師、決策者和其他非技術使用者,這些使用者需要從 KQL 資料庫、Lakehouse、Power BI 數據集和倉儲資源等來源儲存的數據快速、可採取動作的深入解析。
網狀架構數據代理程式不適用於具決定性和 100 個% 正確結果的使用案例,因為目前的 LLM 限制。
網狀架構數據代理程式不適用於需要深入分析或因果分析的使用案例。 例如,「為什麼上個月的銷售數字下降?」不在目前的討論範圍內。
產品小組針對各種公用和私人基準檢驗數據代理程式,以判斷針對不同數據源的查詢品質。 小組還投資其他危害風險降低措施,包括技術方法,以確保數據代理程序的輸出受限於所選數據源的內容。
Fabric 數據代理程式的限制為何? 使用者在使用系統時,如何將 Fabric 數據代理程式限制的影響降到最低?
請確保您使用描述性資料行名稱。 不使用 「C1」 或 「ActCu」 資料行名稱(例如),請使用 「ActiveCustomer」 或 “IsCustomerActive”。這是從 AI 取得更可靠查詢的最有效方式。
若要改善 Fabric 數據代理程式的精確度,您可以使用數據代理程式指示和範例查詢來提供更多內容。 這些輸入可協助 Azure OpenAI Assistant API-提供網狀架構數據代理程式的功能-做出更妥善的決定,說明如何解譯用戶問題,以及哪些數據源最適合使用。
您可以使用數據代理程式指示來引導基礎代理程式的行為,協助其找出最佳數據源來回答特定類型的問題。
您也可以提供範例問題查詢組,以示範 Fabric 數據代理程序應該如何回應常見的查詢。 這些範例可作為解譯類似使用者輸入併產生正確結果的模式。 Power BI 語意模型數據源目前不支援範例問題查詢組。
如需數據代理程式目前限制的完整清單,請參閱
此資源
。
哪些作因素和設定可有效且負責任的使用 Fabric 數據代理程式?
Fabric 資料代理程式只能存取您提供的數據。 它會使用架構(資料表名稱和數據行名稱),以及您在使用者介面 (UI) 或透過 SDK 中提供的 Fabric 資料代理程式指示和範例查詢。
Fabric 數據代理程式只能存取使用者可存取的數據。 如果您使用數據代理程式,則會使用認證來存取基礎資料庫。 如果您沒有基礎數據的存取權,數據代理程式就無法存取該基礎數據。 當您跨不同通道取用數據代理程式時,這是事實,例如,Azure AI Foundry 或 Microsoft Copilot Studio ,其他使用者可以使用數據代理程式。
適用於 Data Factory 的 Copilot 隱私權、安全性和負責任使用 (預覽)
資料科學與數據工程的「Copilot」概觀(預覽)
Data Factory 的 Copilot 概觀
Fabric 中的 Copilot:常見問題