什麼是互信息

一般而言,通道中總是存在著雜訊和干擾, 信源 發出消息x,通過通道後信宿只可能收到由於干擾作用引起的某種變形的y。信宿收到y後推測信源發出x的 概率 ,這一過程可由 後驗概率p (x|y)來描述。相應地,信源發出x的概率p(x)稱為 先驗概率 。我們定義x的後驗概率與先驗概率比值的對數為y對x的互信息量,也稱交互信息量(簡稱互信息)。

互信息 是指 資訊理論 里一種有用的信息度量,它是指兩個事件集合之間的相關性。兩個事件X和Y的互信息定義為: I(X;Y) = \sum_{y \in Y} \sum_{x \in X}p(x,y) \log{ \left(\frac{p(x,y)}{p(x)\,p(y)}\right) }, \,\! 又可以表示成:

I ( X ; Y ) = H ( X ) − H ( X | Y )

= H ( Y ) − H ( Y | X )

= H ( X ) + H ( Y ) − H ( X , Y )

= H ( X , Y ) − H ( X | Y ) − H ( Y | X )

其中H(X,Y)是聯合熵(Joint Entropy),其定義為: H(X,Y) = -\sum p(x,y) \log p(x,y)

H(X|Y)是條件熵(conditional entropy),定義重屬於熵的定義。

互信息的相關內容

互信息是計算語言學模型分析的常用方法,它度量兩個對象之間的相互性。在過濾問題中用於度量特征對於主題的區分度。互信息的定義與交叉熵近似。互信息本來是資訊理論中的一個概念,用於表示 信息 之間的關係, 是兩個 隨機變數 統計相關性的 測度 ,使用互信息理論進行特征抽取是基於如下假設:在某個特定類別出現頻率高,但在其他類別出現 頻率 比較低的詞條與該類的互信息比較大。通常用互信息作為特征詞和類別之間的測度,如果特征詞屬於該類的話,它們的互信息量最大。由於該方法不 需要 對特征詞和類別之間關係的性質作任何假設,因此非常適合於文本分類的特征和類別的配準工作。

本條目相關文檔

更多相關文檔

本条目相关课程

  1. 瑞幸聯名茅臺推出“醬香拿鐵”
  2. 第一性原理
  3. 流動性陷阱
  4. 塑料潤滑劑
  5. 阿爾巴德定理
  6. 設備返修率
  7. INFP
  8. 敏感性分析法
  9. 情緒ABC理論
  10. 知識詛咒
  1. 奶頭樂理論
  2. 蘑菇管理定律
  3. 猴子管理法則
  4. 情緒ABC理論
  5. 垃圾人定律
  6. 100個最流行的管理辭彙
  7. 破窗效應
  8. INFP
  9. SWOT分析模型
  10. 21天效應

以上内容根据网友推荐自动排序生成