信息熵的定义及物理含义

举报
timerring 发表于 2023/02/21 09:36:29 2023/02/21
【摘要】 本专栏包含信息论与编码的核心知识,按知识点组织,可作为教学或学习的参考。markdown版本已归档至【Github仓库:information-theory】,需要的朋友们自取。或者公众号【AIShareLab】回复 信息论 也可获取。信源符号自信息的数学期望为信源的平均信息量——信息熵H(X)=E(I(Xi))=−∑i=1Npilog⁡pibit/symbolH(X)=E\left(I\l...

本专栏包含信息论与编码的核心知识,按知识点组织,可作为教学或学习的参考。markdown版本已归档至【Github仓库:information-theory】,需要的朋友们自取。或者公众号【AIShareLab】回复 信息论 也可获取。

信源符号自信息的数学期望为信源的平均信息量——信息熵

H ( X ) = E ( I ( X i ) ) = i = 1 N p i log p i b i t / s y m b o l H(X)=E\left(I\left(X_{i}\right)\right)=-\sum_{i=1}^{N} p_{i} \log p_{i} \quad bit/symbol

注意: H ( X ) \mathbf{H}(\mathbf{X}) 是一个数, 不是随机变量.

Example 请计算下述离散无记忆二进制信源的信息熵。

( X p ) = ( 0 1 p 1 p ) \left(\begin{array}{l} X \\ p \end{array}\right)=\left(\begin{array}{cc} 0 & 1 \\ p & 1-p \end{array}\right)

Solution

H ( X ) = p log p ( 1 p ) log ( 1 p ) H(X)=-p \log p-(1-p) \log (1-p)

信息熵的物理含义

1.信息熵H(X)表示信源输出后,每个消息(符号)所提供的平均信息量;

2.信息熵H(X)表示信源输出前,信源的平均不确定性;

3.用信息熵H(X)来表征变量X的随机性。

注: 信息熵不等于平均获得的信息量(仅是能提供的信息量)。一般情况下获得的信息量是两熵之差,而不是信息熵本身(获得的还是需要根据实际计算)。

Example:

甲地天气预报, [ X p ( X ) ] = [ 1 2 1 2 1 8 1 8 ] \left[\begin{array}{c}X \\ p(X)\end{array}\right]=\left[\begin{array}{cccc}\text {晴} & \text {阴} & \text {雨} & \text {雪}\\ \frac{1}{2} & \frac{1}{2} & \frac{1}{8} & \frac{1}{8}\end{array}\right]

乙地天气预报 [ Y p ( Y ) ] = [  晴   雨  7 8 1 8 ] \left[\begin{array}{c}Y \\ p(Y)\end{array}\right]=\left[\begin{array}{cc}\text { 晴 } & \text { 雨 } \\ \frac{7}{8} & \frac{1}{8}\end{array}\right]

求:两地天气预报各自提供的平均信息量

解:

  • H ( X ) = 1 2 log 1 2 1 4 log 1 4 1 8 log 1 8 1 8 log 1 8 = 1.75 \mathrm{H}(\mathrm{X})=-\frac{1}{2} \log \frac{1}{2}-\frac{1}{4} \log \frac{1}{4}-\frac{1}{8} \log \frac{1}{8}-\frac{1}{8} \log \frac{1}{8}=1.75 \quad 比特/符号
  • H ( Y ) = 7 8 log 7 8 1 8 log 1 8 = 0.544 \mathrm{H}(\mathrm{Y})=-\frac{7}{8} \log \frac{7}{8}-\frac{1}{8} \log \frac{1}{8}=0.544 \quad 比特/符号
  • 甲地提供的平均信息量大于乙地。

甲、乙地天气预报为两极端情况:

[ X p ( x ) ] = [  晴   阴   雨   雪  1 0 0 0 ] [ Y p ( y ) ] = [  晴   雨  1 0 ] \left[\begin{array}{l} X \\ p(x) \end{array}\right]=\left[\begin{array}{cccc} \text { 晴 } & \text { 阴 } & \text { 雨 } & \text { 雪 } \\ 1 & 0 & 0 & 0 \end{array}\right] \quad\left[\begin{array}{l} \mathrm{Y} \\ \mathrm{p}(\mathrm{y}) \end{array}\right]=\left[\begin{array}{cc} \text { 晴 } & \text { 雨 } \\ 1 & 0 \end{array}\right]

H ( X ) = 1 log 1 0 log 0 0 log 0 0 log 0 = 0 \mathrm{H}(\mathrm{X})=-1 \log 1-0 \log 0-0 \log 0-0 \log 0 = 0 比特/符号

H ( Y ) = 1 log 1 0 log 0 = 0 \mathrm{H}(\mathrm{Y})=-1 \log 1-0 \log 0=0 比特/符号

lim ε log ε = 0 \lim \varepsilon \log \varepsilon=0

  • 信源是确定信源, 所以不存在不确定性, 信息熵等于零。

甲、乙地天气预报为两极端情况:

[ X p ( x ) ] = [  晴   阴   雨   雪  1 / 4 1 / 4 1 / 4 1 / 4 ] [ Y p ( y ) ] = [  晴   雨  1 / 2 1 / 2 ] \left[\begin{array}{c}X \\ p(x)\end{array}\right]=\left[\begin{array}{cccc}\text { 晴 } & \text { 阴 } & \text { 雨 } & \text { 雪 } \\ 1 / 4 & 1 / 4 & 1 / 4 & 1 / 4\end{array}\right] \quad\left[\begin{array}{l}\mathrm{Y} \\ \mathrm{p}(\mathrm{y})\end{array}\right]=\left[\begin{array}{cc}\text { 晴 } & \text { 雨 } \\ 1 / 2 & 1 / 2\end{array}\right]

H ( X ) = log 1 4 = 2 \mathrm{H}(\mathrm{X})=-\log \frac{1}{4}=2 比特/符号

H ( Y ) = log 1 2 = 1 \mathrm{H}(\mathrm{Y})=-\log \frac{1}{2}=1 比特/符号

  • 这种情况下,信源的不确定性最大,信息熵最大
  • 甲地比乙地提供更多的信息量。因为甲地可能出现的消 息数多于て地可能出现的消息数, 不确定性更大。

结论: 由上可知,信源熵大于等于0(若信源输出为确定符号)而小于等于log(N)(信源输出的不确定性最大)。

0 H ( X ) l o g ( N ) 0≤H(X)≤ log(N)

其中N为信源字符集元素的个数

Example 某信号带宽为4000Hz ,以奈奎斯特速率抽样。假设其抽样序列可以建模成一个字符集为A={-2,-1,0,1,2} 的DMS,相应的概率为{1/2,1/4,1/8,1/16,1/16},求信源的速率(b/s)

H ( X ) = 1 2 log 2 + 1 4 log 4 + 1 8 log 8 + 2 × 1 16 log 16 = 15 8 b i t / s y m b o l H(X)=\frac{1}{2} \log 2+\frac{1}{4} \log 4+\frac{1}{8} \log 8+2 \times \frac{1}{16} \log 16 =\frac{15}{8} \quad \mathrm{bit} / \mathrm{symbol}

R b = 2 × 4000 × H ( X ) = 15 K b i t / s e c R_{b}=2 \times 4000 \times H(X)=15 K bit / \mathrm{sec}

其中 R b R_{\mathrm{b}} 为信息速率。

注:奈奎斯特抽样速率为 2 W 2 \mathbf{W} 。信息速率Rb=平均信息量H(X)×码元率B(波特率),单位为bit/s。

参考文献:

  1. Proakis, John G., et al. Communication systems engineering. Vol. 2. New Jersey: Prentice Hall, 1994.
  2. Proakis, John G., et al. SOLUTIONS MANUAL Communication Systems Engineering. Vol. 2. New Jersey: Prentice Hall, 1994.
  3. 周炯槃. 通信原理(第3版)[M]. 北京:北京邮电大学出版社, 2008.
  4. 樊昌信, 曹丽娜. 通信原理(第7版) [M]. 北京:国防工业出版社, 2012.
【版权声明】本文为华为云社区用户原创内容,未经允许不得转载,如需转载请自行联系原作者进行授权。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。