信息论与编码(六)| 无失真定长编码定理

举报
timerring 发表于 2022/09/30 16:18:39 2022/09/30
【摘要】 无失真信源编码定义: 在无失真信源编码中, 编译码过程是可逆的, 即信源符号可以通过编码序列无差错的恢复 ,该编码方式适用于离散信源的编码。实现无失真的信源编码,要求:a. 信源符号 X1X2…Xl…XL\mathrm{X}_{1} \mathrm{X}_{2} \ldots \mathrm{X}_{l} \ldots \mathrm{X}_{L}X1​X2​…Xl​…XL​是一一对应于...

无失真信源编码

定义: 在无失真信源编码中, 编译码过程是可逆的, 即信源符号可以通过编码序列无差错的恢复 ,该编码方式适用于离散信源的编码。

实现无失真的信源编码,要求:
a. 信源符号 X 1 X 2 X l X L \mathrm{X}_{1} \mathrm{X}_{2} \ldots \mathrm{X}_{l} \ldots \mathrm{X}_{L} 是一一对应于码字 Y 1 Y 2 Y k Y K \mathrm{Y}_{1} \mathbf{Y}_{2} \ldots \mathbf{Y}_{k} \ldots \mathbf{Y}_{\mathbf{K}} ;
b. 能够无失真或无差错地从 Y \mathbf{Y} 恢复 X \mathbf{X} , 也就是能正确地 进行反变换或译码;
c. 传送 Y \mathbf{Y} 时所需要的信息率最小

  • 信源编码器输入的消息序列: X = ( X 1 X 2 X l X L ) , X l { a 1 , a n } \mathbf{X}=\left(\mathrm{X}_{1} \mathrm{X}_{2} \ldots \mathrm{X}_{l} \ldots \mathrm{X}_{L}\right) , \mathbf{X}_{l} \in\left\{a_{1}, \ldots a_{\mathrm{n}}\right\} ,
    输入的消息总共有 n L n^{L} 种可能的组合
  • 输出的码字为: Y = ( Y 1 Y 2 Y k Y K ) , Y k { b 1 , b m } \mathrm{Y}=\left(\mathrm{Y}_{1} \mathrm{Y}_{2} \ldots \mathrm{Y}_{k} \ldots \mathrm{Y}_{K}\right) , \mathbf{Y}_{k} \in\left\{\mathbf{b}_{1}, \ldots \mathbf{b}_{\mathrm{m}}\right\}
    输出的码字总共有 m K m^{K} 种可能的组合。
  • 信息率最小就是找到一种编码方式使 K ˉ = K L log m \bar{K}=\frac{K}{L} \log m 最小

无失真定长编码定理

image-20220930101959594

在定长编码中,输出码字的长度 K \mathbf{K} 是定值。
我们的目的是寻找最小K值
编码器输入 X = ( X 1 X 2 X l X L ) , X l { a 1 , a n } \mathrm{X}=\left(\mathrm{X}_{1} \mathrm{X}_{2} \ldots \mathrm{X}_{l} \ldots \mathrm{X}_{L}\right), \mathrm{X}_{l} \in\left\{a_{1}, \ldots a_{\mathrm{n}}\right\} , 输入的消息总共有 n L n^{\mathrm{L}} 种可 能的组合
输出 的码字 Y = ( Y 1 Y 2 Y k Y K ) , Y k { b 1 , b m } \mathrm{Y}=\left(\mathrm{Y}_{1} \mathbf{Y}_{2} \ldots \mathrm{Y}_{k} \ldots \mathrm{Y}_{\mathrm{K}}\right), \mathrm{Y}_{k} \in\left\{\mathrm{b}_{1}, \ldots \mathrm{b}_{\mathrm{m}}\right\} , 输出的码字总共有 m K m^{\mathrm{K}} 种可能的组合。
若对信源进行等长编码, 必须满足: n L m K n^{\mathrm{L}} \leq m^{\mathrm{K}}

等长编码

  • 若对信源进行等长编码,必须满足: n L m K n^{L} \leq m^{K} K L log n log m \frac{K}{L} \geq \frac{\log n}{\log m}
  • 只有当 K 长的码符号序列数 m K m^{K} 大于或等于信源的符号数 n L n^{L} 时,才可能存在等长非奇异码。

例如英文电报有 27 个符号, n = 27 ,   L = 1 ,   m = 2 \mathrm{n}=27, \mathrm{~L}=1, \mathrm{~m}=2 ( 二元编码 )

K L log 2 n log 2 m = log 2 27 5 K \geq L \frac{\log _{2} n}{\log _{2} m}=\log _{2} 27 \approx 5

  • 实际英文电报符号信源,在考虑了符号出现的概率以及符号之间的依赖性后,平均每个英文电报符号所提供的信息量约等于1.4比特,大大小于5比特。
  • 编码后5个二元符号只携带约1.4比特信息量。
  • 等长编码的信息传输效率极低。

等长编码定理

由 L 个符号组成的、每个符号的熵为 H ( X ) \mathrm{H}(\mathbf{X}) 的无记忆平稳信源符号序列 X 1 X l X L \mathrm{X}_{1} \ldots \mathrm{X}_{l} \ldots \mathrm{X}_{\mathrm{L}} , 可用 K 个符号 Y 1 Y k Y K \mathbf{Y}_{1} \ldots \mathrm{Y}_{k} \ldots \mathbf{Y}_{\mathrm{K}} (每个符号有 m \mathrm{m} 种可能值)进行等长编码。

对任意 ε > 0 , δ > 0 \varepsilon>0, \delta>0 , 只要 K L log m H ( X ) + ε \frac{K}{L} \log m \geq H(\mathrm{X})+\varepsilon , 则当 L 足够大时, 必可使译码差错小于 δ \delta ;

反之, 当 K L log m H ( X ) 2 ε \frac{K}{L} \log m \leq H(X)-2 \varepsilon 时, 译码差错一定是有限值, 而当 L 足够大时, 译码几乎必定出错.

(1)当编码器容许的输出信息率, 也就是当每个信源符号所必须输出的码长是

K = K L logm \overline{\boldsymbol{K}}=\frac{\mathrm{K}}{\mathrm{L}} \operatorname{logm}

时,只要 K ˉ > H ( X ) \bar{K}>H(X) , 这种编码器一定可以做到几乎无失真, 也就是收端的译码差错概率接近于零, 条件是 所取的符号数 L 足够大。

(2)将定理的条件改写成

K log m > L H ( X ) = H ( X ) K \log m>L H(X)=H(\mathbf{X})

其中:左边: K 长码字所能携带的最大信息, 右边: L 长信源序列携带的信息量。上述定理表明:

  • 只要码字所能携带的信息量大于信源序列输出的信息量, 则可以使传 输几乎无失真, 当然条件是 L 足够大。
  • 反之, 当 K ˉ < H ( X ) \bar{K}<H(X) 时, 不可能构成无失真的编码, 也就是不可能做一 种编码器, 能使收端译码时差错概率趋于零。
  • K ˉ = H ( X ) \bar{K}=H(X) 时, 则为临界状态, 可能无失真, 也可能有失真。
【版权声明】本文为华为云社区用户原创内容,未经允许不得转载,如需转载请自行联系原作者进行授权。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。