信息论与编码(七)| 无失真变长编码定理与编码效率

举报
timerring 发表于 2022/09/30 16:37:00 2022/09/30
【摘要】 编码效率与信源长度为了衡量编码效果, 定义编码效率:η=H(X)H(X)+ε,ε>0,\eta=\frac{H(X)}{H(X)+\varepsilon}, \varepsilon>0,η=H(X)+εH(X)​,ε>0,对等长编码,若要实现几乎无失真编码,则信源长度必须满足:L≥σ2(X)ε2δL \geq \frac{\sigma^{2}(X)}{\varepsilon^{2} \de...

编码效率与信源长度

为了衡量编码效果, 定义编码效率:

η = H ( X ) H ( X ) + ε , ε > 0 , \eta=\frac{H(X)}{H(X)+\varepsilon}, \varepsilon>0,

对等长编码,若要实现几乎无失真编码,则信源长度必须满足:

L σ 2 ( X ) ε 2 δ L \geq \frac{\sigma^{2}(X)}{\varepsilon^{2} \delta}

其中: σ 2 ( X ) = E { [ I ( x i ) H ( X ) ] 2 } \sigma^{2}(X)=E\left\{\left[I\left(x_{i}\right)-H(X)\right]^{2}\right\} , 为信源序列的自信息方差

例 2 :设离散无记忆信源概率空间

[ X P ] = [ a 1 a 2 a 3 a 4 a 5 a 6 a 7 a 8 0.4 0.18 0.1 0.1 0.07 0.06 0.05 0.04 ] \left[\begin{array}{l} X \\ P \end{array}\right]=\left[\begin{array}{cccccccc} a_{1} & a_{2} & a_{3} & a_{4} & a_{5} & a_{6} & a_{7} & a_{8} \\ 0.4 & 0.18 & 0.1 & 0.1 & 0.07 & 0.06 & 0.05 & 0.04 \end{array}\right]

  • 信息熵: H ( X ) = i p ( x i ) log p ( x i ) = 2.55 b i t / 符号 H(X)=-\sum_{i} p\left(x_{i}\right) \log p\left(x_{i}\right)=2.55 \mathrm{bit} / 符号

  • 方差: σ 2 ( X ) = i = 1 8 p i ( log p i ) 2 [ H ( X ) ] 2 = 7.82 b i t 2 \sigma^{2}(X)=\sum_{i=1}^{8} p_{i}\left(\log p_{i}\right)^{2}-[H(X)]^{2}=7.82 b i t^{2}

  • 若取差错率 δ 1 0 6 \delta \leq 10^{-6} , 编码效率为 90 % 90 \% , 则 L 应满足

    ε = 1 η η H ( X ) 0.28 L σ 2 ( X ) ε 2 δ = 7.82 0.2 8 2 × 1 0 6 = 9.8 × 1 0 7 \begin{array}{l} \varepsilon=\frac{1-\eta}{\eta} H(X) \approx 0.28 \quad L \geq \frac{\sigma^{2}(X)}{\varepsilon^{2} \delta}=\frac{7.82}{0.28^{2} \times 10^{-6}} \\ =9.8 \times 10^{7} \end{array}

在差错率和编码效率要求并不十分苛刻的条件下,就需要 L = 1 0 8 L=10^{8} 个信源符号进行联合编码, 这显然是很难实现的。

无失真变长编码定理

变长编码定理

  • 在变长编码中码长K是变化 的。
  • 我们可根据信源各个符号的统计特性如概率大的符号用短码,概率小的用较长的码,这样在大量信源符号编成码后平均每个信源符号所需的输出符号数就可以降低,从而提高编码效率。

平均码长

对于等长码, 平均码长就是每个码字的位数, 如 例 1 的码 0 , 其平均码长为 2 b i t 2 \mathrm{bit} ; 对于变长码, 平均码长为码字的码长的数学期, 即

K = i = 1 L p i l i  bit  \overline{\mathrm{K}}=\sum_{i=1}^{L} p_{i} l_{i} \text { bit }

其中 l i l_{i} 为信源符号 a i a_{i} 对应的码字的位数。

单个符号变长编码定理

若一离散无记忆信源的符号熵为 H ( X ) H(X) , 每个信源符号用 m 进制码元进行变长编码,一定存在一种无失真编码方法, 其 码字平均长度 K ˉ \bar{K} 满足下列不等式:

H ( X ) log m K ˉ < H ( X ) log m + 1 \frac{H(X)}{\log m} \leq \bar{K}<\frac{H(X)}{\log m}+1

离散平稳无记忆序列变长编码定理

对于平均符号熵为 H ( X ) H(\mathrm{X}) 的离散平稳无记忆信源,必存在 一种无失真编码方法,使平均信息率 K \overline{\boldsymbol{K}} 满足不等式

H ( X ) K < H ( X ) + ε H(\mathbf{X}) \leq \overline{\mathbf{K}}<H(\mathbf{X})+\varepsilon

其中 ε \varepsilon 为任意小正数,
平均信息速率为: K = K ˉ L log m \overline{\boldsymbol{K}}=\frac{\bar{K}}{L} \log m , 表示单个符号的平均 码长

用变长编码来达到相当高的编码效率,一般所要求 的符号长度 L 可以比定长编码小得多。
编码效率的下界:

η = H ( X ) K > H ( X ) H ( X ) + log m L \eta=\frac{H(\mathbf{X})}{\overline{\mathbf{K}}}>\frac{H(\mathbf{X})}{H(\mathbf{X})+\frac{\log m}{L}}

信息率与编码效率

  • 信息率

R = K L log m R=\frac{K}{L} \log m

  • 编码效率

η = H ( X ) R \eta=\frac{H(\mathbf{X})}{R}

【版权声明】本文为华为云社区用户原创内容,未经允许不得转载,如需转载请自行联系原作者进行授权。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。