时间序列, 机器学习, 音乐检索

【笔记】数字音频认证

昨天提到了数字水印和音频指纹的区别。
今天说一说多媒体认证。

1. 分为两类:数字签名法和基于水印的方法。
数字签名法:提取反映媒体特性的紧致数字签名 (也可称为数字指纹) ,一般不对媒体内容进行修改 ,可以以头文件的形式附加到媒体外部 ,或
存储在数据库中 ,或采用水印方法自嵌入到媒体。
基于水印:将认证信息嵌入到媒体中 ,又可分为完全脆弱水印法和半脆弱水印法 。 特征提取系统需要传输信道中的所有节点参与传递特征数据 ,这有时并不方便甚至并不可能 ,而脆弱/ 半脆弱音频水印技术则完全不需要各节点的参与 。

2. 另一种根据内容完整性的分类标准:硬认证和软认证。
硬认证:拒绝对多媒体内容的任何修改 ,唯一接受的操作是保持视觉像素值和音频样本值的无损压缩和格式转换 ,其它所有信号处理都将触发检测器 ,使验证失败 。
软认证:可以通过某些内容修改 ,称为可容许的操作 ,并拒绝其它恶意处理 。
软认证进一步分类:基于质量的认证和基于语义的认证
前者:拒绝任何使感知质量下降到低于某一可接受水平的处理
后者:则拒绝任何改变媒体语义的操作 。 此类算法一般采用鲁棒数字签名法或半脆弱水印法 。

3. 音频内容完整性认证系统
一个能够区分内容保持操作和恶意篡改的认证系统
3.1 硬认证具有最小的失真容忍性 ,而基于语义的认证则具有最大的失真容忍性 ,只要不改变媒体传达的语义即可
3.2 软认证尤其是基于质量的软认证中 ,由于保持内容操作和恶意操作缺乏明确的定义 ,准确地刻画它们变得非常困难 ,需要根据不同的应用具体分析 ,成为一个公开的研究难题 。 另一个研究难点就是如何抵抗同步攻击 。目前的绝大多数认证算法对此类处理引起的失同步没有任何的抵抗力 。

3.3 保持内容操作和恶意操作定义:
(1) 保持内容操作 :包括音频转码 、重采样 、调节音量 、去除噪声 、滤波 、均衡化 、回声 、无损压缩和高比特率有损压缩 、A/ D 和 D/ A 转换等标准音频信号处理 ;保持音调不变的时间缩放 、抖动攻击 、平移等时间域同步处理 。
(2) 恶意操作 :改变原始音频语义内容 ,包括局部替换 、修改 、删除 、添加 ,时间轴多个片段重排序 ,低比特率的有损压缩等。
3.4 标记转移
多媒体内容认证系统为了定位被恶意篡改 、替换的
局部区域 ,一般采用基于分块/ 分帧的技术 ,因此还需要抵抗
一种叫做 “ 标记转移”的专门针对分块/ 分帧公开水印系统设
计的恶意攻击 。此类攻击利用已有的带水印信号来伪造有效
的水印.
3.5 标记转移攻击过程:首先除去水印 ,然后修改信号内容 ,最后重新嵌入水印 。
3.6 两种水印面对攻击的结果:
脆弱性水印 ,经受该攻击可能会产生虚假认证 。
对鲁棒性水印 ,此攻击能把水印同步算法来解决由于保持内容操作引起的失同步问题 ,语音中的静音段和有声段也用低复杂度的算法加以识别 ,还进行了统计分析来计算篡改检测的误检率。

4. 基于半脆弱水印的音频认证方法
见论文了嗷!

本篇文章读的轻松多啦!
这些天的文献阅读感觉还是有用的。鼓励一下。

[1]李伟,汪竹蓉,李晓强,刘亚多.数字音频认证研究综述[J].计算机科学,2009,36(10):21-24.[2017-08-15].

2 comments

Leave a Comment

电子邮件地址不会被公开。 必填项已用*标注

This site uses Akismet to reduce spam. Learn how your comment data is processed.