研究人员的AI系统从语音记录中去除了诸如性别之类的可识别属性

来源：作者：互联网时间：2023-04-25 17:20

阅读：

导读：上周在2020年国际机器学习大会上接受的一项研究中，查尔默斯科技大学和瑞典RISE研究院的研究人员提出了一种隐私保护技术，该技术可以学习混淆语音数据中的性别等属性。他们使用经...

上周在2020年国际机器学习大会上接受的一项研究中，查尔默斯科技大学和瑞典RISE研究院的研究人员提出了一种隐私保护技术，该技术可以学习混淆语音数据中的性别等属性。他们使用经过训练的模型

来过滤记录中的敏感信息，然后生成独立于过滤后的信息的新的私有信息，从而确保敏感信息保持隐藏状态而不会牺牲现实性和实用性。

鉴于不使用先进的AI技术已从音色，音调和说话者风格中推断出意图，性别，情绪状态和身份等属性，因此要保持隐私而不完全放弃语音助手是一项艰巨的任务。最近的报告显示，意外的语音助手激活使工作人员可以进行私人对话。这样的风险是，包括Mischon de Reya在内的律师事务所已建议工作人员在谈论家庭客户事务时，让智能扬声器静音。Google助手，Siri，Cortana和其他主要的语音识别平台都允许删除记录的数据，但这需要用户(有时在某些情况下)需要付出一定的努力。

研究人员的解决方案采用了称为PCMelGAN的生成对抗网络(GAN)，该模型分为两部分，由创建样本的生成器和试图区分生成的样本与真实样本的鉴别器组成的AI模型。它将语音记录映射到梅尔频谱图，或音频信号频谱随时间变化的频谱表示，然后使它们通过过滤器(该过滤器除去敏感信息)和生成器(在其位置添加合成信息)。PCMelGAN然后将梅尔频谱图输出转换为原始波形形式的音频。

在实验中，研究人员对来自开源AudioMNIST数据集中的10,000个样本进行了PCMelGAN培训，该数据集包含30,000录音的数字，这些录音以英语讲成一到九。他们通过确定分类器在频谱图和原始音频上运行五次后，是否可以以高于50%的准确度预测说话人的原始性别来衡量隐私。

根据研究人员的说法，结果表明PCMelGAN在经验上难以使对手(例如)推断说话者的性别，同时保留包括语调和内容在内的品质。提出的方法可以成功地模糊语音数据中的敏感属性，并生成独立于敏感输入属性的真实语音。他们在AudioMNIST数据集上检查性别属性的结果表明，该方法可以保持较高的实用性。随着在组织，公司和国家/地区中通过各种设置收集的数据越来越多，对用户隐私的需求也在增加。”

DOLA时尚网部分内容来源于互联网，登载此文出于传递更多信息之目的，并不意味着赞同其观点或证实其描述。文章内容仅供参考，如有侵犯版权请来信告知E-mail:906207380@qq.com,我们将立即处理。

关键词：

研究人员的AI系统从语音记录中去除了诸如性别之类的可识别属性

相关文章

重庆导游在泰国被大象踩踏致

反击特朗普！巴勒斯坦宣布将

爽约车频现、加价离谱，网约

发表评论