【五期邹昱夫】CCF-A（KDD '19）Auditing data provenance in text-generation models.

时间：2023-02-03 11:01:05浏览次数：52

标签：Auditing 邹昱夫 KDD text 模型 generation 黑盒 CCF 审计员

"Song C, Shmatikov V. Auditing data provenance in text-generation models[C]//Proceedings of the 25th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining. 2019: 196-206."

本文设计并评估了一种帮助用户审核机器学习模型，以确定其数据是否用于训练这些模型的技术。应用于文本生成模型，且审计员只能对模型进行黑盒访问。使用方法是影子模型方法。
本文的优点在于从实际出发，以用户角度考虑问题。在实践中，审计员可能不知道目标模型训练数据的整个分布，因此影子训练数据不需要从与目标模型的训练数据相同的分布中提取。
本文的缺点在于其实际场景中的可用性不足。其绪论举例的DeepMind事件，未经授权使用NHS患者数据有160万份。而图2的实验结果说明，当用户数量越多时这种审计技术效果越差，用户数在4000个时精确度在80%以下，而用户数到10000时下降更多。其次本文设计的黑盒场景中，要求审计员知道目标模型的学习算法，并不是完全黑盒。

2023年2月3日

标签：Auditing,邹昱夫,KDD,text,模型,generation,黑盒,CCF,审计员
From： https://www.cnblogs.com/FBprivacy/p/17087334.html

【五期邵润东】CCF-A(AAAI'21)Distillation-Based Semi-Supervised Federated Learnin
Gong,Xuan,etal."Preservingprivacyinfederatedlearningwithensemblecross-domainknowledgedistillation."ProceedingsoftheAAAIConferenceonArtific......
【五期邵润东】CCF-A(TVCG'21)HetVis: A Visual Analysis Approach for Identifying D
Wang,Xumeng,etal."HetVis:AVisualAnalysisApproachforIdentifyingDataHeterogeneityinHorizontalFederatedLearning."IEEETransactionsonVisualizat......
【五期李伟平】CCF-B（IPM'20）Blockchain-based privacy-preserving remote data integri
Qz,A,etal."Blockchain-basedprivacy-preservingremotedataintegritycheckingschemeforIoTinformationsystems-ScienceDirect."InformationProcessing......
【五期李伟平】CCF-A（CCS'17）Practical Multi-party Private Set Intersection from Sym
Kolesnikov,V.,etal."PracticalMulti-partyPrivateSetIntersectionfromSymmetric-KeyTechniques."AcmSigsacConferenceonComputer&CommunicationsSec......
【五期李伟平】CCF-A（CCS'21）Simple, Fast Malicious Multiparty Private Set Intersect
OfriNevo,NiTrieuandAvishayYanai."Simple,FastMaliciousMultipartyPrivateSetIntersection."InProceedingsofthe2021ACMSIGSACConferenceonComp......
【五期李伟平】CCF-C（CC'19）Privacy preserving distributed data mining based on secu
JunLiu,YuanTian,YuZhouetal."Privacypreservingdistributeddataminingbasedonsecuremulti-partycomputation."ComputerCommunications.Ed.2020.20......
【五期邹昱夫】USENIX Security（USENIX Security'18）AttriGuard: A Practical Defense A
"Jia,Jinyuan,andNeilZhenqiangGong."AttriGuard:Apracticaldefenseagainstattributeinferenceattacksviaadversarialmachinelearning."27thUSENIXS......
Neural Dynamics on Complex Networks-KDD20
一、摘要学习复杂网络上的连续时间动态对于理解、预测和控制科学和工程中的复杂系统至关重要。然而，由于高维系统结构中的组合复杂性、它们难以捉摸的连续时间非线性动力学......
A Representation Learning Framework for Property Graphs(KDD19)
一、摘要图上的表示学习，也称为图嵌入，已经证明了它对一系列机器学习应用程序的重大影响，如分类、预测和推荐。然而，现有工作在很大程度上忽略了那些可以被表示为属性图的现......
两款开源.NET工作流引擎 Elsa 与ccflow使用比较
相对java开源的工作流程引擎.net开源的工作流程引擎相对较少，这里整理两款.net开源工作流引擎，做一下对比使用。elsa示例代码:Githubd地址：https://github.com/zhenl/MyElsac......

【五期邹昱夫】CCF-A（KDD '19）Auditing data provenance in text-generation models.

相关文章

赞助商

阅读排行