我们提出了一个通用,灵活和可扩展的框架DPART,这是一个开源python库,用于私人合成数据生成。该方法的核心是自回旋建模 - 将联合数据分布分配到一系列较低维的条件分布序列,这些分布由各种方法(例如机器学习模型(逻辑/线性回归,决策树)等)捕获,简单直方图,简单直方图,或定制技术。该图书馆的创建是为了作为快速且可访问的基线以及容纳广泛的用户,从综合数据生成的第一步到具有域专业知识的经验丰富的人,他们可以配置不同方面建模并贡献新的方法/机制。DPART的特定实例包括独立,优化版本的Privbayes和新提出的模型DP-SynthPop。代码:https://github.com/hazy/dpart
translated by 谷歌翻译