Rappor Introduction中$2(Y-0.25)$的推导
原文[1]中
For this question, the survey respondent is asked to flip a fair coin, in secret, and answer “Yes” if it coms up heads, but tell the truth otherwise.
后边说这种情况下回答者可以对“Yes”进行deny,但是无法对“No”进行deny,于是
as a refinement, respondents can also choose the untruthful answer by flipping another coin in secret, and get strong deniability for both “Yes” and “No” answers.
由此我们推测这种回答过程是第一次抛硬币时正面回答“Yes”,反面的话第二次抛硬币;第二次硬币反面的话回答“No”,正面的话“tell the truth”。
采用像[2]中的表达式子,用$Z=1$表示回答真的是“Yes”;用$Y=1$表示回答是经过RR后的“Yes”(也就是观察到的结果),$Y=0$表示回答是经过RR后的“No”。
于是我们有:
\[first flip = \left\{ \begin{array}{lr} head: \ P(Y=1)=\frac{1}{2}\\ tail:\ \frac{1}{2}second \ flip \end{array} \right. \tag{1}\] \[second flip = \left \{ \begin{array} {lr} head: \ P(Y=1)=\frac{1}{2}P(Z=1) \ or \ P(Y=0)=\frac{1}{2}P(Z=0) \\ tail:\ P(Y=0)=\frac{1}{2}\end{array}\right. \tag{2}\]于是
\[P(Y=1)= \frac{1}{2} + \frac{1}{4}P(Z=1)\]所以
\[P(Z=1) = 4(P(Y=1)-0.5) \tag{3}\]但是这与文中的不符。所以大胆揣测文中的意思是,如果两次都是正面回答”Yes”;两次都是反面回答“No”;一正一反如实回答。这样的话
\[\left\{ \begin{array}{lr} 2head:\ P(Y=1)=1/4 \\ 2tail: \ P(Y=0)=1/4 \\ 1head\ 1tail:\ P(Y=1)=\frac{1}{2}P(Z=1) \ or\ P(Y=0)=\frac{1}{2}P(Z=0) \end{array} \right. \tag{4}\]此时可以推出$P(Z=1)=2(P(Y=1)-0.25)$
PS: 可能推导有问题。。但是没想出更好的解释。其实没必要纠结这个小细节,知道RR的思想,然后能求出准确的结果就好。RR的方式是多种多样的。。
PPS: 7.17日补充,和贵哥讨论,第一次正面时回答真相,反面则再抛一次;第二次正面则回答Yes,反面回答No,也可推出上述结论。再次证明这个不是重要问题。
参考文献
[1] RAPPOR: Randomized Aggregatable Privacy-Preserving Ordinal Response
[2] Design and Analysis of the Randomized Response Technique