From: Coded unicast downstream traffic in a wireless network: analysis and WiFi implementation
State transition matrixP π
Reward vectorr π
p 2 + ( 1 − p ) 1 2 p ( 1 − p ) 1 2 p ( 1 − p ) 0 1 2 ( 1 − p ) p + 1 2 ( 1 − p ) 2 0 1 2 p ( 1 − p ) 1 2 ( 1 − p ) 0 p + 1 2 ( 1 − p ) 2 1 2 p ( 1 − p ) 0 1 2 ( 1 − p ) 1 2 ( 1 − p ) p
1 − p 1 − p 1 − p 1 − p