Sara Rajaram

Sara Rajaram, James R. Cotton, Fabian H. Sinz Similarity as Reward Alignment: Robust and Versatile Preference-based Reinforcement Learning RLBRew 3 Workshop workshop paper · body & behavior twins · openreview

Sara Rajaram, James R. Cotton, Fabian H. Sinz Similarity as Reward Alignment: Robust and Versatile Preference-based Reinforcement Learning arXiv preprint · body & behavior twins · arXiv