top
new
show
ask
jobs
about

Reinforcement Learning from Human Feedback (RLHF) in Notebooks

70 points by ash_at_hny 14 hours ago

kcdom1000f 12 hours ago

Hl

careful_ai 8 hours ago

[dead]

bobvylan 7 hours ago

[dead]