Thoughts: Favorite tweets

Friday, September 4, 2020

Favorite tweets

We've used reinforcement learning from human feedback to train language models for summarization. The resulting models produce better summaries than 10x larger models trained only with supervised learning: https://t.co/Sk31d1CnTu
— OpenAI (@OpenAI) September 4, 2020

from Twitter https://twitter.com/OpenAI

September 04, 2020 at 09:07AM
via IFTTT

No comments:

Post a Comment

Subscribe to: Post Comments (Atom)