I'm surprised transfer learning via fine-tuning large transformer models hasn't ...

p1esk · on Aug 3, 2019

It has taken off. Pretty much everyone and their grandma has fine tuned gpt-2 to generate all kinds of stuff, even poetry: https://www.gwern.net/GPT-2

ma2rten · on Aug 3, 2019

It's a very new thing. Pretrained ImageNet models were first released around 2011. Pretrained transformer models have only been released recently.

Also, transformers are only useful for short text, not full documents (AFAIK).

bigmit37 · on Aug 4, 2019

are transformer models are the text version of imagenet model? The first time I am hearing this term.

ipsum2 · on Aug 2, 2019

Google (and I assume most ML providers) offers transfer learning on image models: https://cloud.google.com/vision/automl/docs/