何老师,你用albert在largebase上训练花了多久

利用了哪些设备能透露一下吗 ,我可能要自己pretrain一个 ,但是感觉实验室的设备不是很够。。

时间视语料库大小而定,当时大约一周,硬件是16GB的V100。