Большие языковые модели гораздо линейнее, чем мы думали
Блог компании AIRI | Алгоритмы | Машинное обучение | Искусственный интеллект | Natural Language Processing* Хабр, привет! Это снова Антон Разжигаев, аспирант Сколтеха и научный сотрудник лаборатории FusionBrain в Институте AIRI, где мы продолжаем углубляться в изучение языковых моделей. В прошлый раз мы выяснили что эмбеддинги трансформеров‑декодеров сильно анизотропны. На этот раз я бы хотел …
Большие языковые модели гораздо линейнее, чем мы думали Читать полностью »

