Ай Дайджест - категория parameter

SmolTulu: Оптимизация Обучения Языковых Моделей через Соотношение Темпа Обучения и Размеров Пакетов

Мы представляем SmolTulu-1.7b-Instruct, упомянутый в этом отчете как SmolTulu-DPO-1130, языковую модель, откалиброванную на инструкции, которая адаптирует постобучение Tulu 3 от AllenAI для улучшения базовой модели Huggingface SmolLM2-1.7B. Путем комплексного эмпирического анализа с использованием модели на 135M параметров мы демонстрируем, что связь между скоростью обучения и размером батча значительно влияет на производительность модели в зависимости от задачи. Наши результаты показывают четкое разделение: задачи на рассуждение, такие как ARC и GSM8K, выигрывают от более высоких соотношений скорости обучения к размеру батча, в то время как задачи распознавания шаблонов, такие как HellaSwag и IFEval, показывают оптимальную производительность с более низкими соотношениями. Эти идеи легли в основу разработки SmolTulu, которая достигает передовой производительности среди моделей с менее чем 2B параметров в отслеживании инструкций, набирая 67.7% на IFEval (Delta11%), и математическом рассуждении с 51.6% на GSM8K (Delta3.4%), с альтернативной версией, набирающей 57.1% на ARC (Delta5.4%). Мы публикуем нашу модель, рецепты обучения и абляционные исследования для содействия дальнейшим исследованиям в области эффективного согласования моделей, демонстрируя, что тщательная адаптация динамики оптимизации может помочь сократить разрыв в возможностях между малыми и крупными языковыми моделями.

2024-12-16alignment batch performance

Omegance: Один параметр для управления гранулярностью в синтезе на основе диффузии

В этой работе мы вводим единственный параметр омега, чтобы эффективно контролировать гранулярность в основанном на диффузии синтезе. Этот параметр интегрируется на этапах удаления шума в обратном процессе диффузионной модели. Наш подход не требует повторной тренировки модели, архитектурных модификаций или дополнительных вычислительных затрат в процессе вывода, но позволяет точно контролировать уровень детализации в сгенерированных результатах. Более того, пространственные маски или графики удаления шума с различными значениями омега могут быть применены для достижения контроля гранулярности, специфичного для региона или временного шага. Предварительное знание композиции изображения из контрольных сигналов или эталонных изображений дополнительно упрощает создание точных масок омега для контроля гранулярности на конкретных объектах. Чтобы подчеркнуть роль параметра в контроле тонких вариаций деталей, техника названа Омеганс, сочетая "омега" и "нюанс". Наш метод демонстрирует впечатляющую производительность в различных задачах синтеза изображений и видео и адаптируем к продвинутым диффузионным моделям. Код доступен по адресу https://github.com/itsmag11/Omegance.

2024-11-28synthesis masks denoising