На днях в Альбукерке завершила свою работу конференция NAACL 2025
В этом году конференцию посетили руководитель группы «Прикладное NLP» Елена Тутубалина и руководитель группы «Вычислительная семантика» Александр Панченко.
Исследователи представили 8 статей AIRI:
В статье описан пайплайн для генерации многоязычных данных для параллельной детоксификации, а также представлен новый датасет для этой задачи под названием SynthDetoxM.
Исследователи разработали новый метод оценки неопределённости с учителем, основанный на генерации текста с помощью расстояния Махаланобиса.
Авторы представили новый механизм повышения качества развёрнутой модели с точки зрения производительности и справедливости прогнозирования, основанный на выборочном устранении смещений.
Авторы этой статьи выяснили, что токены, кодирующие знаки препинания, артикли и стоп-слова, играют более важную роль в обработке информации языковыми моделями, чем считалось ранее.
Авторы исследовали, можно ли внедрять новые факты в LLM с использованием LoRA без ущерба для ранее полученных знаний.
В данной статье предлагается SkipCLM — новый метод улучшения многоязычного машинного перевода в декодерах-трансформерах.
В статье описан новый метод оценки согласованности изображений с использованием LVLM и энкодера на основе архитектуры трансформера.
Статья посвящена новому датасету SPY, который может быть полезен в задаче обнаружения персональных данных, позволяющих идентифицировать человека.
Делимся фотографиями с конференции!
>>Click here to continue<<




