TG Telegram Group & Channel
Институт AIRI | United States America (US)
Create: Update:

На днях в Альбукерке завершила свою работу конференция NAACL 2025 ⤵️

В этом году конференцию посетили руководитель группы «Прикладное NLP» Елена Тутубалина и руководитель группы «Вычислительная семантика» Александр Панченко.

Исследователи представили 8 статей AIRI:

⚫️SynthDetoxM: Modern LLMs are Few-Shot Parallel Detoxification Data Annotators (main track)
В статье описан пайплайн для генерации многоязычных данных для параллельной детоксификации, а также представлен новый датасет для этой задачи под названием SynthDetoxM.

⚫️Token-Level Density-Based Uncertainty Quantification Methods for Eliciting Truthfulness of Large Language Models (main track)
Исследователи разработали новый метод оценки неопределённости с учителем, основанный на генерации текста с помощью расстояния Махаланобиса.

⚫️Inference-Time Selective Debiasing to Enhance Fairness in Text Classification Models (main track)
Авторы представили новый механизм повышения качества развёрнутой модели с точки зрения производительности и справедливости прогнозирования, основанный на выборочном устранении смещений.

⚫️LLM-Microscope: Uncovering the Hidden Role of Punctuation in Context Memory of Transformers (findings)
Авторы этой статьи выяснили, что токены, кодирующие знаки препинания, артикли и стоп-слова, играют более важную роль в обработке информации языковыми моделями, чем считалось ранее.

⚫️How Much Knowledge Can You Pack into a LoRA Adapter without Harming LLM? (findings)
Авторы исследовали, можно ли внедрять новые факты в LLM с использованием LoRA без ущерба для ранее полученных знаний.

⚫️SkipCLM: Enchancing Crosslingual Alignment of Decoder Transformer Models via Contrastive Learning and Skip Connection (SRW)
В данной статье предлагается SkipCLM — новый метод улучшения многоязычного машинного перевода в декодерах-трансформерах.

⚫️Through the Looking Glass: Common Sense Consistency Evaluation of Weird Images (SRW)
В статье описан новый метод оценки согласованности изображений с использованием LVLM и энкодера на основе архитектуры трансформера.

⚫️SPY: Enhancing Privacy with Synthetic PII Detection Dataset (SRW)
Статья посвящена новому датасету SPY, который может быть полезен в задаче обнаружения персональных данных, позволяющих идентифицировать человека.

Делимся фотографиями с конференции!

На днях в Альбукерке завершила свою работу конференция NAACL 2025 ⤵️

В этом году конференцию посетили руководитель группы «Прикладное NLP» Елена Тутубалина и руководитель группы «Вычислительная семантика» Александр Панченко.

Исследователи представили 8 статей AIRI:

⚫️SynthDetoxM: Modern LLMs are Few-Shot Parallel Detoxification Data Annotators (main track)
В статье описан пайплайн для генерации многоязычных данных для параллельной детоксификации, а также представлен новый датасет для этой задачи под названием SynthDetoxM.

⚫️Token-Level Density-Based Uncertainty Quantification Methods for Eliciting Truthfulness of Large Language Models (main track)
Исследователи разработали новый метод оценки неопределённости с учителем, основанный на генерации текста с помощью расстояния Махаланобиса.

⚫️Inference-Time Selective Debiasing to Enhance Fairness in Text Classification Models (main track)
Авторы представили новый механизм повышения качества развёрнутой модели с точки зрения производительности и справедливости прогнозирования, основанный на выборочном устранении смещений.

⚫️LLM-Microscope: Uncovering the Hidden Role of Punctuation in Context Memory of Transformers (findings)
Авторы этой статьи выяснили, что токены, кодирующие знаки препинания, артикли и стоп-слова, играют более важную роль в обработке информации языковыми моделями, чем считалось ранее.

⚫️How Much Knowledge Can You Pack into a LoRA Adapter without Harming LLM? (findings)
Авторы исследовали, можно ли внедрять новые факты в LLM с использованием LoRA без ущерба для ранее полученных знаний.

⚫️SkipCLM: Enchancing Crosslingual Alignment of Decoder Transformer Models via Contrastive Learning and Skip Connection (SRW)
В данной статье предлагается SkipCLM — новый метод улучшения многоязычного машинного перевода в декодерах-трансформерах.

⚫️Through the Looking Glass: Common Sense Consistency Evaluation of Weird Images (SRW)
В статье описан новый метод оценки согласованности изображений с использованием LVLM и энкодера на основе архитектуры трансформера.

⚫️SPY: Enhancing Privacy with Synthetic PII Detection Dataset (SRW)
Статья посвящена новому датасету SPY, который может быть полезен в задаче обнаружения персональных данных, позволяющих идентифицировать человека.

Делимся фотографиями с конференции!
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM


>>Click here to continue<<

Институт AIRI










Share with your best friend
VIEW MORE

United States America Popular Telegram Group (US)