Сегодня автоматическая генерация текста на естественном языке находится в авангарде развития не только компьютерной лингвистики (или NLP), но и компьютерных наук в целом. Недавние достижения в данной области — а именно появление крупных языковых моделей, таких как ChatGPT, — полностью изменили представления об обработке естественного языка. В то же время рост качества генерации несёт серьёзные опасности, связанные с невозможностью автоматически отличить искусственный текст, созданный моделью, от естественного, написанного живым человеком.
В рамках лекции мы рассмотрим историю развития языковых моделей — от трансформеров до современных LLM, — обсудим их особенности и подходы к применению, а также некоторые из существующих методов детекции сгенерированных текстов, в том числе с помощью стилометрической дельты.
С лекцией о LLM выступит аспирант Школы лингвистики НИУ ВШЭ Егор Андреевич Сальников. Встреча пройдет 18 мая 2024 г. онлайн на платформе Zoom в 15:00-16:00 по московскому времени. Ссылка для подключения.