25 мая в рамках Костомаровского форума состоялась онлайн-дискуссия «Компьютер говорящий и понимающий?».
В обсуждении приняли участие ведущий научный сотрудник лаборатории когнитивных и лингвистических исследований Института Пушкина Мария Лебедева, ведущий эксперт лаборатории Антонина Лапошина, профессор НИУ ВШЭ и Хельсинкского университета Михаил Копотев, руководитель магистерской программы «Цифровые методы в гуманитарных науках» НИУ ВШЭ Даниил Скоринкин, главный эксперт по технологиям управления экспериментальных систем машинного обучения SberDevices Татьяна Шаврина и ведущий научный сотрудник и заведующий сектором теоретической семантики Института русского языка им. В.В. Виноградова РАН Борис Иомдин.
Дискуссия состояла из трех частей.
В первой части участники разбирались с общими представлениями: как компьютер умеет что-то говорить, писать и понимать, и что он умеет делать на русском языке.
По мнению Марии Лебедевой, наиболее успешными стали разработки в сфере машинного перевода. «Самая развитая часть, направление, в котором мы достигли наибольшего успеха, – это машинный перевод. Еще 10 лет назад мало кто верил в то, что возможен почти такой же качественный перевод, как делает это человек, но тем не менее в некоторых сферах, в некоторых случаях действительно машины переводят не хуже, чем человек», – считает Мария Лебедева. Она также отметила, что сейчас активно развиваются и технологии распознавание речи.
Татьяна Шаврина рассказала, что в одном из проектов ее команда обучила нейросеть писать тексты сочинений. Преподаватели, которые проверяли эти сочинения, не смогли распознать, что они не написаны человеком. «На самом деле это говорит скорее не о том, что алгоритм какой-то суперумный и смог такие тексты сконструировать. Само задание, в котором дети, сдавая ЕГЭ, сочиняют какие-то тексты, сконструировано так, что оно не очень интеллектуально. То есть для того, чтобы написать сочинение по ЕГЭ, не нужно обладать естественным интеллектом и даже никаким вообще интеллектом. Это довольно легко может сделать и машина», –? прокомментировала ситуацию Мария Лебедева.
Мария Юрьевна рассказала и о другой задаче, связанной с машинным обучением – научить алгоритмы проверять сочинения так, как это делает преподаватель. Здесь тоже можно сделать интересные выводы. Оказалось, что научить этому алгоритм невозможно, потому что все преподаватели проверяют по-разному. «Несмотря на то что есть критерии оценки, на самом деле эти критерии оценки приводят к очень большой разнице в том, как один и тот же текст с одним и тем же посылом и с одними и теми же ошибками получает разные оценки у разных преподавателей, у разных экспертов», – сказала Мария Лебедева. Очевидная проблема, которая при этом возникает – необъективное оценивание.
Михаил Копотев и Даниил Скоринкин рассказали, каким образом машина создает текст. В отличие от человека, компьютер не может творить. По словам экспертов, он способен сформировать связный текст, но создавать новые знания, новые идеи компьютер не умеет и уметь не будет – по крайней мере, в ближайшее время.
Вторая часть мероприятия была посвящена возможностям интеллектуальных систем при обучении языку. Эксперты Института Пушкина подчеркнули, что компьютерные технологии предназначены не для полной замены преподавателя, а скорее для помощи преподавателю в рутинных задачах.
Антонина Лапошина представила созданный в Институте Пушкина «Текстометр», который помогает на основе загруженных текстов различать уровень их сложности. «Это как раз классический пример машинного обучения с учителем», – прокомментировала Антонина Лапошина задачи новой разработки.
Михаил Копотев представил другой продукт, созданный для помощи учителям – проект Revita. Одна из его функций – генерировать упражнения из любого текста, который будет загружен в систему. При этом система запоминает, как учащийся отвечал на вопросы.
«С одной стороны, она подсказывает, что нужно было сделать. С другой стороны, запоминает ошибки и в следующий раз будет давать именно те упражнения, которые соответствуют его уровню. Это тоже пример такой ясной, понятной задачи, которую решают интеллектуальные системы именно в вопросах обучения языку, потому что когда преподаватель создает упражнения, у него на это уходит очень много времени. А вот алгоритмы, машины могут это делать достаточно быстро, а главное – бесконечно много», – отметила Мария Лебедева.
В третьей части дискуссии эксперты говорили о компетенциях современного филолога, необходимых для его личной конкурентоспособности на рынке труда.
Даниил Скоринкин сказал, что цифровые методы в филологии – довольно модное сейчас направление, но при этом оно все-таки остается маргинальным.
Мария Лебедева также считает, что главное – это классическая фундаментальная подготовка: «В основном филологические задачи не про конкурентноспособность, а скорее про сохранение наследия, и в таком случае о рыночной постановке вопроса речи не идет. В филологии по-прежнему лидируют и лучше всего показывают себя классические методы».
Антонина Лапошина сделала акцент на корпусной лингвистике. По ее мнению, современному специалисту очень важно знать, что такое корпус и как с ним работать. Также важно обладать междисциплинарным взглядом на мир – понимать, как одну и ту же задачу могут решить специалисты из разных сфер.
Михаил Копотев сказал, что преподавателю очень важно работать с технологиями, понимать, как технологии устроены. Борис Иомдин подчеркнул, что несмотря на то, что алгоритмы стремительно умнеют, в современном мире все-таки остаются важными такие фундаментальные знания, как системный взгляд на язык, представление о том, как устроена вариативность.