В статье "Миссия: невозможные язаковые модели", получившая признание как "Лучшее исследование" на конференции по компьютерной лингвистики в 2024 году, рассматривается, может ли искусственный интеллект (ИИ) предоставить информацию о том, как люди изучают языки, в частности, путем проверки того, могут ли языковые модели ИИ изучать «невозможные» языки — те, грамматические правила которых не встречаются ни в одном известном человеческом языке.
Вот ключевые моменты этой статьи:
1. Теория Хомского: Ноам Хомский утверждал, что у людей есть врожденный механизм изучения языка, делающий определенные грамматические правила «возможными», а другие — «невозможными» для изучения людьми. Он критиковал языковые модели ИИ за то, что они способны одинаково хорошо изучать как возможные, так и невозможные языки, предполагая, что им не хватает специализированных механизмов, которые используют люди.
2. Тестирование невозможных языков: Такие исследователи, как Джули Каллини и ее команда, протестировали современные модели ИИ (трансформационные сети) на искусственно созданных невозможных языках. Они обнаружили, что, хотя модели ИИ могли изучать эти языки, они испытывали больше трудностей с невозможными языками, чем с обычным английским, что предполагает некоторое соответствие предпочтениям человека в изучении языка.
3. Локальность информации: исследование выявило принцип, называемый «локальностью информации», который объясняет, почему некоторые невозможные языки сложнее для изучения моделями ИИ. Этот принцип может также применяться к изучению языка человеком, предлагая потенциальный мост между процессами обучения ИИ и человека.
4. Выводы для лингвистики: результаты оспаривают утверждение Хомского о том, что модели ИИ не имеют отношения к лингвистике. Вместо этого они предполагают, что ИИ может быть ценным инструментом для понимания изучения языка, особенно с учетом того, что этические ограничения ограничивают эксперименты на человеческих младенцах.
5. Будущие исследования: результаты открывают новые возможности для изучения того, как различные конструкции нейронных сетей влияют на изучение языка, и могут привести к дальнейшему исследованию невозможных языков, потенциально уточняя теории изучения языка человеком.
Подводя итог, в статье подчеркивается, как модели языка ИИ, несмотря на их отличия от человеческого языкового обучения, могут предложить идеи для изучения языка, в частности, путем проверки границ того, что «поддается изучению», и почему определенные языковые шаблоны предпочтительнее других.