Почему мир еще не готов к ChatGPT?

Универсальная система автоматической генерации текста (ATG), способная выводить копию, почти неотличимую от работы человека-писателя, официально все еще находится в стадии бета-тестирования, но уже используется в десятках новых приложений. ChatGPT, например, уже имитировал работающую оболочку Linux и даже сдавал вступительный экзамен в Wharton Business School.

Ажиотаж вокруг ChatGPT по понятным причинам высок. Множество стартапов хотят лицензировать технологию для всего: от общения с историческими личностями до чтения исторической литературы, от изучения других языков до составления упражнений и обзоров ресторанов.

История происхождения OpenAI на миллиард долларов

OpenAI была снована в 2015 году как некоммерческая организация Сэмом Альтманом, Питером Тилем, Рейдом Хоффманом, Илоном Маском и множеством других венчурных деятелей, которые все вместе вложили миллиард долларов, чтобы запустить организацию. «Альтруистическое» предприятие утверждает, что ИИ «должен быть продолжением индивидуальной человеческой воли и, в духе свободы, распространяться как можно более широко и равномерно».

В следующем году компания выпустила свою первую общедоступную бета-версию платформы обучения с подкреплением OpenAI Gym. Маск ушел из совета директоров в 2018 году, сославшись на потенциальный конфликт интересов с его Tesla. 2019 год был особенно насыщен событиями для OpenAI. В том же году компания учредила коммерческую дочернюю компанию (OpenAI LP) с первоначальной некоммерческой организацией (OpenAI Inc), получила дополнительное финансирование в размере миллиарда долларов от Microsoft и объявила о планах начать коммерческое лицензирование своих продуктов.

В 2020 году OpenAI официально запустила GPT-3, текстовый генератор, способный «обобщать юридические документы, предлагать ответы на запросы в службу поддержки клиентов, предлагать компьютерный код [и] запускать текстовые ролевые игры». Компания выпустила свой коммерческий API в том же году.

В 2021 году был выпущен DALL-E, генератор преобразования текста в изображение; и в прошлом году компания снова попала в заголовки газет, выпустив ChatGPT, чат-клиент, основанный на GPT-3.5, последней и текущей итерации GPT. В январе 2023 года Microsoft и OpenAI объявили об углублении своего исследовательского сотрудничества с многолетними многомиллиардными постоянными инвестициями.

Что такое генеративный ИИ?

OpenAI далеко не единственный игрок в игре ATG. Генеративный ИИ (или, более кратко, ген-ИИ) — это практика использования алгоритмов машинного обучения для создания нового контента — будь то текст, изображения, аудио или видео — на основе обучающего корпуса помеченных примеров баз данных.

Это ваш стандартный неконтролируемый режим обучения с подкреплением, подобно которому обучили Google AlphaGo, механизмы рекомендаций песен и видео в Интернете, а также системы помощи водителю транспортных средств. Конечно, в то время как такие модели, как Stable Diffusion от Stability AI или Google Imagen, обучены постепенно преобразовывать шаблоны случайных точек с более высоким разрешением в изображения, ATG, такие как ChatGPT, смешивают текстовые отрывки, извлеченные из их обучающих данных, для вывода подозрительно реалистичной, хотя часто заурядной, прозы.

Генеративный ИИ — это уже большой бизнес. В то время как громкие события, такие как судебный иск против производителя Stable Diffusion за кражу данных об обучении из Meta* или ChatGPT, сумевшего попасть в медицинскую школу, захватывают заголовки, компании из списка Fortune 500, такие как NVIDIA, Facebook*, Amazon Web Services, IBM и Google потихоньку используют gen-AI для собственной выгоды. Они используют его во множестве приложений, от улучшения результатов поисковых систем и предложения компьютерного кода до написания маркетингового и рекламного контента.

Секрет успеха ChatGPT

Попытки заставить машины общаться с нами, как мы общаемся с другими людьми, как отмечает доктор Крапп, начались в 1960-х и 70-х годах, и лингвисты были одними из первых последователей.

«Они поняли, что некоторые разговоры можно смоделировать таким образом, чтобы они были более или менее автономными», — пояснил он. «Если я могу поговорить, ну знаете, со стереотипным среднестатистическим терапевтом, это значит, что я также могу запрограммировать компьютер на роль терапевта».

Сегодня мы используем технологические потомки тех первых усилий, чтобы переводить для нас меню в модных ресторанах, выступать в качестве цифровых помощников на наших телефонах и общаться с нами в качестве представителей службы поддержки клиентов. Проблема, однако, в том, что для того, чтобы заставить ИИ выполнять любую из этих функций, он должен быть специально обучен для выполнения этой конкретной задачи.

Мы все еще далеки от функциональных общих ИИ, но часть впечатляющих возможностей ChatGPT проистекает из его способности писать посредственные стихи так же легко, как он может генерировать поддельный набор Условий обслуживания для веб-сайта Truth Social голосом Дональда Трампа без потребность в специальной подготовке.

Эта прозаическая гибкость возможна, потому что по своей сути ChatGPT является чат-ботом. Он разработан в первую очередь для того, чтобы точно имитировать собеседника-человека, что он действительно делал на Reddit в течение недели в 2020 году, прежде чем это было обнародовано публике. Он был обучен с использованием контролируемых методов обучения, при которых инструкторы-люди изначально вводили в модель обе стороны данного разговора — и то, что должен был сказать пользователь-человек и агент ИИ.

С основами в своем роботизированном разуме ChatGPT затем разрешили общаться с людьми, и его ответы ранжировались после каждого сеанса. Субъективно лучшие ответы получили более высокие оценки во внутренней системе вознаграждений модели и впоследствии были оптимизированы.

Часть бурного успеха ChatGPT — всего через два месяца после запуска он собрал рекордные 100 миллионов активных пользователей в месяц — безусловно, может быть отмечена надежными маркетинговыми стратегиями.

ChatGPT поступает в университет

ChatGPT также вызывает раздражение в научных кругах. Генератор текста успешно прошел письменную часть вступительного экзамена в Wharton Business School, а также все три части экзамена на получение медицинской лицензии в США.

Реакция была быстрой (как и большинство панических атак в ответ на новые технологии), но очень разнообразной. Система государственных школ Нью-Йорка применила традиционный подход, тщетно «запретив» использование приложения учащимися, в то время как преподаватели, такие как доктор Итан Моллик, доцент престижной школы Уортон Пенсильванского университета, внедрили его в свои планы уроков.

«Это было внезапное изменение, не так ли? Есть много хороших вещей, которые нам придется делать по-другому, но я думаю, что мы могли бы решить проблемы, связанные с тем, как мы учим людей писать с помощью ChatGPT», — сказал Моллик в январе.

«Правда в том, что я, вероятно, не смог им [студентам] запретить его использовать, даже если бы захотел», — добавил он. Вместо этого Моллик предлагает своим ученикам использовать ChatGPT в качестве генератора подсказок и идей для своих эссе.

Доктор Крапп из UCI применил аналогичный подход.

«В настоящее время я веду пару занятий, и мне было легко сказать: «Хорошо, вот наше письменное задание, давайте посмотрим, что придумает ChadGPT», — объяснил он. «Я выполнил пять разных способов с разными подсказками или частичными подсказками, а затем попросил студентов поработать над вопросом: «Как мы узнаем, что это не написано человеком, и чему мы можем научиться из этого?».

Страх обязательно нас спасет, наверное

Скорее всего, работа ChatGPT и подобных сетей в конечном итоге будет регулироваться, будь то государствами или самой индустрией в ответ на общественное давление.

На это указывают усилия, предпринятые в 2022 году исследователем OpenAI по безопасности Скоттом Ааронсоном по разработке криптографического водяного знака, чтобы конечный пользователь мог легко обнаруживать материалы, созданные компьютером, в качестве одного из примеров попыток отрасли к саморегулированию.

«По сути, всякий раз, когда GPT генерирует какой-то длинный текст, мы хотим, чтобы в его выборе слов был незаметный секретный сигнал, который вы можете использовать, чтобы позже доказать, что да, это исходит от GPT», — написал Ааронсон в своем блоге. «Мы хотим, чтобы было намного сложнее взять вывод GPT и выдать его за человека. Очевидно, это может быть полезно для предотвращения академического плагиата, а также, например, для массового распространения пропаганды».

Эффективность такой защиты еще предстоит выяснить...

Meta * и Facebook* – запрещенные на территории России организации.

Подписывайтесь на T4S.TECH в Telegram. Публикуем новости, обзоры и забавные факты о технологиях.

Почему мир еще не готов к ChatGPT?