улучшенная версия предыдущей модели GPT 3, которая была натренирована на миллиардах слов и предложений по всему интернету. Когда он генерирует текст, он пытается предсказать каким должно быть следующее слово в данном конкретном предложении, опираясь на свою огромную выборку текстов. Конечным результатом становится имитация текста, написанного якобы человеком. ChatGPT еще иногда называют GPT 3.5, и основным различием является то, что OpenAI добавили обратную связь от людей в процесс обучения. Это называется Supervised Reinforcement Learning – обучение с учителем с подкреплением.
Почему это называется «обучение с учителем»? Потому что во время обучения модели, различные версии ответов на тот или иной запрос программой ранжируются человеком по качеству ответа: от наилучшей к худшей, и программе дается цифровое поощрение, когда она улучшает качество своего ответа. Модель дальше подвергается тонкой донастройке и регулированию, и процесс повторяется несколько раз.
Такой метод в итоге произвел языковую модель ИИ, которая в 100 раз меньше по размеру чем предыдущая модель GPT 3, но эффективность которой существенно выше. Для увеличения эффективности, разработчики модели создали архитектуру, состоящую из 175 млрд параметров (предыдущая модель состояла всего из 1,5 млрд параметров).
Как уже сказали, основное изменение по сравнению с предыдущей версией было то, что добавили обратную связь от человека. И в этом есть смысл, потому что очевидно, что люди знают, что нравится и что нужно другим людям, намного лучше чем компьютер, который пытается предугадать это вслепую.
Братский поединок: ChatGPT vs GPT-4
Cамая первая версия GPT, разработанная OpenAI, была выпущена в июне 2018 года. В ноябре 2022 году вышла нашумевшая версия GPT-3.5, более известная как ChatGPT, а в марте 2023 года – версия GPT-4.
Итак, в чем же различия?
1. Новые возможности
В отличие от ChatGPT, GPT-4 может работать с изображениями и понимать, что на них написано или нарисовано, тогда как ChatGPT ограничен только текстовым форматом работы.
2. Количество поддерживаемых языков
ChatGPT поддерживает около 20 самых популярных языков, включая английский, французский, испанский, немецкий и русский. У GPT-4 количество поддерживаемых языков значительно выросло до более чем 60, включая ряд региональных и малоизученных языков.
3. Размер обучаемой выборки
Обучение моделей нейронных сетей требует огромного количества данных. И здесь GPT-4 явно опережает своего "младшего брата". ChatGPT обучался на выборке, состоящей из более чем 45 терабайт текстовых данных. Это впечатляет, пока мы не узнаем, что размер обучаемой выборки для GPT-4 составляет более 100 терабайт!
4. Количество параметров для обучения
Параметры – это "строительные блоки" нейронных сетей. Чем больше параметров, тем сложнее и мощнее модель. Здесь GPT-4 снова опережает ChatGPT.
Предыдущие модели имели намного меньше параметров для обучения: GPT-1 имела 117 миллионов, GPT-2 – 1,5 миллиарда, GPT-3 и ChatGPT – 175 миллиардов параметров, что уже