OpenAI представляет GPT-OSS: что на самом деле стоит за новой открытой моделью

OpenAI сделала шаг в нужном направлении, но для того, чтобы по-настоящему удовлетворить требования открытого доступа, необходимо делать больше, участие сообщества и прозрачность на всех уровнях, от данных до контроля за безопасностью, играют ключевую роль в дальнейшем развитии.

Нурлан Бекмуратов 1122 Views
Искусственный интеллект. Фото - Pexels

Об этом сообщает «КТРК» со ссылкой на HackerNoon 

OpenAI анонсировала запуск GPT-OSS, новой линейки языковых моделей с открытыми весами, которые можно запускать на стандартных устройствах. Это значительное отступление от традиционной закрытости компании в вопросах доступа к моделям, но вызывает ли это настоящее улучшение в области открытости? На фоне революционного шага остаются вопросы о том, что же на самом деле означает «открытость» в данном контексте.

Модели GPT-OSS призваны стать более доступными для широкой аудитории разработчиков и исследователей, поскольку они требуют меньших вычислительных мощностей и могут работать на стандартных персональных устройствах. Эта открытость предполагает возможность для локальной установки моделей, что дает новые возможности для использования в малых компаниях и стартапах. Однако, несмотря на это, важно понять, насколько глубоко компания готова раскрыть механизмы работы модели.

Открытые веса, но не все данные: что остается скрытым

Открытость модели GPT-OSS предполагает доступ к весам, что позволяет разработчикам и исследователям внедрять ее в собственные проекты. Однако ключевые аспекты, такие как данные для обучения и точные шаги тонкой настройки, остаются недоступными. Это поднимает важный вопрос: можно ли считать такой подход настоящим открытым исходным кодом?

Многие считают, что только предоставление полных данных и документации о процессе обучения может обеспечить истинную прозрачность. Без этих элементов становится сложно понимать, как модель работает в разных сценариях и что именно стоит за ее выводами. Открытие только весов не дает полного контроля над процессом и не позволяет в полной мере проверять результаты работы модели.

Потенциал локального развертывания и его ограничения

Возможность запускать модель GPT-OSS локально, на персональных устройствах, открывает новые горизонты для использования ИИ в малых и средних предприятиях. Традиционно такие модели требовали мощных серверных мощностей и облачных вычислений, что повышало затраты и риски утечек данных. Локальная установка моделей снижает эти барьеры, однако это также создаёт новые риски: изменения безопасности могут быть легко произведены пользователями.

Кроме того, использование таких моделей в критически важных системах без полного контроля над их поведением и защитой может привести к непредсказуемым последствиям. Таким образом, несмотря на преимущества, локальное развертывание также имеет свои ограничения.

Технологический шаг или маркетинговый ход?

Запуск GPT-OSS можно рассматривать как шаг в ответ на растущую конкуренцию со стороны других открытых моделей, таких как LLaMA от Meta. Однако, несмотря на значительное улучшение в доступности ИИ, это не совсем соответствует философии полного открытого исходного кода. Отсутствие открытых данных и реального вовлечения сообщества оставляют много вопросов относительно настоящей открытости этих моделей.

Напомним, ранее мы писали о том, почему ваши запросы к GPT-5 не дают нужных результатов.

Поделиться