Notebookcheck Logo

IBM запускает модели ИИ с открытым исходным кодом Granite 3.0 для предприятий

Модели ИИ с открытым исходным кодом IBM Granite 3.0 для предприятий уже доступны (Источник изображения: IBM)
Модели ИИ с открытым исходным кодом IBM Granite 3.0 для предприятий уже доступны (Источник изображения: IBM)
Семейство моделей ИИ IBM Granite 3.0, распространяемое на условиях лицензии Apache 2.0, ориентировано на корпоративных клиентов и обеспечивает высочайшую производительность наряду с (как утверждается) наиболее полным набором возможностей обнаружения рисков и вреда на рынке. Желающие могут загрузить модели с сайта Hugging Face.

Ранее сегодня компания IBM представила свое самое продвинутое на сегодняшний день семейство моделей искусственного интеллекта, доведя номер версии Granite до 3.0. Еще в сентябре 2023 года IBM представила базовые модели Granite на сайте https://www.ibm.com/blog/building-ai-for-business-ibms-granite-foundation-models/и теперь они переводят семейство на модель с открытым исходным кодом, одновременно улучшая все остальные аспекты. На все модели Granite 3.0 (о которых будет сказано позже) распространяются условия лицензии Apache 2.0, что позволяет использовать их как корпоративным клиентам, так и сообществу в целом.

Три ветви Granite 3.0 и члены каждой из них таковы:

  • Общее назначение/Язык: Granite 3.0 8B Instruct, Granite 3.0 2B Instruct, Granite 3.0 8B Base, Granite 3.0 2B Base
  • Ограждения и безопасность: Granite Guardian 3.0 8B, Granite Guardian 3.0 2B
  • Смесь экспертов: Granite 3.0 3B-A800M Instruct, Granite 3.0 1B-A400M Instruct, Granite 3.0 3B-A800M Base, Granite 3.0 1B-A400M Base

В отличие от своих конкурентов, которые обучаются на открытых данных, модели Granite от IBM используют корпоративные данные и могут быть легко интегрированы в различные рабочие процессы и бизнес-среды, что позволяет сократить расходы в 23 раза по сравнению с большими пограничными моделями. По данным IBM, в процессе обучения этих новых моделей было использовано более 12 триллионов лексем на данных, взятых из 12 различных естественных языков и 116 различных языков программирования.

Одной из главных особенностей семейства является Guardian 3.0, которая поставляется с лучшей на рынке функцией обнаружения риска и вреда, учитывающей обоснованность, релевантность контекста и релевантность ответа в дополнение к уже распространенным признакам, таким как социальная предвзятость, ненависть, токсичность, сквернословие, насилие, побег из тюрьмы и так далее.

Те, кто хочет начать работу с Granite 3.0 от IBM (или перейти к новым частям кода), могут зайти на сайт Hugging Face и взять их. В то время как некоторые модели будут интегрированы в микросервисы NIM от Nvidia и Google Cloud Vertex AI Model Garden вместе с Hugging Face, инструктивные варианты новых языковых моделей Granite 3.0 8B и 2B и модели Granite Guardian 3.0 8B и 2B доступны для коммерческого использования через IBM watsonx платформа.

В конце августа Клиффорд А. Пиковер опубликовал книгу " Искусственный интеллект: Иллюстрированная история: От средневековых роботов до нейронных сетей" - книгу, которую теперь можно приобрести за $8,99 в формате Kindle и за $17,26 в мягкой обложке.

IBM представляет Granite 3.0: Высокопроизводительные модели ИИ, созданные для бизнеса

- Новые модели Granite 3.0 8B и 2B, выпущенные под разрешительной лицензией Apache 2.0, демонстрируют высокую производительность во многих академических и корпоративных бенчмарках и способны превзойти или сравниться с моделями аналогичного размера

- Новые модели Granite Guardian 3.0 предоставляют наиболее полные возможности IBM по защите от несанкционированного доступа для развития безопасного и надежного ИИ

- Новые модели Granite 3.0 Mixture-of-Experts обеспечивают чрезвычайно эффективные выводы и низкую задержку, подходящие для развертывания на базе центрального процессора и пограничных вычислений

- Новая модель Granite Time Series достигла наивысшей производительности в прогнозировании с нулевым/несколькими выстрелами, превзойдя модели в 10 раз большего размера

- IBM представляет следующее поколение помощника watsonx Code Assistant для кодирования общего назначения на базе Granite; демонстрирует новые инструменты в watsonx.ai для создания и развертывания приложений и агентов искусственного интеллекта

- Объявлено, что Granite станет моделью по умолчанию для Consulting Advantage, платформы предоставления услуг на базе ИИ, которую используют 160 000 консультантов IBM, чтобы быстрее предлагать клиентам новые решения

АРМОНК, штат Нью-Йорк, 21 октября 2024 г. /PRNewswire/ -- Сегодня на конференции IBM (NYSE: IBM) на ежегодном мероприятии TechXchange компания объявила о выпуске своего самого передового на сегодняшний день семейства моделей искусственного интеллекта, Granite 3.0. Флагманские языковые модели третьего поколения Granite от IBM могут превзойти или сравниться с аналогичными моделями от ведущих поставщиков моделей по многим академическим и отраслевым показателям, демонстрируя высокую производительность, прозрачность и безопасность.

В соответствии с приверженностью компании к открытому ИИ, модели Granite выпускаются под разрешительной лицензией Apache 2.0, что делает их уникальными по сочетанию производительности, гибкости и автономности, которые они предоставляют корпоративным клиентам и сообществу в целом.

Семейство Granite 3.0 от IBM включает в себя:

  • Общее назначение/Язык: Granite 3.0 8B Instruct, Granite 3.0 2B Instruct, Granite 3.0 8B Base, Granite 3.0 2B Base
  • Ограждения и безопасность: Granite Guardian 3.0 8B, Granite Guardian 3.0 2B
  • Смесь экспертов: Granite 3.0 3B-A800M Instruct, Granite 3.0 1B-A400M Instruct, Granite 3.0 3B-A800M Base, Granite 3.0 1B-A400M Base

Новые языковые модели Granite 3.0 8B и 2B разработаны как "рабочие лошадки" для корпоративного ИИ, обеспечивая высокую производительность при решении таких задач, как поиск с расширенной генерацией (RAG), классификация, обобщение, извлечение сущностей и использование инструментов. Эти компактные, универсальные модели предназначены для тонкой настройки с помощью корпоративных данных и легкой интеграции в различные бизнес-среды или рабочие процессы.

В то время как многие большие языковые модели (LLM) обучаются на общедоступных данных, подавляющее большинство корпоративных данных остается неиспользованным. Объединив небольшую модель Granite с корпоративными данными, особенно используя революционную технику выравнивания InstructLab - представленной IBM и RedHat в мае, - компания IBM считает, что предприятия могут достичь производительности, соответствующей конкретной задаче, которая конкурирует с большими моделями, при меньших затратах (на основе наблюдаемого диапазона в 3x-23x меньших затрат по сравнению с большими пограничными моделями в нескольких ранних доказательствах концепции1).

Выпуск Granite 3.0 подтверждает стремление IBM обеспечить прозрачность, безопасность и доверие к продуктам ИИ. На сайте Технический отчет Granite 3.0 и руководство по ответственному использованию содержат описание наборов данных, использованных для обучения этих моделей, подробную информацию о применяемых этапах фильтрации, очистки и курирования, а также исчерпывающие результаты работы моделей в основных академических и корпоративных бенчмарках.

Очень важно, что IBM предоставляет гарантию защиты интеллектуальной собственности на все модели Granite на watsonx.ai, поэтому корпоративные клиенты могут быть более уверены в объединении своих данных с моделями.

Повышение планки: Контрольные показатели Granite 3.0

Языковые модели Granite 3.0 также демонстрируют многообещающие результаты в плане сырой производительности.

В стандартных академических бенчмарках, определенных Hugging Face's OpenLLM Leaderboard, общая производительность модели Granite 3.0 8B Instruct в среднем опережает передовые показатели аналогичных моделей с открытым исходным кодом от Meta и Mistral. В современном эталоне безопасности AttaQ от IBM модель Granite 3.0 8B Instruct лидирует по всем измеренным параметрам безопасности по сравнению с моделями от Meta и Mistral.2

В основных корпоративных задачах RAG, использовании инструментов и задачах в области кибербезопасности модель Granite 3.0 8B Instruct демонстрирует лучшие показатели в среднем по сравнению с аналогичными моделями с открытым исходным кодом от Mistral и Meta.3

Модели Granite 3.0 были обучены на более чем 12 триллионах лексем на данных, взятых из 12 различных естественных языков и 116 различных языков программирования, с использованием нового двухэтапного метода обучения, опирающегося на результаты нескольких тысяч экспериментов, направленных на оптимизацию качества данных, их отбора и параметров обучения. Ожидается, что к концу года в языковые модели 3.0 8B и 2B будет включена поддержка расширенного контекстного окна 128K и возможности мультимодального понимания документов.

Демонстрируя отличное соотношение производительности и стоимости вычислений, IBM предлагает свои модели архитектуры Granite Mixture of Experts (MoE) Architecture, Granite 3.0 1B-A400M и Granite 3.0 3B-A800M, как более компактные и легкие модели, которые могут быть развернуты в приложениях с низкой задержкой, а также в приложениях на базе центрального процессора.

IBM также анонсирует обновленный выпуск предварительно обученных моделей Granite Time Series, первые версии которых были выпущены в начале этого года. Эти новые модели обучены на в 3 раза большем объеме данных и демонстрируют высокую производительность во всех трех основных бенчмарках временных рядов, превосходя в 10 раз более крупные модели от Google, Alibaba и других компаний. Обновленные модели также обеспечивают большую гибкость моделирования благодаря поддержке внешних переменных и скользящих прогнозов.4

Представляем Granite Guardian 3.0: начало следующей эры ответственного ИИ

В этом выпуске IBM также представляет новое семейство моделей Granite Guardian, которые позволяют разработчикам приложений реализовать защитные механизмы, проверяя пользовательские подсказки и ответы LLM на наличие различных рисков. Модели Granite Guardian 3.0 8B и 2B предоставляют наиболее полный набор возможностей обнаружения рисков и вреда, доступных на рынке сегодня.

В дополнение к таким аспектам вреда, как социальная предвзятость, ненависть, токсичность, сквернословие, насилие, побег из тюрьмы и т.д., эти модели также предоставляют ряд уникальных проверок, специфичных для RAG, таких как обоснованность, соответствие контексту и релевантность ответа. В ходе всестороннего тестирования по 19 контрольным показателям безопасности и RAG модель Granite Guardian 3.0 8B показала более высокую общую точность обнаружения вреда в среднем, чем все три поколения моделей Llama Guard от Meta. Она также показала равную общую производительность в обнаружении галлюцинаций в среднем со специализированными моделями обнаружения галлюцинаций WeCheck и MiniCheck.5

Хотя модели Granite Guardian получены на основе соответствующих языковых моделей Granite, их можно использовать для реализации защитных механизмов наряду с любыми открытыми или проприетарными моделями ИИ.

Доступность моделей Granite 3.0

Весь набор моделей Granite 3.0 и обновленные модели временных рядов доступны для загрузки на HuggingFace под разрешительной лицензией Apache 2.0. Инструктивные варианты новых языковых моделей Granite 3.0 8B и 2B и модели Granite Guardian 3.0 8B и 2B уже сегодня доступны для коммерческого использования на платформе watsonx от IBM. Некоторые из моделей Granite 3.0 также будут доступны в виде микросервисов NVIDIA NIM и через интеграцию Vertex AI Model Garden с HuggingFace в Google Cloud.

Чтобы предоставить разработчикам выбор и простоту использования, а также поддержать локальные, пограничные развертывания, набор моделей Granite 3.0 также доступен на Ollama и Replicate.

Последнее поколение моделей Granite расширяет обширный каталог мощных LLM с открытым исходным кодом от IBM. IBM сотрудничает с партнерами по экосистеме такими как AWS, Docker, Domo, Qualcomm Technologies, Inc. через свой Qualcomm® AI Hub, Salesforce, SAPи другие, чтобы интегрировать различные модели Granite в предложения этих партнеров или сделать модели Granite доступными на их платформах, предлагая предприятиям по всему миру больший выбор.

От помощников к агентам: реализация будущего корпоративного ИИ

IBM развивает корпоративный ИИ с помощью целого спектра технологий - от моделей и ассистентов до инструментов, необходимых для настройки и развертывания ИИ специально для уникальных данных и случаев использования компаниями. IBM также прокладывает путь для будущих агентов ИИ, которые смогут самостоятельно управлять, размышлять и выполнять сложные задачи в динамичной бизнес-среде.

IBM продолжает развивать свой портфель технологий ИИ-ассистентов - от watsonx Orchestrate, помогающего компаниям создавать собственных ассистентов с помощью инструментов и автоматизации, не требующих большого количества кода, до широкого набора готовых ассистентов для конкретных задач и сфер деятельности, таких как обслуживание клиентов, управление персоналом, продажи и маркетинг. Организации по всему миру используют watsonx Assistant для создания ИИ-помощников для таких задач, как ответы на рутинные вопросы клиентов или сотрудников, модернизация мэйнфреймов и устаревших ИТ-приложений, помощь студентам в изучении потенциальных карьерных перспектив или цифровая поддержка покупателей жилья в ипотеке.

Сегодня IBM также представила предстоящий выпуск следующего поколения watsonx Code Assistantоснованного на моделях кода Granite и предлагающего помощь в кодировании общего назначения на таких языках, как C, C++, Go, Java и Python, с расширенными возможностями модернизации приложений для Enterprise Java Applications.6 Возможности кода Granite теперь доступны и через расширение Visual Studio Code, IBM Granite.Code.

IBM также планирует выпустить новые инструменты, которые помогут разработчикам создавать, настраивать и внедрять ИИ более эффективно через watsonx.ai - включая агентские фреймворки, интеграции с существующими средами и автоматизацию с низким кодом для таких распространенных случаев использования, как RAG и агенты.7

IBM сосредоточилась на разработке технологий агентов ИИ, способных к большей автономии, сложным рассуждениям и многоэтапному решению проблем. В первоначальном выпуске модели Granite 3.0 8B реализована поддержка ключевых агентских возможностей, таких как расширенные рассуждения и высокоструктурированный шаблон чата и стиль подсказок для реализации рабочих процессов использования инструментов. IBM также планирует внедрить новую функцию чата с ИИ-агентами в IBM watsonx Orchestrate, которая использует агентские возможности для организации работы ИИ-помощников, навыков и автоматизаций, помогающих пользователям повысить производительность в своих командах.8 IBM планирует продолжить создание агентских возможностей в своем портфолио в 2025 году, включая предварительно созданные агенты для конкретных доменов и случаев использования.

Расширенная платформа доставки на базе ИИ для повышения квалификации консультантов IBM с помощью ИИ

IBM также анонсирует о значительном расширении своей платформы предоставления услуг с использованием искусственного интеллекта, IBM Consulting Advantage. Многомодельная платформа содержит агентов, приложения и методы искусственного интеллекта, а также повторяющиеся схемы, которые позволят 160 000 консультантов IBM лучше и быстрее предоставлять услуги клиентам по более низкой цене.

В рамках расширения языковые модели Granite 3.0 станут моделями по умолчанию в Consulting Advantage. Используя производительность и эффективность Granite, IBM Consulting сможет помочь максимизировать отдачу от инвестиций в проекты генеративного ИИ для клиентов IBM.

Другой ключевой частью расширения является внедрение IBM Consulting Advantage for Cloud Transformation and Management и IBM Consulting Advantage for Business Operations. Каждый из них включает в себя агенты, приложения и методы искусственного интеллекта, ориентированные на конкретные области, и обогащенные лучшими практиками IBM, чтобы консультанты IBM могли помочь ускорить облачные и искусственные преобразования клиентов в таких задачах, как модернизация кода и разработка качественных решений, или преобразовать и выполнить операции в таких областях, как финансы, управление персоналом и закупки.

Чтобы узнать больше о компании Granite и стратегии IBM "ИИ для бизнеса", посетите сайт www.ibm.com/granite.

1 Расчеты затрат основаны на стоимости API на миллион токенов, установленной в IBM watsonx для открытых моделей и openAI для моделей GPT4 (предполагается, что смесь из 80% входящих и 20% исходящих данных) для доказательств концепции клиентов.
2 Технический документ IBM Research: Языковые модели Granite 3.0
3 Технический документ IBM Research: Языковые модели Granite 3.0
4 Tiny Time Mixer: Быстрые предварительно обученные модели для улучшенного прогнозирования нулевых/малых шансов на многомерных временных рядах
5 Результаты оценки опубликованы в Granite Guardian GitHub Repo
6 Планируемая доступность на 4 квартал 2024 г.
7 Планируемая доступность на 4 квартал 2024 г.
8 Планируемая доступность на 1 квартал 2025 г

Этот важный материал точно понравится твоим друзьям в социальных сетях!
'
> Обзоры Ноутбуков, Смартфонов, Планшетов. Тесты и Новости > Новости > Архив новостей > Архив новостей за 2024 год, 10 месяц > IBM запускает модели ИИ с открытым исходным кодом Granite 3.0 для предприятий
Codrut Nistor, 2024-10-22 (Update: 2024-10-22)