Google представляет Gemini 1.0 , самую функциональную и общую модель искусственного интеллекта на данный момент. Изначально созданный для мультимодального использования, это первый шаг в эпоху моделей Близнецов.
Gemini оптимизирован в трех размерах: Ultra, Pro и Nano. Производительность Gemini Ultra превышает текущие результаты по 30 из 32 широко используемых академических тестов. Более того, с результатом 90,0% Gemini Ultra является первой моделью, превзошедшей экспертов-людей по MMLU.
Размеры Близнецов
Gemini, разработанный командой Google по искусственному интеллекту, представляет собой их самую универсальную модель искусственного интеллекта. Кроме того, он способен эффективно работать на различных платформах, от центров обработки данных до мобильных устройств. Эта продвинутая модель призвана изменить подход разработчиков и бизнес-пользователей к использованию ИИ для различных приложений. Первая итерация, Gemini 1.0, была разделена на три отдельные версии:
- Gemini Ultra : эта версия является самой крупной и совершенной, предназначенной для простого выполнения сложных задач.
- Gemini Pro : оптимизированный для универсальности, он превосходно справляется с широким спектром задач.
- Gemini Nano : специально созданная для повышения эффективности, эта модель идеально подходит для задач, которые необходимо выполнять непосредственно на устройствах.
Текстовые возможности
Возможность | Контрольный показатель | Описание | Близнецы Ультра | Числа API GPT-4V рассчитаны там, где заявленные числа отсутствовали. |
---|---|---|---|---|
Общий | ММЛУ | Представление вопросов по 57 предметам (в т.ч. STEM, гуманитарные науки и др.) | 90,0%CoT@32* | 86,4%5-шот* (по данным) |
Рассуждение | Биг-Бенч Хард | Разнообразный набор сложных задач, требующих многоэтапного рассуждения. | 83,6%3-шот | 83,1%3-шот (API) |
УРОНИТЬ | Понимание прочитанного (оценка F1) | 82.4Вариативные удары | 80,93 выстрела (сообщается) | |
HellaSwag | Здравый смысл для решения повседневных задач | 87,8%10 выстрелов* | 95,3%10 выстрелов* (по данным) | |
Математика | GSM8K | Основные арифметические манипуляции (включая математические задачи в начальной школе) | 94,4%maj1@32 | 92,0% ЦТ с 5 выстрелами (сообщается) |
МАТЕМАТИКА | Сложные математические задачи (включая алгебру, геометрию, предварительное исчисление и другие) | 53,2%4-шот | 52,9%4-шот (API) | |
Код | HumanEval | Генерация кода Python | 74,4%0-бросков (IT)* | 67,0%0 ударов* (сообщено) |
Natural2Code | Генерация кода Python. Новый доступный набор данных, похожий на HumanEval, в сеть не просочился. | 74,9%0-шот | 73,9%0 выстрелов (API) |
*Подробную информацию о производительности при использовании других методологий см. в техническом отчете.
Более подробную информацию смотрите в техническом отчете Gemini .
Сложные рассуждения
Более того, Gemini 1.0, обладающий развитыми навыками мультимодального мышления, способен интерпретировать и осмысливать сложные письменные и визуальные данные. Этот атрибут делает его исключительно способным извлекать ценную информацию из огромных наборов данных, что часто является сложной задачей из-за огромного объема информации.
Исключительное мастерство модели в анализе, фильтрации и понимании информации из сотен тысяч документов делает ее ключевым инструментом для достижения быстрого прогресса в различных областях, от научных исследований до финансового анализа. Эта возможность быстро извлекать значимую информацию из обширных данных обещает ускорить инновации и открытия во многих областях.
Вы также сможете интегрировать модели Gemini в свои приложения с помощью Google AI Studio и Google Cloud Vertex AI. Доступно с 13 декабря.