Согласно The Information, Google предоставил небольшой группе доступ к тестовой версии Gemini AI , сигнализируя о скором публичном выпуске.
Сможет ли Google конкурировать с GPT-4, учитывая большие объемы данных Google?
Вот все, что мы знаем на данный момент:
- Gemini был создан с нуля как мультимодальный, то есть он может обрабатывать и понимать как текст, так и изображения.
- Сундар Пичаи , генеральный директор Google, недавно отметил: «Хотя это еще рано, мы уже видим впечатляющие мультимодальные возможности, которых не было в предыдущих моделях».
- Анонимный источник, связанный с продуктом, заявил, что Gemini сможет генерировать текст и контекстные изображения и будет обучаться на расшифровках видео YouTube (согласно Android Police).
- Gemini будет доступен в различных размерах и возможностях, как и PaLM 2 .
- Gemini будет «объединять некоторые сильные стороны систем типа AlphaGo с удивительными языковыми возможностями больших моделей».
Способность Gemini генерировать текст и изображения дает ему серьезное преимущество перед GPT-4 (на данный момент). Однако определяющим преимуществом между ними является безумное количество собственных обучающих данных Google.
Google Gemini может обрабатывать данные, полученные от всех сервисов, в том числе:
- Поиск Гугл
- YouTube
- Гугл Книги
- Google Scholar
В безумии LLM победитель, скорее всего, получит доступ к самому большому и богатому набору обучающих данных.