Сегодня 22 июня 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Android-приложения получат доступ к ИИ-модели Gemini Nano, которая работает прямо на смартфоне

Быстрое развитие генеративного искусственного интеллекта радикально изменило продукты технологических гигантов. Большинство новых функций обрабатываются на удалённых серверах, поскольку мобильные устройства располагают весьма ограниченными вычислительными ресурсами. Однако Google готова предоставить разработчикам возможность обращаться и к локальному ИИ — то есть работающему прямо на устройстве.

Google без громких анонсов опубликовала документацию о новых расширенных возможностях ИИ, которыми могут воспользоваться разработчики: в обновлённом ML Kit SDK появилась поддержка API для функций генеративного ИИ на основе локальной языковой модели Gemini Nano. Она построена на платформе AI Core, как и экспериментальный комплект Edge AI SDK, но предполагает подключение к существующей модели с заданным набором функций, которые разработчики смогут легко реализовать.

 Здесь и далее источник изображений: Google

Здесь и далее источник изображений: Google

С ML Kit в приложениях появятся такие функции, как подготовка сводок текста, редактирование, переформулирование, а также описание изображений — всё это без отправки данных в облако. Однако по своим возможностям локальная модель Gemini Nano значительно уступает облачным, поэтому придётся мириться с некоторыми, порой существенными, ограничениями. Например, текстовые сводки могут содержать не более трёх пунктов, а описания изображений доступны только на английском языке. Качество результатов также может различаться в зависимости от версии Gemini Nano, установленной на телефоне. Стандартная Gemini Nano XS занимает около 100 Мбайт, а Gemini Nano XXS, установленная, например, на смартфоне Google Pixel 9a, в четыре раза меньше, работает только с текстом и имеет гораздо меньшее контекстное окно.

Модель Gemini Nano уже используется на устройствах Pixel, а также на смартфонах OnePlus 13, Samsung Galaxy S25 и Xiaomi 15 — их число, вероятно, будет расти, как и количество приложений с функциями локального генеративного ИИ.

Документация для разработчиков уже доступна, и, как ожидается, компания подробнее расскажет об этом проекте на конференции Google I/O. Одна из сессий носит название: «Gemini Nano на Android: разработка с использованием генеративного ИИ на устройстве». До недавнего времени работа с локальным генеративным ИИ на мобильных устройствах была непростой задачей: экспериментальный Edge AI SDK открывает доступ к аппаратному ускорению (NPU) для запуска моделей, но работает только с устройствами серии Pixel 9 и ограничен исключительно текстом. Собственные API для запуска ИИ-нагрузок предлагают также Qualcomm и MediaTek, однако их возможности варьируются от устройства к устройству, что делает их использование в долгосрочных проектах рискованным. К тому же запуск собственной модели ИИ требует серьёзной подготовки, поэтому новые API значительно упростят и ускорят реализацию локального ИИ.

Несмотря на ограниченные возможности локальных моделей на мобильных устройствах, это яркий пример практической пользы ИИ. Большинство пользователей, скорее всего, предпочтут не передавать свои персональные данные на удалённые серверы. Есть и наглядные примеры: функция Google Pixel Screenshots обрабатывает снимки экрана непосредственно на смартфоне, как и сводки по уведомлениям на Motorola Razr Ultra формируются без использования облака — хотя базовая версия Razr всё же обращается к удалённым серверам. Появление API для подключения к Gemini Nano обеспечит некоторую унификацию подходов к мобильному ИИ, но панацеей эта инициатива не станет — многие смартфоны пока не обладают достаточной вычислительной мощностью для таких задач.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Китай ужесточит контроль над интернетом с помощью новой цифровой идентификации 4 ч.
Новая статья: Deltarune — сила в добре. Рецензия 10 ч.
20 минут геймплея The Blood of Dawnwalker — амбициозной вампирской RPG от ведущих разработчиков The Witcher 3 и Cyberpunk 2077 11 ч.
Новая статья: Gamesblender № 731: процессор AMD в следующей Xbox, анонс ремейка Silent Hill и худшая игра года 11 ч.
В драйвере ISA-звуковой карты Creative Sound Blaster AWE32 исправили ошибку, найденную 25 лет назад 11 ч.
Би-би-си угрожает Perplexity судом из-за нарушения авторских прав при обучении нейросетей 12 ч.
Китайская MiniMax представила ИИ-модель M1 — её обучение обошлось в 200 раз дешевле GPT-4 15 ч.
Акционеры обвинили Apple в обмане относительно сроков выхода обновлённого Siri на базе ИИ 20 ч.
«Крупнейшая утечка в истории» оказалась устаревшим сборником архивов паролей 23 ч.
Sega случайно раскрыла актуальные продажи последних Persona, Yakuza, Sonic и Total War, а Persona 4 Revival придётся подождать 24 ч.
OSZAR »