Загрузите модели ИИ с помощью API фоновой выборки

Опубликовано: 20 февраля 2025 г.

Надежная загрузка больших моделей ИИ — непростая задача. Если пользователи теряют подключение к Интернету или закрывают ваш веб-сайт или веб-приложение, они теряют частично загруженные файлы модели и им придется начинать все заново при возвращении на вашу страницу. Используя API фоновой выборки в качестве постепенного усовершенствования, вы можете значительно улучшить взаимодействие с пользователем.

Browser Support

  • Хром: 74.
  • Край: 79.
  • Firefox: не поддерживается.
  • Сафари: не поддерживается.

Source

Зарегистрируйте сервисного работника

API фоновой выборки требует, чтобы ваше приложение зарегистрировало сервисного работника .

if ('serviceWorker' in navigator) {
  window.addEventListener('load', async () => {
    const registration = await navigator.serviceWorker.register('sw.js');
    console.log('Service worker registered for scope', registration.scope);
  });
}

Запустить фоновую выборку

По мере загрузки браузер отображает прогресс для пользователя и дает ему возможность отменить загрузку. После завершения загрузки браузер запускает сервис-воркера, и приложение может принять меры в ответ.

API фоновой выборки может даже подготовить выборку к запуску в автономном режиме. Как только пользователь повторно подключается, начинается загрузка. Если пользователь отключается от сети, процесс приостанавливается, пока пользователь снова не подключится к сети.

В следующем примере пользователь нажимает кнопку, чтобы загрузить Gemma 2B. Прежде чем выполнить выборку, мы проверяем, была ли модель ранее загружена и кэширована, чтобы не использовать ненужные ресурсы. Если он не кэширован, мы запускаем фоновую выборку.

const FETCH_ID = 'gemma-2b';
const MODEL_URL =
  'https://storage.googleapis.com/jmstore/kaggleweb/grader/g-2b-it-gpu-int4.bin';

downloadButton.addEventListener('click', async (event) => {
  // If the model is already downloaded, return it from the cache.
  const modelAlreadyDownloaded = await caches.match(MODEL_URL);
  if (modelAlreadyDownloaded) {
    const modelBlob = await modelAlreadyDownloaded.blob();
    // Do something with the model.
    console.log(modelBlob);
    return;
  }

  // The model still needs to be downloaded.
  // Feature detection and fallback to classic `fetch()`.
  if (!('BackgroundFetchManager' in self)) {
    try {
      const response = await fetch(MODEL_URL);
      if (!response.ok || response.status !== 200) {
        throw new Error(`Download failed ${MODEL_URL}`);
      }
      const modelBlob = await response.blob();
      // Do something with the model.
      console.log(modelBlob);
      return;
    } catch (err) {
      console.error(err);
    }
  }

  // The service worker registration.
  const registration = await navigator.serviceWorker.ready;

  // Check if there's already a background fetch running for the `FETCH_ID`.
  let bgFetch = await registration.backgroundFetch.get(FETCH_ID);

  // If not, start a background fetch.
  if (!bgFetch) {
    bgFetch = await registration.backgroundFetch.fetch(FETCH_ID, MODEL_URL, {
      title: 'Gemma 2B model',
      icons: [
        {
          src: 'icon.png',
          size: '128x128',
          type: 'image/png',
        },
      ],
      downloadTotal: await getResourceSize(MODEL_URL),
    });
  }
});

Функция getResourceSize() возвращает размер загрузки в байтах. Реализовать это можно, сделав запрос HEAD .

const getResourceSize = async (url) => {
  try {
    const response = await fetch(url, { method: 'HEAD' });
    if (response.ok) {
      return response.headers.get('Content-Length');
    }
    console.error(`HTTP error: ${response.status}`);
    return 0;
  } catch (error) {
    console.error('Error fetching content size:', error);
    return 0;
  }
};

Отчет о ходе загрузки

Как только начинается фоновая выборка, браузер возвращает BackgroundFetchRegistration . Вы можете использовать это, чтобы информировать пользователя о ходе загрузки с помощью события progress .

bgFetch.addEventListener('progress', (e) => {
  // There's no download progress yet.
  if (!bgFetch.downloadTotal) {
    return;
  }
  // Something went wrong.
  if (bgFetch.failureReason) {
    console.error(bgFetch.failureReason);
  }
  if (bgFetch.result === 'success') {
    return;
  }
  // Update the user about progress.
  console.log(`${bgFetch.downloaded} / ${bgFetch.downloadTotal}`);
});

Уведомить пользователей и клиента о завершении выборки

Когда фоновая выборка завершается успешно, сервис-воркер вашего приложения получает событие backgroundfetchsuccess .

Следующий код включен в сервис-воркер. Вызов updateUI() в конце позволяет обновить интерфейс браузера, чтобы уведомить пользователя об успешной фоновой выборке. Наконец, сообщите клиенту об окончании загрузки, например, с помощью postMessage() .

self.addEventListener('backgroundfetchsuccess', (event) => {
  // Get the background fetch registration.
  const bgFetch = event.registration;

  event.waitUntil(
    (async () => {
      // Open a cache named 'downloads'.
      const cache = await caches.open('downloads');
      // Go over all records in the background fetch registration.
      // (In the running example, there's just one record, but this way
      // the code is future-proof.)
      const records = await bgFetch.matchAll();
      // Wait for the response(s) to be ready, then cache it/them.
      const promises = records.map(async (record) => {
        const response = await record.responseReady;
        await cache.put(record.request, response);
      });
      await Promise.all(promises);

      // Update the browser UI.
      event.updateUI({ title: 'Model downloaded' });

      // Inform the clients that the model was downloaded.
      self.clients.matchAll().then((clientList) => {
        for (const client of clientList) {
          client.postMessage({
            message: 'download-complete',
            id: bgFetch.id,
          });
        }
      });
    })(),
  );
});

Получать сообщения от сервисного работника

Чтобы получить отправленное сообщение об успешном завершении загрузки на клиенте, прослушайте события message . Получив сообщение от сервис-воркера, вы можете работать с моделью ИИ и сохранять ее с помощью Cache API .

navigator.serviceWorker.addEventListener('message', async (event) => {
  const cache = await caches.open('downloads');
  const keys = await cache.keys();
  for (const key of keys) {
    const modelBlob = await cache
      .match(key)
      .then((response) => response.blob());
    // Do something with the model.
    console.log(modelBlob);
  }
});

Отменить фоновую выборку

Чтобы позволить пользователю отменить текущую загрузку, используйте метод abort() BackgroundFetchRegistration .

const registration = await navigator.serviceWorker.ready;
const bgFetch = await registration.backgroundFetch.get(FETCH_ID);
if (!bgFetch) {
  return;
}
await bgFetch.abort();

Кэшировать модель

Кэшируйте загруженные модели , чтобы ваши пользователи загружали модель только один раз. Хотя API фоновой выборки улучшает процесс загрузки, вы всегда должны стремиться использовать минимально возможную модель в ИИ на стороне клиента.

Вместе эти API помогут вам улучшить работу ИИ на стороне клиента для ваших пользователей.

Демо

Полную реализацию этого подхода вы можете увидеть в демо и его исходном коде .

Панель приложений Chrome DevTools открыта для загрузки фоновой выборки.
С помощью Chrome DevTools вы можете просмотреть события, связанные с текущей фоновой выборкой. Демо-версия показывает текущую загрузку объемом 17,54 МБ, общий объем - 1,26 ГБ. Индикатор загрузки браузера также показывает текущую загрузку.

Благодарности

Рецензентами этого руководства выступили Франсуа Бофор , Андре Бандарра , Себастьян Бенц , Мод Нальпас и Александра Клеппер .