Максим Волков
Expert reviewer8+ years of experience

Максим Волков

Эксперт по ИИ-технологиям и генеративным моделям Picoria

AI-инженер и prompt engineering lead Picoria. Восемь лет работает с ML-моделями: от классического компьютерного зрения до современных диффузионных пайплайнов.

Карьеру начал в команде Yandex Cloud, где строил inference-инфраструктуру для генеративных моделей. На нём были GPU-инстансы, очереди задач и мониторинг латентности. В 2021 году ушёл консультировать AI-стартапы по портретной генерации, где отстраивал процессы валидации промптов и тестирования fine-tuned моделей.

В Picoria отвечает за технический стек генерации. Под задачу подбирает модель: быстрые стили или IDENTITY-lock, портрет или сцена. Гоняет промпты через многоуровневые eval-пайплайны, ловит артефакты, следит за идентичностью лица. Внутренние гайды по prompt engineering тоже на нём - редакторы потом опираются на них, когда готовят статьи в блог.

Areas of expertise

  • AI-инженер
  • prompt engineering lead

Previous experience

  • Независимое консультирование AI-стартапов - ML-консультант по портретной генерации · 2021-2024
  • Yandex Cloud - Senior ML Engineer, инфраструктура генеративных моделей · 2018-2021
  • Tinkoff Data Science - Data Scientist, computer vision · 2016-2018

Education and qualifications

  • Московский физико-технический институт (МФТИ) - Магистр прикладной математики и физики · 2016
  • Школа анализа данных Яндекса - Машинное обучение · 2017

Favorite films

  • Из машины2014 · Алекс Гарленд

    Лучший фильм про то, как мы недооцениваем диалог с моделью

  • Бегущий по лезвию 20492017 · Дени Вильнёв

    Эстетика портретной генерации, к которой стоит стремиться

  • Прибытие2016 · Дени Вильнёв

    Про то, что качество модели = качество входного языка

Favorite books

  • Deep LearningИэн Гудфеллоу, Йошуа Бенжио, Аарон Курвилль

    Для базы. На неё ссылаюсь, когда объясняю, что такое нормализация

  • Code: The Hidden Language of Computer Hardware and SoftwareЧарльз Петцольд

    Чтобы помнить, что под слоем модели - всё ещё инженерия

  • АнтихрупкостьНассим Талеб

    Применяю как фреймворк к eval-пайплайнам и проде

Verified profiles

Published articles (0)

This author has no published articles yet.

Author replies (3)

In reply to · Илья

Никита, флюкс хорош, но у него своя проблема - он слишком часто даёт глянцевую кожу, как из журнала. Для реалистичного бытового портрета SDXL с правильным лора-миксом пока выигрывает. По nanobanana 2 - там вообще другая архитектура, сравнивать некорректно.

Главный признак реалистичного кадра - не «как у фотографа», а отсутствие технических артефактов на ключевых зонах: глаза, рот, кисти рук. Через год работы с проды я выработал простую проверку: сначала смотрю на pupil reflection (он должен быть несимметричным между глазами), потом на форму ногтей. Если эти две зоны проходят, остальное обычно тоже на уровне.

In reply to · Алина

По таблице с блоками - удобно что всё в одном месте, распечатала и повесила рядом с ноутбуком. Только русские подписи к колонкам были бы логичнее (ОДЕЖДА на русском, остальное на англ - выбивается). Мелочь, но глаз цепляется.

По нашим тестам, чисто русский промпт уступает английскому в среднем на 15-25% по итоговому качеству. Причина простая: модели учатся на огромных англоязычных корпусах с описанием фотосъёмки. Поэтому мы советуем писать сцену по-русски (это удобнее), а технические термины (lighting, lens, film stock) держать в английском - получается без потерь.

In reply to · Вера

Шаг с обновлением референса раз в 6 месяцев - реально важный, я на этом спалилась. Загрузила фото двухлетней давности, когда ещё была блондинкой, и получила портрет хорошего человека, но не совсем себя. Переделала на свежем кадре, всё встало на места. Спасибо за таблицу с типами исходников, сохранила на будущее.

Чтобы лицо «осталось своим», мы в Picoria используем identity-lock с весом не выше 0.85. Если поднимать ближе к 1.0, нейросеть начинает дословно копировать референсный кадр и теряет вариативность. Если опускать ниже 0.65, лицо «уплывает». Та же логика про источник: 5-7 фото с разных ракурсов дают стабильнее результат, чем 30 однотипных селфи.