Математическое обеспечение задач адаптивного управления логистической инфраструктурой с применением технологий машинного обучения

Шульженко Александр Олегович

студент 3 курса,

Санкт-Петербургский государственный университет,

г. Санкт-Петербург, Россия

E-mail: shulzhenko2426@gmail.com

Научный руководитель – Парфёнов Александр Викторович

д.э.н., профессор кафедры логистики

и управления цепями поставок,

Санкт-Петербургский государственный экономический университет,

г. Санкт-Петербург, Россия

E-mail: parfonof@mail.ru

Mathematical support for adaptive logistics infrastructure management
tasks using machine learning technologies

Shulzhenko Alexander Olegovich

3d year student,

Saint-Petersburg State University

Saint-Petersburg, Russia

Scientific supervisor – Parfenov Alexander Victorovich

Doctor of Economics, professor of Logistics

and Supply Chain Management Department,

Saint-Petersburg State University of Economics

Saint-Petersburg, Russia

В статье представлен математический аппарат обоснования решений по адаптивному управлению логистической инфраструктурой, основанного на применении методов машинного обучения при определении параметров контейнеропотока. Особое внимание уделено этапу агрегирования данных при формировании регрессионных моделей, составляющих основу обучающих алгоритмов.

Ключевые слова: машинное обучение, логистическая инфраструктура, агрегирование данных, контейнеропоток, градиентный спуск, экстремум на многообразии

The article presents a mathematical framework for justifying decisions on adaptive management of logistics infrastructure, based on the use of machine learning methods in determining the parameters of container traffic. Special attention is paid to the stage of data aggregation in the formation of regression models that form the basis of learning algorithms.

Key words: machine learning, logistics infrastructure, data aggregation, container flow, gradient descent, an extremum on a manifold

Эффективное использование транзитного потенциала Российской Федерации определяется решением задач, нацеленных на повышение интенсивности и качественных характеристик транзитного грузопотока. Предпочтительной является ориентация на высокомаржинальные грузы, требующие выполнения операций с высокой добавленной стоимостью, основным технологическим решением для которых выступает использование контейнерных технологий доставки. В свою очередь, интенсивность контейнеропотока зависит от целого ряда факторов, ведущим из которых является уровень развития логистической инфраструктуры. Вместе с тем, экстенсивное развитие логистической инфраструктуры, нацеленное на наращивание логистических мощностей, всегда связано со значительными капиталовложениями, что определяет особую важность задач, связанных с поиском эффективных методов определения параметров логистической инфраструктуры и управления имеющимися мощностями.

Анализ литературы позволяет сделать вывод, что решению поставленной задачи соответствует концепция адаптивного управления, позволяющая синтезировать регулирующие воздействия в зависимости от изменения параметров объекта (в нашем случае в качестве объекта рассматривается контейнеропоток) или внешних возмущений, воздействующих на объект. К числу таких внешних возмущений можно отнести изменения значений факторов, влияющих на величину контейнеропотока (подробно исследованы в [2]). Учитывая сложность системы факторов и многообразие возможных изменений характера их поведения, в качестве инструмента обоснования решений, связанных с изменением контейнеропотока, и последующей разработки предиктивных моделей развития логистической инфраструктуры предлагается использовать методы машинного обучения.

Исходными данными для решения задачи приняты значения показателей (признаков), отражающие поведение факторов, влияющих на величину контейнеропотока. Всего в структуру базы исходных данных включены 89 признаков, укрупненно формирующие следующие группы: макроэкономические показатели, характеристики международной торговли, характеристики рыночных факторов (спроса/предложения), инвестиции в логистическую инфраструктуру. Значения по показателям подбирались по открытым статистическим базам (например, Всемирного банка, Всемирной торговой организации, Конференции ООН по торговле и развитию и других организаций).

Учитывая значительную размерность исходной базы, а также качество данных, в качестве необходимого этапа выполнена предварительная подготовка данных по следующему алгоритму.

1. Выполнена очистка базы по признаку неполноты данных. В частности, удалены признаки, в которых число пропущенных значений не меньше трети (рис.1).

Рисунок 1 – Фрагмент программного кода для процедуры очистки исходной базы по признаку неполноты данных

В результате выполнения операции состав базы сократился до 23 признаков.

2. Выполнено выделение признаков, демонстрирующих наименьшую коррелированность по следующему условию: значение коэффициента корреляции составляет не более 0,5 по абсолютному значению хотя бы с 2/3 признаков (рисунок 2).

Рисунок 2 – Фрагмент программного кода для процедуры анализа признаков

по степени коррелированности

По представленному правилу выявлены 9 признаков, в число которых вошли следующие:

- общий объем железнодорожных перевозок;

- величина валового внутреннего продукта;

- коэффициент конверсии паритета покупательной способности;

- объем экспорта;

- объем импорта;

- уровень безработицы;

- общие государственные доходы;

- общие государственные расходы;

- общая величина инвестиций.

В целом результаты анализа коррелированности признаков представлены на рисунке 3.

Далее на основе полученной базы признаков восстановлена зависимость между предикторами и откликами. Для этого база разделена на тренировочную и тестовую выборки. Затем выделены полиномиальные признаки и построена модель линейной регрессии с функцией ошибки LSM, так как сделано предположение о нормальном распределении шума в данных.

Рисунок 3 – Фрагмент «тепловой карты» для оценки корреляции признаков

Математически постановка задачи выглядит следующим образом. Мы имеем n признаков. Обозначим их x1, . . . , xn, тогда функция, моделирующая зависимость между признаками и результирующей переменной будет найдена в виде полинома от n переменных максимальной степени 5:

alt alt (1)

Параметр, т.е. максимальная степень полинома, выбран с использованием метода поиска гиперпараметров GridSearch. На рисунке 4 приведена реализация вышеперечисленных действий на языке Python 3.

Рисунок 4 – Фрагмент программного кода для восстановления зависимости между величиной контейнеропотока и показателями-факторами

Массив coefs содержит коэффициенты при соответсвующих мономах построенного регрессией полинома. То есть теперь известны все aI, а значит, и явный вид многочлена p.

Теперь, получая новую точку данных, то есть вектор (x1, . . . , xn), можно решать задачу по выявлению параметров, изменение которых приведет к увеличению результирующего показателя, т.е. величины контейнеропотока. Говоря конкретнее, пусть мы можем изменить каждый показатель на величину alt alt . Задача состоит в том, чтобы найти такой набор ri, при которых p(x1 + r1, . . . , xn + rn) было бы максимальным. Для этого предлагается проделать следующую последовательность шагов. Находясь в точке alt alt найдем градиент отображения p. То есть вычислим: alt alt , (2)

где D_i p(x) – i-я частная производная p.

Дальнейшее решение задачи связано с поиском экстремума анализируемого значения контейнеропотока на многообразии M, которое задается как alt alt , где alt alt , с использованием следующих методов:

- метод градиентного спуска. Метод относительно прост и заключается в последовательном пересчете значения вектора аргументов, сдвинутого на градиент функции в очередной точке с некоторой скоростью обучения. Пересчёт параметров останавливается либо при выходе за границы многообразия М, либо при относительно малом изменении вектора аргументов на очередном шаге: alt alt (3)

Однако заметим, что такой метод не обрабатывает исключительные случаи, а именно, ситуацию нахождения в точке локального минимума;

- метод поиска локального экстремума на многообразии. Применение метода связано с вычислением множителей Лагранжа и исследования касательных пространств.

Таким образом, применение предложенного математического аппарата позволяет выстраивать предиктивные модели развития логистической инфраструктуры в зависимости от тенденций изменения основных действующих факторов, а также разрабатывать управленческие решения по адаптивному управлению имеющимися мощностями логистической инфраструктуры в условиях нестационарных контейнеропотоков. Дальнейшие исследования связаны с разработкой более стабильных моделей и изучением альтернативных аналитических методов.

Библиографический список:

Тюкин И.Ю., Терехов В.А. Адаптация в нелинейных динамических системах. (Серия: Синергетика: от прошлого к будущему). – Санкт-Петербург: ЛКИ, 2008. – 383 с.
Шульженко Т.Г., Молонова А.В., Новицкая В.Д. Формирование предиктивных аналитических моделей развития логистической инфраструктуры // Актуальные проблемы развития экономики и менеджмента. 2020. № 3. С.145-155.
Friedman J.H. Greedy function approximation: A gradient boosting machine // Ann. Statist. 29 (5)1189 - 1232, October 2001. DOI: 10.1214/aos/1013203451/
Cohen J., Cohen P., West S.G., Aiken L.S. Applied multiple regression/correlation analysis for the behaviour sciences. (2nd ed.) Hillsdale, NJ: Lawrence Erlbaum Associates, 2003.
Bishop C.M. Pattern Recognition and Machine Learning // Information Science and Statistics). Berlin, Heidelberg: Springer-Verlag, 2006.

Материал размещен кафедрой «Логистика и маркетинг в АПК» Красноярского государственного аграрного университета

Источник: Материалы XVI Международной научно-практической конференции «Логистика – Евразийский мост» ЛЕМ - 2021

Количество просмотров: 3486

теги:

07.01.2022 09:05 | log2021 → блог автора

Комментарии (0)

Еще публикации:

Все публикации

• ERROR:256 in {KERNEL_DIR}/include/mysql.php:39;

SQL[1055] Expression #4 of SELECT list is not in GROUP BY clause and contains nonaggregated column 'sitebs.cm.author' which is not functionally dependent on columns in GROUP BY clause; this is incompatible with sql_mode=only_full_group_by

{KERNEL_DIR}/include/mysql.php: 50
query_mysql->query("SELECT h.com_public,(CASE WHEN cnt>0 THEN cnt ELSE 0 END)cnt,(CASE WHEN md>0 THEN md ELSE 0 END)mid FROM htdocs h LEFT JOIN (SELECT COUNT(cm.id) cnt,AVG(cm.rate) md,cm.htdoc_id,cm.author FROM comments cm INNER JOIN users u ON (cm.author=u.id) WHERE cm.public='1' AND 1=1 GROUP BY cm.htdoc_id) as c ON (h.id=c.htdoc_id) WHERE h.id='74676'");
{KERNEL_DIR}/modules/comments/main.php: 29
query_mysql->format("SELECT h.com_public,(CASE WHEN cnt>0 THEN cnt ELSE 0 END)cnt,(CASE WHEN md>0 THEN md ELSE 0 END)mid FROM htdocs h LEFT JOIN (SELECT COUNT(cm.id) cnt,AVG(cm.rate) md,cm.htdoc_id,cm.author FROM comments cm INNER JOIN users u ON (cm.author=u.id) WHERE cm.public='1' AND 1=1 GROUP BY cm.htdoc_id) as c ON (h.id=c.htdoc_id) WHERE h.id='%d'", "74676");
{KERNEL_DIR}/include/common.php: 46
include("{KERNEL_DIR}/modules/comments/main.php");
{DOCUMENT_ROOT}/ajax/comments.php: 7
module("/comments/main.php");
{KERNEL_DIR}/modules/htdocs/templates/postfix.phpt: 41
require_once("{DOCUMENT_ROOT}/ajax/comments.php");
{KERNEL_DIR}/include/common.php: 64
include("{KERNEL_DIR}/modules/htdocs/templates/postfix.phpt");

{KERNEL_DIR}/modules/htdocs/postfix.php: 33
template("{KERNEL_DIR}/modules/htdocs/templates/postfix.phpt", Array ( [tape] => Array ( [0] => Array ( [id] => 121584 [title] => В Самаре определили лучших пармастеров Поволжья [created] => 1772395946 [published] => 1772395946 [updated] => 0 [path] => /blogs/121584.html ) [1] => Array ( [id] => 121583 [title] => Металлические емкости для канализации «МАРКАДА-СЕПТИК» [created] => 1772395327 [published] => 1772395327 [updated] => 0 [path] => /blogs/121583.html ) [2] => Array ( [id] => 121582 [title] => ООО «СПТ Сервис» — профессиональные решения в сфере упаковки для склада и логистики с официальной гарантией соблюдения сроков и прозрачными условиями сотрудничества [created] => 1772386996 [published] => 1772386996 [updated] => 0 [path] => /blogs/121582.html ) [3] => Array ( [id] => 121581 [title] => Вадим Егоров запускает глубокую работу с телом через комплекс «Валяние» [created] => 1772386175 [published] => 1772386175 [updated] => 0 [path] => /blogs/121581.html ) [4] => Array ( [id] => 121580 [title] => Покраска сруба внутри дома в Калининграде [created] => 1772377934 [published] => 1772377934 [updated] => 0 [path] => /blogs/121580.html ) ) [tags] => Array ( ) ) );

{KERNEL_DIR}/include/common.php: 46
include("{KERNEL_DIR}/modules/htdocs/postfix.php");
{KERNEL_DIR}/tmp/maket#2.phpt: 264
module("/htdocs/postfix.php");
{KERNEL_DIR}/include/common.php: 64
include("{KERNEL_DIR}/tmp/maket#2.phpt");
{KERNEL_DIR}/include/common.php: 352
template("{KERNEL_DIR}/tmp/maket#2.phpt");
{KERNEL_DIR}/router.php: 254
maket(2);
{DOCUMENT_ROOT}/errdoc.php: 5
include_once("{KERNEL_DIR}/router.php");

Strict Standards: Only variables should be assigned by reference in /var/www/sitebs_ru_usr/data/www/sitebs.ru/aquilon/include/common.php on line 135

Strict Standards: Only variables should be assigned by reference in /var/www/sitebs_ru_usr/data/www/sitebs.ru/aquilon/include/session.php on line 60