Выявление латентных кластеров инвестиционных продуктов на основе риск-факторов с использованием методов машинного обучения на российском фондовом рынке
Предмет. Латентная структура риск-профилей розничных инвестиционных продуктов. Цели. Определение устойчивых кластеров, основанных на многофакторных метриках риска, отражающих потенциальные годовые потери инвестора. Методология. В качестве базы для анализа используется rolling-выборка скользящих 60-дневных окон по каждому фонду. Для каждого окна рассчитываются волатильность, Value at Risk, Conditional VaR, внутридневные колебания, оборот и метрика ликвидности. Применены алгоритмы кластеризации KMeans, PCA, рассчитана метрика силуэта, Хопкинс-статистика и межкластерные расстояния для оценки качества кластеризации. Результаты. Анализ показал, что данные обладают высокой степенью кластеризуемости. Модель KMeans с пятью кластерами позволила выявить устойчивые группы наблюдений, отличающиеся по глубине потенциальных убытков и ликвидности. Межкластерные расстояния варьировались от 2,15 до 9,67 в нормированном пространстве признаков, что свидетельствует о высокой различимости риск-профилей. Область применения. Предложенный подход может быть применен для автоматизированной типологии инвестиционных продуктов в рамках внутренних моделей риск-менеджмента, а также при разработке универсальных индикаторов риска. Результаты могут использоваться финансовыми институтами и регуляторами для проверки и переоценки существующих шкал риска, включая их адаптацию к поведенческим и рыночным факторам. Выводы. Кластеризация на основе многомерных риск-факторов позволяет выявить скрытую структуру рисков. Применение методов машинного обучения без учителя расширяет возможности эмпирического анализа и способствует более точной сегментации инвестиционных продуктов по потенциальному уровню потерь.
Ключевые слова: риск-факторы, кластеризация, машинное обучение, латентные группы, волатильность
Список литературы:
Tan P.N., Steinbach M., Kumar V. Introduction to Data Mining. Boston, Pearson, 2006.
Murphy K.P. Machine Learning: A Probabilistic Perspective. Cambridge, MA, MIT Press, 2012, 1067 p.
Kaufman L., Rousseeuw P.J. Finding Groups in Data: An Introduction to Cluster Analysis. Hoboken, NJ, Wiley, 2005, 342 p.
Banerjee A., Dave R.N. Validating clusters using the Hopkins statistic. Proceedings of IEEE International Conference on Fuzzy Systems, 2004, vol. 1, pp. 149–153. DOI: 10.1109/FUZZY.2004.1375706
Géron A. Hands-On Machine Learning with Scikit-Learn, Keras, and TensorFlow. 2nd ed. O'Reilly Media, 2019.
Hull J.C. Risk Management and Financial Institutions. 5th ed. Wiley, 2018, 832 p.
Artzner P., Delbaen F., Eber J.-M., Heath D. Coherent Measures of Risk. Mathematical Finance, 1999, vol. 9, iss. 3, pp. 203–228. DOI: 10.1111/1467-9965.00068
Fabozzi F.J., Focardi S.M., Kolm P.N. Quantitative Equity Investing: Techniques and Strategies. Wiley, 2010, 528 p.
Amihud I. Illiquidity and stock returns: cross-section and time-series effects. Journal of Financial Markets, 2002, vol. 5, iss. 1, pp. 31–56. DOI: 10.1016/S1386-4181(01)00024-6
Chordia T., Roll R., Subrahmanyam A. Liquidity and market efficiency. Journal of Financial Economics, 2008, vol. 87, iss. 2, pp. 249–268. DOI: 10.1016/j.jfineco.2007.03.005
Chen J., Hong H., Huang M., Kubik J.D. Does Fund Size Erode Mutual Fund Performance? The Role of Liquidity and Organization. The American Economic Review, 2004, vol. 94, no. 5, pp. 1276–1302. DOI: 10.1257/0002828043052277
Frazzini A., Pedersen L.H. Embedded leverage. The Review of Asset Pricing Studies, 2022, vol. 12, iss. 1, pp. 1–52. DOI: 10.1093/rapstu/raab022