ИССЛЕДОВАНИЕ ВЛИЯНИЯ ХАРАКТЕРИСТИК АВТОМОБИЛЯ НА ЕГО СТОИМОСТЬ: АНАЛИЗ И ПРОГНОЗИРОВАНИЕ С ПОМОЩЬЮ PYTHON
Аннотация
Научная статья посвящена исследованию влияния характеристик автомобилей на их стоимость с использованием методов машинного обучения и статического анализа на языке программирования Python. Цель работы состояла в построении прогностической модели, позволяющей выявить ключевые факторы, влияющие на цену транспортных средств, на основании данных о поддержанных автомобилях, размещенных на онлайн-платформе Kaggle. Актуальность данной темы связана не только с растущими возможностями цифровых технологий, но и необходимостью объективной оценки автомобилей на вторичном рынке. Этому рынку характерно ряд особенностей, в том числе низкий уровень стандартизации, высокий уровень децентрализации и большой объём неструктурированных данных. В таких условиях важность объективной, понятной и быстрой оценки стоимости автомобиля значительно возрастает. Исследование проводилось по методике, которая включала шесть этапов: 1) загрузка и предобработка данных; 2) описательный анализ данных; 3) визуализация данных; 4) формулировка и проверка гипотез; 5) корреляционный анализ и 6) прогнозирование. Современные библиотеки Python, такие как Sklearn, Numpy, Pandas, SciPy, Statsmodels, Matplotlib, Seaborn и Plotly предоставляют широкие возможности для анализа больших и разнородных данных, характерных для автомобильного рынка, а также гибкой настройки и интерактивной визуализации. Результаты интеллектуального анализа и прогнозирования стоимости поддержанного автомобиля показали адекватность серии однофакторных линейных регрессионных моделей. Достаточно высокую предсказательную способность продемонстрировали модели, в составе которых физические и технические характеристики авто: объём двигателя (enginesize); снаряжённая масса (curbweight), мощность (horsepower) и ширина автомобиля (carwidth).
Литература
The used car market in Russia in 2024 and in December. https://www.autostat.ru/press-releases/59289/. (in Russian).
Mirolyubova A.A., Xiaotong Ya., Voroshin D.A. Analysis of China's Macroeconomic Indicators Using Python. Collection of Scientific Papers of Russian Universities "Problems of Econom-ics, Finance, and Production Management". 2025. N 56. P. 120-127. EDN ZHZSDW. (in Russian).
Mirolyubova A.A., Ksenofontova O.L., Voroshin D.A. Expe-rience in data mining and forecasting of the stock market. Ivecofin. 2024. N 4(62). P. 55-63. DOI: 10.6060/ivecofin.2024624.702. EDN CQZLPD. (in Russian).
Sun Ya. Construction of a genetic algorithm for searching neural network models for predicting the yuan exchange rate. Materials of the All-Russian School-Conference of Young Scientists «Science Days at ISUCT». Ivanovo: ISUCT. 2023. Р. 564. EDN AHMLJW. (in Russian).
Python libraries for automatic data exploration analysis. https://uproger.com/10-bibliotek-python-dlya-avtomaticheskogo-analiza/. (in Russian).
Data analysis using Python. https://habr.com/ru/articles/353050/. (in Russian).
Nielsen Aileen. Practical Time Series Analysis: Prediction with Statistics and Machine Learning. St. Petersburg: Dialectics LLC. 2021. 544 p. (in Russian).
Kulenzan A.L., Marchuk N.A., Gvozdev V.V., Shiryaev M.Yu., Puzanov A.M. Statistical research and forecasting of the number of marriages and divorces in the territory of the Russian Federation. Modern high technologies. Regional application. 2023. N 3(75). P. 107-112. DOI: 10.6060/snt.20237503.00014. EDN PRXCJP. (in Russian).
Astrakhantseva I.A., Gerasimov A.S., Smirnova O.P. Evaluating statistical and machine learning models for inflation forecast-ing. Modern high technologies. Regional application. 2024. N 3 (79). P. 120-131. DOI: 10.6060/snt.20247903.0019. EDN SJSWAG. (in Russian).
Tolkachevа O.P. Economic and statistical analysis of the labor market impact on the economic security of the country. Ivecofin. 2023. N 3(57). P. 59-69. DOI: 10.6060/ivecofin.2023573.654. EDN QTYLMZ. (in Russian).
Bobkov S.P., Astrakhantseva I.A., Gushchin A.A., Bobkova E.S., Astrakhantsev R.G., Shutov D.A. Using a discrete prob-abilistic approach for simulating flow tubular reactors. Chem-ChemTech. 2025. Vol. 68. N 2. P. 96-101. DOI: 10.6060/ivkkt.20256802.7109. EDN OWCXJD. (in Russian)
Top 6 Python Libraries for Visualization: Which One to Use and When? https://habr.com/ru/companies/otus/articles/558478/. (in Russian).
Gmurman V.E. Guide to Solving Problems in Probability Theo-ry and Mathematical Statistics: textbook. Moscow: Vysshaya shkola. 2004. 404 p. (in Russian).
Tikhonov S. Linear Regression in Python. https://education.yandex.ru/handbook/data-analysis/article/pandan-linej-naya-regressiya-v-python. (in Russian).
CarPrice_Assignment.csv. https://www.kaggle.com/datasets/hellbuoy/car-price-prediction.
Guide to using Python libraries Pandas. http://pandas.geekwriter.ru/getting_started/index.html. (in Russian).
Guide to using the Python library Numpy. https://python-ru.com/biblioteki/rukovodstvo-po-ispolzovaniju-python-biblioteki-numpy. (in Russian).
Regression models in Python. https://blog.skillfactory.ru/regressionnye-modeli-v-python. (in Russian).







