توسعه روش رگرسیون K- نزدیک‌ترین همسایگی در پیش‌بینی جریان رودخانه

نوع مقاله: مقاله پژوهشی

نویسندگان

1 دانشجوی دکترای مهندسی منابع آب، دانشکده فناوری و مهندسی کشاورزی، دانشگاه تهران

2 استادیار مهندسی منابع آب، دانشکده فناوری و مهندسی کشاورزی، دانشگاه تهران

چکیده

روشهای مختلف آماری، غیرآماری و جعبه سیاه در فرایندهای پیش‌بینی جریان رودخانه استفاده می‌شوند. از میان روشهای آماری، روش رگرسیون ناپارامتری K- نزدیک‌ترین همسایگی به‌واسطه پایه ریاضی و سادگی ذاتی، یکی از روشهای مناسب در فرایندهای پیش‌بینی است. در این تحقیق ضمن معرفی کامل روش K-NN به تشریح راهکارهای توسعه و بهبود این روش پرداخته می‌شود که از آن جمله می‌توان به معرفی روشهای تخمین بهترین همسایگی، توابع انتقال اطلاعات (پیش‌پردازش)، توابع فاصله‌سنجی و روش پیشنهادی برای برونیابی اشاره کرد. روش پیش‌بینی K-NN به‌همراه راهکارهای توسعه آن بر روی مطالعه موردی پیش‌بینی آورد حوضه بالادست سد زاینده‌رود اجرا شد. مقایسه نتایج نهایی روش K-NN کلاسیک با روش اصلاح شده K-NN (تعداد همسایگی 5، تابع انتقال دامنه مقیاس، تابع فاصله سنجی ماهانالوبیس و اعمال روش برونیابی پیشنهادی) نشان می‌دهد که مدل بهبود یافته در پارامترهای نکویی برازش، ریشه میانگین مربعات خطا، درصد حجم خطا و میزان همبستگی به‌ترتیب 45 ، 59 و 17درصد بهبود عملکرد داشته است. این نتایج، ضرورت اعمال راهکارهای ذکر شده را برای استخراج پیش‌بینی‌های دقیق‌تر نشان می‌دهد.

کلیدواژه‌ها


عنوان مقاله [English]

Development of K-Nearest Neighbour Regression Method in Forecasting River Stream Flow

نویسندگان [English]

  • Mohammad Azmi 1
  • Shahab Araghinejad 2
1 Ph. D. Student of Water Resources Eng., College of Tech. and Agricultural Eng., Tehran University, Tehran
2 Assist. Prof. of Water Resources Eng., College of Tech. and Agricultural Eng., Tehran University, Tehran
چکیده [English]

Different statistical, non-statistical and black-box methods have been used in forecasting processes. Among statistical methods, K-nearest neighbour non-parametric regression method (K-NN) due to its natural simplicity and mathematical base is one of the recommended methods for forecasting processes. In this study, K-NN method is explained completely. Besides, development and improvement approaches such as best neighbour estimation, data transformation functions, distance functions and proposed extrapolation method are described. K-NN method in company with its development approaches is used in streamflow forecasting of Zayandeh-Rud Dam upper basin. Comparing between final results of classic K-NN method and modified K-NN (number of neighbour 5, transformation function of Range Scaling, distance function of Mahanalobis and proposed extrapolation method) shows that modified K-NN in criteria of goodness of fit, root mean square error, percentage of volume of error and correlation has had performance improvement 45% , 59% and 17% respectively. These results approve necessity of applying mentioned approaches to derive more accurate forecasts.

کلیدواژه‌ها [English]

  • Nearest Neighbour Method
  • Distance Functions
  • Mahanalobis Distance
  • Extrapolation
  • Zayandeh-Rud River
1- Yakowitz, S. J. (1985). “Nonparametric density estimation, prediction, and regression for markov sequences.” J. Am. Stat. Assoc., 80, 215-221.
2- Lall, U., and Sharma, A. (1996). “A nearest neighbor bootstrap for resampling hydrologic time series.” Water Resources Research, 32(3), 679-694.
3- Karlsson, M., and Yakowitz, S. (1987). “Nearest-neighbor methods for nonparametric rainfall-runoff forecasting.” Water Resources Research, 23(7), 1300-1308.
4- Toth, K., Brath A., and Montanari, A. (2000). “Comparison of short-term rainfall prediction models for real-time flood forecasting.” J. of Hydrology, 239(4), 132-147.
5- Sharma, A., Luck, K. C., Cordery, I., and Lall, U. (2000). “Seasonal to interannual rainfall probabilistic forecast for improved water supply management: Part 2-Predictor Identification of quarterly rainfall using ocean-atmosphere information.” J. of Hydrology, 239, 240-248.
6- Araghinejad, S. H., and Burn, D. (2005). “Probabilistic forecasting of hydrological events using geostatistical analysis.” Hydrological Sciences Journal- des Sciences Hydrologiques, 50(5), 57-66.
7- Asadiani, Yekta, A., and Sultani, F. (2007). “Comparing sediment estimation of inflow load to Ekbatan dam between ANFIS and K-NN algorithm.” 7th Conf. of Iran Hydraulic, Shahid Abbaspour University, Tehran. (In Persian)
8- Noori, R., Farokhnia, A., Morid, S., and Riahi Madvar, H. R. (2008). “Effect of input variable properocessing in artificial neural network on monthly flow predication by PCA and wavelet transformation.” J. of Water and Wastewater, 69, 13-23. (In Persian)
9- Azmi, M., Araghinejad, S., and Kholghi, M. (2010). “Multi model data fusion for hydrological forecasting using k- nearest neighbour method.” Iranian J. of Science and Technology, Transaction B, Engineering, 34, 81-92.
10- Yates, D., Gangopadhyay, S., Rajagopalan, B., and Strzepek, K. (2003). “A technique for generating regional climate scenarios using a nearest-neighbor algorithm.” Water Resoures Research, 39 (7), 1114-1121.
11- Sorjamaa, A., Reyhani, N., and Lendasse,A. (2005). “Input and structure selection for K-NN approximator.” 8th Internatinal Conference on Artificial Neural Networks, Lecture Notes in Computer Science Springer, IWANN, Berlin , 958-992.
12- Meade, N. (2002). “A comparison of the acuracy of short term foreign exchange forecasting methods.” International J. of Forecasting, 18(1), 67-83.
13- Jayawardena, A. W., Li, W. K., and Xu, P. (2002). “Neighbor selection for local modelling and prediction of hydrological time series.” J. of Hydrology, 258, 40-57.
14- Piechota, T.C., Chiew, F.H.S., Dracup, J.A., and McMahon, T.A. (2001). “Development of exceedence probability streamflow forecast.” J. of Hydrologic Engineering, 6(1), 20-28.
15- Tarboton, D. G., Sharma, A., and Lall, U. (1993). “The use of non-parametric probability distribution in streamflow modeling.” In Proceeding of the 6 South African National Hydrological Symposium, Ed. S. A. Lorentz et. Al., University of Natal, Pietermaritzburg, South Africa, 315-327.
16- Todeschini, R. (1989). “K-nearest neighbour method: Influence of data transformations and metrics.” Chemometrics and Intelligent Laboratory Systems, 6, 213-220.
17- Sharif, M. H., and Burn, D. (2006). “Simulating climate change scenarios using an improved K-nearest neighbor model.” J. of Hydrology, 325, 179-196.
18- Kshirsagar, A.M. (1972). Multivariate analysis, Marcel Decker, Inc., New York.