@article { author = {Amini, Ghasem}, title = {Modeling of Unauthorized Water Consumption Detection (Case Study: Qom)}, journal = {Journal of Water and Wastewater; Ab va Fazilab ( in persian )}, volume = {31}, number = {4}, pages = {184-193}, year = {2020}, publisher = {Water and Wastewater Consulting Engineers}, issn = {1024-5936}, eissn = {2383-0905}, doi = {10.22093/wwj.2020.209875.2958}, abstract = {Detection of tampering in water meters as part of unauthorized usage is a key step in development of service delivery and increasing water resource productivity, and requires special attention. Data used to identify unauthorized water usage, due to tampering in water meters, include 671 subscribers with a history of meter tampering during the years 2017-2019 and a random sample of 3120 subscribers with no tampering record (clean) among Qom’s residential water users. Data analysis was conducted using subscriber’s water consumption and invoice payment history as well as supervised data mining techniques such as decision tree,  support vector machine, neural network, logistic regression, K-nearest neighbor and unsupervised clustering method. The comparison of different data mining techniques between two groups of tampered and non-tampered water meters showed that among the supervised methods, the accuracy of the models is close to each other and there is a 1–3% difference between them. On the other hand, given the percentage of correct responses among the methods, logistic regression, as the best data mining model, with correct detection of 85% of tampered and 91% of non-tampered cases as well as 89% overall accuracy on the testing data, can be used for identification of tampered meters. The study used clustering as an unsupervised technique. The subscribers were grouped into six clusters. Cluster 3 (n=160 subscribers) showed distinct behavior from the other clusters. About 86% of subscriptions in cluster 3 are tampered cases. Moreover, 18% of the tampered cases detected by logistic regression are in this cluster. Data mining techniques for identification of water meter tampering were presented in this study. Findings of the study indicated that both supervised (including response variable) and unsupervised methods (no response variable) such as clustering can be used for the identification of unauthorized water consumption In this study, logistic regression, due to its high accuracy, was selected as the most appropriate model for detection of tampered meters.}, keywords = {Data mining,Unauthorized Usage,Meter Tampering,logistic regression,Clustering}, title_fa = {مدل‌سازی تشخیص مصرف غیرمجاز آب (مطالعه موردی: شهر قم)}, abstract_fa = {شناسایی کنتورهای دست‌کاری شده آب، به‌عنوان بخشی از مصارف غیرمجاز یکی از گام‌های اساسی در توسعه خدمات‌رسانی و افزایش بهره‌وری از منابع آب به حساب می‌آید که باید به آن توجه کرد. داده‌های مورد استفاده برای شناسایی مصرف غیرمجاز حاصل از دست‌کاری کنتور شامل تعداد 671 مشترک با سابقه دست‌کاری کنتور در سال‌های 98-96 و یک نمونه تصادفی 3120 تایی از مشترکان بدون سابقه دست‌کاری (سالم) در کاربری خانگی شهر قم است. به‌منظور تحلیل داده‌ها از سابقه مصرف و پرداخت صورت‌حساب مشترکان و همچنین روش‌های با نظارت داده کاوی از قبیل درخت تصمیم، ماشین‌بردار پشتیبان، شبکه عصبی، رگرسیون لجستیک، نزدیک‌ترین همسایگی و روش بدون نظارت خوشه‌بندی استفاده شد. مقایسه روش‌های مختلف داده کاوی بین دو گروه کنتورهای دست‌کاری شده و سالم نشان داد در بین روش‌های با نظارت، دقت مدل‌ها نزدیک یکدیگر است و اختلاف 1 تا 3 درصدی بین آنها وجود دارد. از طرفی با توجه به درصد پاسخ صحیح در بین روش‌ها، رگرسیون لجستیک با تشخیص صحیح 85 درصد موارد دست‌کاری شده و 91 درصد موارد سالم و دقت کلی 89 درصد بر روی داده‌های تست به‌عنوان بهترین مدل برای شناسایی کنتورهای دست‌کاری شده می‌تواند استفاده شود. همچنین با استفاده از خوشه‌بندی به‌عنوان یک روش بدون نظارت، مشترکان در 6 خوشه دسته‌بندی و خوشه شماره 3 با تعداد 160 مشترک، رفتار مجزایی از سایر خوشه‌ها نشان داد. 86 درصد اشتراک‌های این خوشه شامل موارد دست‌کاری شده بودند و 18 درصد از موارد دست‌کاری تشخیص داده شده توسط رگرسیون لجستیک در این خوشه قرار گرفت. این پژوهش به ارائه مدل‌هایی برای شناسایی موارد دست‌کاری کنتور آب توسط تکنیک‌های داده کاوی پرداخته است. با توجه به یافته‌های پژوهش، به‌منظور شناسایی مصارف غیرمجاز آب، می‌توان از هر دو روش با نظارت (شامل متغیر پاسخ) و بدون نظارت (بدون نیاز به متغیر پاسخ) مانند خوشه‌بندی استفاده کرد. در این پژوهش رگرسیون لجستیک با دقت زیاد به‌عنوان مناسب‌ترین مدل برای شناسایی کنتورهای دست‌کاری شده انتخاب شد.}, keywords_fa = {داده کاوی,مصرف غیرمجاز,دست‌کاری کنتور,رگرسیون لجستیک,خوشه‌بندی}, url = {https://www.wwjournal.ir/article_112658.html}, eprint = {https://www.wwjournal.ir/article_112658_c9d0638e0da6109d2b44a649ef4b4619.pdf} }