[ez-toc]
مقدمه:
تحلیل داده پلتفرم گاز به شرکتهای گازی کمک میکند تا بهرهوری، امنیت و پایداری در شبکه توزیع را به حداکثر برسانند. این تحلیلها در سطوح مختلف از گزارشهای ساده تا پیشبینیهای پیشرفته و تصمیمسازی خودکار پیادهسازی میشوند. در این مطلب، انواع روشهای تحلیل داده، متدولوژی CRISP-DM، و کاربردهای آن در شبکه هوشمند گاز را بررسی میکنیم.
انواع تحلیل داده پلتفرم گاز
1. تحلیل توصیفی (Descriptive)
ارائه گزارشهای آماری از مصرف گاز، تعداد تیکتها، عملکرد کاربران و دستگاهها. این تحلیل بیشتر برای مرور وضعیت فعلی و استخراج شاخصهای عملکردی (KPIs) کاربرد دارد.
2. تحلیل تشخیصی (Diagnostic)
تعیین علل پدیدههایی مانند گاز گمشده یا ناهنجاریهای ثبتشده در شبکه. استفاده از موتور قوانین پلتفرم و الگوریتمهای تشخیص ناهنجاری برای یافتن دلایل فنی یا انسانی.
3. تحلیل پیشبینی (Predictive)
پیشبینی مصرف گاز، وقوع حوادث یا زمان تعمیر تجهیزات با الگوریتمهای یادگیری ماشین و یادگیری عمیق. این تحلیلها امکان آمادگی در برابر سناریوهای آینده را فراهم میکنند.
4. تحلیل تجویزی (Prescriptive)
ارائه راهکار و تصمیم بر اساس خروجی تحلیلها. مانند تعیین نرخگذاری پلهای یا سیاستهای محدودسازی مصرف در شرایط بحرانی.
فرایند تحلیل داده پلتفرم گاز
در این مرحله، دادههای تجهیزات اندازهگیری از پایگاه داده مرکزی گرفته شده و با استفاده از قوانین ساده یا مدلهای دادهکاوی پیچیده پردازش میشوند. ابزارهایی مانند موتور قوانین و الگوریتمهای هوش مصنوعی برای این فرایند استفاده میشوند.
متدولوژی تحلیل: CRISP-DM
مدل رایج در پروژههای تحلیل داده با مراحل زیر:
-
درک نیاز کسبوکار: تعیین اهداف مشخص مانند پیشبینی مصرف مشترکین عمده در زمستان.
-
درک دادهها: شناسایی، جمعآوری و بررسی کیفیت دادههای مرتبط.
-
آمادهسازی دادهها: پاکسازی، یکپارچهسازی و ساختاردهی برای استفاده در مدل.
-
مدلسازی: انتخاب الگوریتم مناسب (درخت تصمیم، شبکه عصبی و…) و ساخت مدل.
-
ارزیابی: بررسی کارایی مدل از منظر کسبوکار و تحلیل داده.
-
استفاده از مدل: استقرار مدل در پلتفرم برای تولید خروجی قابل استفاده (گزارش، هشدار، تصمیم خودکار).
مزایای استفاده از تحلیل داده پلتفرم گاز
-
کاهش هدررفت گاز از طریق تحلیل تشخیصی و تشخیص ناهنجاری
-
بهینهسازی توزیع با پیشبینی مصرف و وقایع احتمالی
-
ارتقاء تصمیمسازی مدیران با تحلیل تجویزی مبتنی بر دادهها
-
کمک به نگهداری پیشگیرانه و افزایش طول عمر تجهیزات
انواع تحلیل داده پلتفرم گاز
تحلیل دادهها پلتفرم گاز را میتوان در چهار سطح مورد تجزیه و تحلیل قرارداد که در این بخش، این چهار سطح با کاربرد در پلتفرم شبكه توزیع گاز تشریح شده است.
-
تحلیل توصیفی (Descriptive):
- این تحلیل با توصيف وضع فعلی اطلاعاتي در مورد رخدادها را ارائه ميدهد. این نوع تحلیل با ارائه گزارشها و آمارها، به توصیف یا خلاصهسازي دادهها کمک میکند. بهعنوانمثال، اینکه یک استان یا یک مشترك عمده چه میزان مصرف گاز در بازه سهماهه گذشته داشته و یا اینکه یک کارشناس شرکت گاز استانی به چه تعداد تیکت پاسخ داده است، از جمله گزارشهای توصیفی در پلتفرم است که میتواند توسط واحد گزارشگیری و BI در قالب گزارشها یا KPIهای تعریفشده ارائه شود.
-
تحلیل تشخیصی (Diagnostic):
- این تحلیل بیانگر علت رخداد یک پدیده است و بیان میکند چرا یک رخداد ايجاد شده است. بهعنوانمثال، اگر میزان گاز توزیع شده در یک استان با میزان گاز مصرف شده که توسط کنتورها و سایر تجهیزات ثبتشدهاند، برابر نیست، این گاز گمشده میتواند بیانگر هدر رفت گاز ناشی از ایرادهای تجهیزات، ناشی از نشت گاز، یا وجود مشترکین غیرمجاز و مواردی مشابه در شبکه توزیع باشد. یکی از کاربردهای روشهای تحلیل در شبكه توزیع گاز، شناسایی گازهاي گمشده در مسیرهای توزیع است که این موضوع میتواند با استفاده از قواعدی كه در موتور قوانین پلتفرم قابل پياده سازي است. قوانين مورد نظر ميتوانند توسط اپراتور گاز استاني يا بهره بردار تعريف شده و سپس در ماژول موتور قوانين پلتفرم تعريف شود و یا با استفاده از مدلهای پیشرفتهتر یادگیری ماشین مانند روشهای تشخیص ناهنجاری (Anomaly Detection) در شبکه تشخیص داده شود.
-
تحلیل پیشبینی (Predictive):
- این دسته از روشهای تحلیلی برخلاف دسته تحلیل قبلی که دادههای گذشته را بررسی کرده و نتیجهگیری میکنند، از دادهها برای پیشبینی در مورد آینده استفاده میکنند و در واقع بیانگر این است که در آینده چه اتفاقی ممکن است رخ دهد. طبیعتاً انجام پیشبینی کاری دشوارتر است و نیازمند استفاده از روشهای پیچیدهتر مانند الگوریتمهای یادگیری عمیق (Deep Learning) است. از جمله کاربردهای تحلیل پیشگویانه در شبكه توزیع گاز، میتوان به پیشبینی میزان مصرف گاز در ماه / سال آینده بر اساس مشخصات و شرایط یک استان (مانند افزایش تعداد مشترکین جزء و عمده، دمای هوا در فصل مشخصي از سال و غيره) پرداخت و بهتبع آن برنامهریزی لازم را برای جلوگیری از قطعشدن گاز (مانند تولید و توزیع بیشتر، اعمال محدوديتها و سیاستهای جدید) انجام داد. از دیگر کاربردهای این رویکرد، پیشبینی زمان تعمیر تجهیزات شبکه برای جلوگیری از قطعی شبکه و یا اتفاقات و حوادث احتمالی از روی دادههای آن تجهیز است.
-
تحلیل تجویزی (Prescriptive):
- این نوع تحلیل بیانگر این است که چه اقداماتي بايد انجام شود و نتیجه آن ایجاد توصیههایی برای نحوه عملکردن در یک شرایط خاص است. بهعنوانمثال، استفاده از دادهها و تحلیل آنها جهت تصمیمسازی مدیران برای تعیین قیمت مصرف بهویژه تعیین مرزهای مصرف در پلکانی کردن نرخها و یا تعیین سیاستهای تشویقی از تحلیلهای تجویزی است که منجر به ایجاد بینش از روی دادهها شدهاست.

در فرايند تحلیل، پردازشهاي مورد نياز بر روی دادههای مختلف، بهویژه داده مرتبط با تجهیزات اندازه گيري که در پايگاه داده مستقر در مرکز داده قرار دارند، انجام میشود. این تحلیلها میتوانند در پلتفرم شبكه توزیع گاز توسط موتور قوانین انجام شود و ممکن است بسیار ساده و در حد فیلترکردن دادهها باشد و یا تحلیلیتر و عمیقتر مانند استفاده از الگوریتمهای دادهکاوی باشد. هر دو قابليت در مشخصات عملكردي پلتفرم نرم افزاري لحاظ شده است كه بايد توسط پيمانكار توسعه داده شود.
متدولوژی پیشنهادی برای تحلیل داده برای پلتفرم شبکه توزیع گاز
امروزه متدولوژیها و فرایندهای مختلفی برای تحلیل داده پیشنهاد شدهاست که از میان آنها میتوان به مواردی مانند ASUM-DM، SEMMA، KDD، KDDS و CRISP-DM اشاره کرد. در میان این روشها و متدولوژیهای رایج توسعه نرمافزار مانند اسکرام، روش CRISP-DM برای تحلیل داده بیشتر مورداستفاده است. در شکل زیر نتیجه نظرسنجی کاربران در سایت atascience-pm.com (سمت راست) و نتیجه جستجوهای گوگل (سمت چپ) بیانگر عمومیت بیشتر این مدل است.
این روش یک مدل فرایندی سلسلهمراتبی است که متشکل از مجموعهای از فعالیت برای اخراج الگوها و دانش از دادههای خام است. این مدل فرایندی که هم میتوان آن را هم چابک (Agile) و هم آبشاری (Waterfall) دانست، چرخه حیات استاندارد یک پروژه تحلیل داده و دادهکاوی را توصیف میکند. این مدل در حوزههای مختلفی مورد استفاده قرار گرفته است و میتواند در تحلیل دادههاي پلتفرم شبكه توزیع گاز نیز به کار رود.

روش پيشنهادي CRISP-DM شامل ٦ مرحله نشاندادهشده در شکل زیر است که در ادامه مراحل آن مرور شدهاست.

-
درک نیاز کسبوکار برای تحلیل:
- در این مرحله به 1- شناسایی اهداف کسبوکار، 2- ارزیابی وضعیت فعلی، 3- تعیین اهداف تحلیل داده و 4- ایجاد طرح پروژه پرداخته ميشود. در اینجا اهداف کسبوکار نباید بهصورت کلی مطرح شوند و باید محسوس باشند. بهعنوان یک نمونه، هدف تحلیل داده میتواند پیشبینی میزان مصرف گاز توسط مشترکین فوق عمده در فصل زمستان در يك استان باشد که خروجی تحلیل باید بیانگر اندازهگیری میزان مصرف بهصورت یک مقدار یا بازه مشخص باشد.
-
درک دادههای لازم:
- این مرحله شامل شناخت و آمادهسازی داده لازم برای مسئله تعیین شدهاست و دارای مراحلی مانند 1- شناسایی دادههای مرتبط با مسئله و جمعآوری و بررسی آنها، 2- توصیف دادهها (از نظر حجم داده، فرمت و غيره)، 3- بررسی عمیقتر دادهها (مانند بصریسازی و تحلیل رابطه بین اجزای داده و غيره) و 4- بررسی کیفیت دادههاست. دادههای جمعآوری شده باید توصیف دقیق و روشنی از مسئله را ارائه دهند و با آن مسئله مرتبط باشند. در مثال پیشبینی میزان مصرف گاز توسط مشترکین فوق عمده در فصل زمستان در يك استان، لازم است دادههای مرتبط با این پدیده مانند میزان مصرف گذشته (مثلاً سه سال گذشته) این نوع مشترکین که در پایگاهداده پلتفرم موجود است، بههمراه دادههای مرتبط بیرونی مانند برآورد افزایش / کاهش تولید آنها ناشی از تقاضای بازار و یا افزایش تعداد مشترکین جمعآوری و بررسی شود.
-
آمادهسازی دادهها:
- در این مرحله، دادههای مختلف موردنیاز در مدلسازی از منابع مختلف انتخاب شده و بعد از تمیزسازی و یکپارچهسازی، از نظر ساختاری برای ارائه به مرحله بعدی آماده میشوند. این بخش از کار که قسمت مهمی از فرایند تحلیل است، شامل فعالیتهای زیر است:
- انتخاب داده: تعیین اینکه کدام مجموعهداده برای مسئله موردنظر استفاده خواهد شد و ثبت دلایل گنجاندن / حذف آنها.
- پاکسازی دادهها: این مرحله که اغلب از نظر زماني طولانیترین مرحله است، به شناسایی دادههای دارای خطا یا تکراری و حذف یا اصلاح آنها میپردازد.
- ساخت دادههای نهایی: با استفاده از منابع دادهای شناساییشده، لازم است ویژگیهای جدیدی استخراج شود که برای مسئله موردنظر مفید باشد. این کار میتواند با ترکیب برخی از دادهها (مانند نسبت مصرف گاز به تعداد خانوار در یک شهر) و یا شناسایی برخی ویژگیهای مفید از دادهها انجام پذيرد.
- یکپارچهسازی دادهها: در اين مرحله مجموعه دادههای نهایی با تجميع و کنار هم قراردادن دادههای چندین منبع ایجاد خواهد شد.
- ساختار دادن به دادهها: در صورت لزوم، دادهها مجدداً در قالب موردنظر ساختاردهي شده تا برای ساخت مدل آماده شوند. به عنوان نمونه در خصوص برخی از روشهای مدلسازی مانند شبکههای عصبی باید همه دادهها عددی شوند، درحالیکه برای برخی روشهای دیگر مانند درخت تصمیم این الزام وجود ندارد.
-
مدلسازی:
- مدلها که نتیجه اجرای الگوریتمهای تحلیل روی دادههاست، بیانگر روابط بین متغیرهای مسئله (مانند رابطه بین میزان مصرف ماه آینده گاز خانوارهای یک استان با متغیرهای ورودی از جمله مصرف گذشته آنها و دمای آبوهوا) هستند. در این مرحله، بر اساس نوع مسئله، روشهای مختلف مدلسازی انتخابشده و ایجاد میشوند؛ بنابراین اقدامات این گام شامل مراحل زير است:
1- انتخاب روشهای مدلسازی، 2- ایجاد دادگان آموزش و آزمایش برای ساخت و ارزیابی مدل،
3- ایجاد مدلها و 4- ارزیابی مدلهای ساختهشده.
همانطور که فرایند CRISP-DM، بیان میکند، ساخت مدل و انتخاب مدل بهینه فرایندی تکرارشونده است و ممکن است بعد از چند تکرار حاصل شود.
-
ارزیابی:
- بعدازاین که یک یا چند مدل که از نظر تحلیل دادهای کیفیت مناسب دارند، ساخته شدند، مدل از جنبه اهداف کسبوکاری مورد ارزیابی قرار میگیرد که آیا هدف موردنظر را تأمین میکند و آن هدف را با چه کیفیتی تأمین میکند. مروری بر مراحل انجامشده در ساخت مدل نیز صورتمیگیرد تا در صورت لزوم گامهایی که بهخوبی انجامنشدهاند، مشخص شوند. بر اساس نتیجه ارزیابی، اقدام بعدی در استفاده از مدل ساختهشده و یا شروع مجدد فرایند ساخت مدل از ابتدا (درک کسبوکار و داده)، تعیین میشود.
-
استفاده از مدل (اجرا):
- در این مرحله مدل ساختهشده مورداستفاده قرار میگیرد و در واقع از آن یک ماژول تحلیل در پلتفرم استفاده میشود. مثلاً، با ارائه دادههای ورودی (مانند میزان مصرف گذشته، رشد تعداد خانوارها و یا دمای پیشبینیشده) مقدار خروجی (مانند میزان مصرف گاز خانوارها) محاسبه شده و نمایش دادهمیشود. این مرحله میتواند بهسادگی تولید یک گزارش یا یک نمودار باشد و یا به پیچیدگی پیادهسازی یک فرایند جدید باشد (مثلاً در جایگزینکردن شير ايمني با ماژول شبیهساز عملکرد آن).
سوالات متداول
تحلیل توصیفی چه تفاوتی با تحلیل پیشبینی دارد؟
تحلیل توصیفی مربوط به مرور دادههای گذشته و حال است، در حالیکه تحلیل پیشبینی بر اساس همین دادهها آینده را مدلسازی میکند.
آیا برای تحلیل دادههای پلتفرم گاز به هوش مصنوعی نیاز داریم؟
بله، در تحلیلهای پیشبینی و تجویزی استفاده از الگوریتمهای یادگیری ماشین و شبکههای عصبی به دقت و بهرهوری تحلیل کمک میکند.
کدام روش برای تحلیل دادههای گاز مناسبتر است؟
روش CRISP-DM بهدلیل ساختار منظم و امکان بازگشتپذیری در مراحل تحلیل، گزینهای جامع و مطمئن برای این حوزه محسوب میشود.
آیا امکان استفاده از تحلیل داده برای تشخیص گاز دزدی وجود دارد؟
بله، با تحلیل تشخیصی و الگوریتمهای تشخیص ناهنجاری میتوان نقاط پرریسک و احتمال وجود مشترک غیرمجاز را شناسایی کرد.
