تحلیل داده‌ پلتفرم گاز
تحلیل داده‌ پلتفرم گاز

تحلیل داده‌ پلتفرم گاز

[ez-toc]

مقدمه:

تحلیل داده‌ پلتفرم گاز به شرکت‌های گازی کمک می‌کند تا بهره‌وری، امنیت و پایداری در شبکه توزیع را به حداکثر برسانند. این تحلیل‌ها در سطوح مختلف از گزارش‌های ساده تا پیش‌بینی‌های پیشرفته و تصمیم‌سازی خودکار پیاده‌سازی می‌شوند. در این مطلب، انواع روش‌های تحلیل داده، متدولوژی CRISP-DM، و کاربردهای آن در شبکه هوشمند گاز را بررسی می‌کنیم.

 انواع تحلیل داده‌ پلتفرم گاز

1. تحلیل توصیفی (Descriptive)

ارائه گزارش‌های آماری از مصرف گاز، تعداد تیکت‌ها، عملکرد کاربران و دستگاه‌ها. این تحلیل بیشتر برای مرور وضعیت فعلی و استخراج شاخص‌های عملکردی (KPIs) کاربرد دارد.

2. تحلیل تشخیصی (Diagnostic)

تعیین علل پدیده‌هایی مانند گاز گمشده یا ناهنجاری‌های ثبت‌شده در شبکه. استفاده از موتور قوانین پلتفرم و الگوریتم‌های تشخیص ناهنجاری برای یافتن دلایل فنی یا انسانی.

3. تحلیل پیش‌بینی (Predictive)

پیش‌بینی مصرف گاز، وقوع حوادث یا زمان تعمیر تجهیزات با الگوریتم‌های یادگیری ماشین و یادگیری عمیق. این تحلیل‌ها امکان آمادگی در برابر سناریوهای آینده را فراهم می‌کنند.

4. تحلیل تجویزی (Prescriptive)

ارائه راهکار و تصمیم بر اساس خروجی تحلیل‌ها. مانند تعیین نرخ‌گذاری پله‌ای یا سیاست‌های محدودسازی مصرف در شرایط بحرانی.

 فرایند تحلیل داده پلتفرم گاز

در این مرحله، داده‌های تجهیزات اندازه‌گیری از پایگاه داده مرکزی گرفته شده و با استفاده از قوانین ساده یا مدل‌های داده‌کاوی پیچیده پردازش می‌شوند. ابزارهایی مانند موتور قوانین و الگوریتم‌های هوش مصنوعی برای این فرایند استفاده می‌شوند.

 متدولوژی تحلیل: CRISP-DM

مدل رایج در پروژه‌های تحلیل داده با مراحل زیر:

  1. درک نیاز کسب‌وکار: تعیین اهداف مشخص مانند پیش‌بینی مصرف مشترکین عمده در زمستان.

  2. درک داده‌ها: شناسایی، جمع‌آوری و بررسی کیفیت داده‌های مرتبط.

  3. آماده‌سازی داده‌ها: پاک‌سازی، یکپارچه‌سازی و ساختاردهی برای استفاده در مدل.

  4. مدل‌سازی: انتخاب الگوریتم مناسب (درخت تصمیم، شبکه عصبی و…) و ساخت مدل.

  5. ارزیابی: بررسی کارایی مدل از منظر کسب‌وکار و تحلیل داده.

  6. استفاده از مدل: استقرار مدل در پلتفرم برای تولید خروجی قابل استفاده (گزارش، هشدار، تصمیم خودکار).

 مزایای استفاده از تحلیل داده پلتفرم گاز

  • کاهش هدررفت گاز از طریق تحلیل تشخیصی و تشخیص ناهنجاری

  • بهینه‌سازی توزیع با پیش‌بینی مصرف و وقایع احتمالی

  • ارتقاء تصمیم‌سازی مدیران با تحلیل تجویزی مبتنی بر داده‌ها

  • کمک به نگهداری پیشگیرانه و افزایش طول عمر تجهیزات

انواع تحلیل داده‌ پلتفرم گاز

تحلیل داده‌ها پلتفرم گاز را می‌توان در چهار سطح مورد تجزیه ‌و تحلیل قرارداد که در این بخش، این چهار سطح با کاربرد در پلتفرم شبكه توزیع گاز تشریح شده است.

  • تحلیل توصیفی (Descriptive):

  • این تحلیل با توصيف وضع فعلی اطلاعاتي در مورد رخدادها را ارائه مي‎دهد. این نوع تحلیل با ارائه گزارش‌ها و آمارها، به توصیف یا خلاصه‌سازي داده‌ها کمک می‌کند. به‌عنوان‌مثال، اینکه یک استان یا یک مشترك عمده چه میزان مصرف گاز در بازه سه‌ماهه گذشته داشته و یا اینکه یک کارشناس شرکت گاز استانی به چه تعداد تیکت پاسخ داده است، از جمله گزارش‌های توصیفی در پلتفرم است که می‌تواند توسط واحد گزارش‌گیری و BI در قالب گزارش‌ها یا KPIهای تعریف‌شده ارائه شود.
  • تحلیل تشخیصی (Diagnostic):

  • این تحلیل بیانگر علت رخداد یک پدیده است و بیان می‌کند چرا یک رخداد ايجاد شده است. به‌عنوان‌مثال، اگر میزان گاز توزیع شده در یک استان با میزان گاز مصرف شده که توسط کنتورها و سایر تجهیزات ثبت‌شده‌اند، برابر نیست، این گاز گمشده می‌تواند بیانگر هدر رفت گاز ناشی از ایرادهای تجهیزات، ناشی از نشت گاز، یا وجود مشترکین غیرمجاز و مواردی مشابه در شبکه توزیع باشد. یکی از کاربردهای روش‌های تحلیل در شبكه توزیع گاز، شناسایی گازهاي گمشده در مسیرهای توزیع است که این موضوع می‌تواند با استفاده از قواعدی كه در موتور قوانین پلتفرم قابل پياده سازي است. قوانين مورد نظر مي‎توانند توسط اپراتور گاز استاني يا بهره بردار تعريف شده و سپس در ماژول موتور قوانين پلتفرم تعريف شود و یا با استفاده از مدل‌های پیشرفته‌تر یادگیری ماشین مانند روش‌های تشخیص ناهنجاری (Anomaly Detection) در شبکه تشخیص داده شود.
  • تحلیل پیش‌بینی (Predictive):

  • این دسته از روش‌های تحلیلی برخلاف دسته تحلیل قبلی که داده‌های گذشته را بررسی کرده و نتیجه‌گیری می‌کنند، از داده‌ها برای پیش‌بینی در مورد آینده استفاده می‌کنند و در واقع بیانگر این است که در آینده چه اتفاقی ممکن است رخ دهد. طبیعتاً انجام پیش‌بینی کاری دشوارتر است و نیازمند استفاده از روش‌های پیچیده‌تر مانند الگوریتم‌های یادگیری عمیق (Deep Learning) است. از جمله کاربردهای تحلیل پیشگویانه در شبكه توزیع گاز، می‌توان به پیش‌بینی میزان مصرف گاز در ماه / سال آینده بر اساس مشخصات و شرایط یک استان (مانند افزایش تعداد مشترکین جزء و عمده، دمای هوا در فصل مشخصي از سال و غيره) پرداخت و به‌تبع آن برنامه‌ریزی لازم را برای جلوگیری از قطع‌شدن گاز (مانند تولید و توزیع بیشتر، اعمال محدوديت‎ها و سیاست‌های جدید) انجام داد. از دیگر کاربردهای این رویکرد، پیش‌بینی زمان تعمیر تجهیزات شبکه برای جلوگیری از قطعی شبکه و یا اتفاقات و حوادث احتمالی از روی داده‌های آن تجهیز است.
  • تحلیل تجویزی (Prescriptive):

  • این نوع تحلیل بیانگر این است که چه اقداماتي بايد انجام شود و نتیجه آن ایجاد توصیه‌هایی برای نحوه عمل‌کردن در یک شرایط خاص است. به‌عنوان‌مثال، استفاده از داده‌ها و تحلیل آنها جهت تصمیم‌سازی مدیران برای تعیین قیمت مصرف به‌ویژه تعیین مرزهای مصرف در پلکانی کردن نرخ‌ها و یا تعیین سیاست‌های تشویقی از تحلیل‌های تجویزی است که منجر به ایجاد بینش از روی داده‌ها شده‌است.

 

تحلیل داده‌ پلتفرم گاز
تحلیل داده‌ پلتفرم گاز

در فرايند تحلیل، پردازش‎هاي مورد نياز بر روی داده‌های مختلف، به‌ویژه داده مرتبط با تجهیزات اندازه گيري که در پايگاه داده مستقر در مرکز داده قرار دارند، انجام ‌می‌شود. این تحلیل‌ها می‌توانند در پلتفرم شبكه توزیع گاز توسط موتور قوانین انجام شود و ممکن است بسیار ساده و در حد فیلترکردن داده‌ها باشد و یا تحلیلی‌تر و عمیق‌تر مانند استفاده از الگوریتم‌های داده‌کاوی باشد. هر دو قابليت در مشخصات عملكردي پلتفرم نرم افزاري لحاظ شده است كه بايد توسط پيمانكار توسعه داده شود.

 

متدولوژی پیشنهادی برای تحلیل داده برای پلتفرم شبکه توزیع گاز

امروزه متدولوژی‌ها و فرایندهای مختلفی برای تحلیل داده پیشنهاد شده‌است که از میان آنها می‌توان به مواردی مانند ASUM-DM، SEMMA، KDD، KDDS و CRISP-DM اشاره کرد. در میان این روش‌ها و متدولوژی‌های رایج توسعه نرم‌افزار مانند اسکرام، روش CRISP-DM برای تحلیل داده بیشتر مورداستفاده است. در شکل زیر نتیجه نظرسنجی کاربران در سایت atascience-pm.com (سمت راست) و نتیجه جستجوهای گوگل (سمت چپ) بیانگر عمومیت بیشتر این مدل است.

این روش یک مدل فرایندی سلسله‌مراتبی است که متشکل از مجموعه‌ای از فعالیت برای اخراج الگوها و دانش از داده‌های خام است. این مدل فرایندی که هم می‌توان آن را هم چابک (Agile) و هم آبشاری (Waterfall) دانست، چرخه حیات استاندارد یک پروژه تحلیل داده و داده‌کاوی را توصیف می‌کند. این مدل در حوزه‌های مختلفی مورد استفاده قرار گرفته است و می‌تواند در تحلیل داده‌هاي  پلتفرم شبكه توزیع گاز نیز به کار رود.

روش پيشنهادي CRISP-DM شامل ٦ مرحله نشان‌داده‌شده در شکل زیر است که در ادامه مراحل آن مرور شده‌است.

 

  • درک نیاز کسب‌وکار برای تحلیل:

  • در این مرحله به 1- شناسایی اهداف کسب‌وکار، 2- ارزیابی وضعیت فعلی، 3- تعیین اهداف تحلیل داده و 4- ایجاد طرح پروژه پرداخته مي‎شود. در اینجا اهداف کسب‌وکار نباید به‌صورت کلی مطرح شوند و باید محسوس باشند. به‌عنوان یک نمونه، هدف تحلیل داده می‌تواند پیش‌بینی میزان مصرف گاز توسط مشترکین فوق عمده در فصل زمستان در يك استان باشد که خروجی تحلیل باید بیانگر اندازه‌گیری میزان مصرف به‌صورت یک مقدار یا بازه مشخص باشد.
  • درک داده‌های لازم:

  • این مرحله شامل شناخت و آماده‌سازی داده لازم برای مسئله تعیین شده‌است و دارای مراحلی مانند 1- شناسایی داده‌های مرتبط با مسئله و جمع‌آوری و بررسی آن‌ها، 2- توصیف داده‌ها (از نظر حجم داده، فرمت و غيره)، 3- بررسی عمیق‌تر داده‌ها (مانند بصری‌سازی و تحلیل رابطه بین اجزای داده و غيره) و 4- بررسی کیفیت داده‌هاست. داده‌های جمع‌آوری شده باید توصیف دقیق و روشنی از مسئله را ارائه دهند و با آن مسئله مرتبط باشند. در مثال پیش‌بینی میزان مصرف گاز توسط مشترکین فوق عمده در فصل زمستان در يك استان، لازم است داده‌های مرتبط با این پدیده مانند میزان مصرف گذشته (مثلاً سه سال گذشته) این نوع مشترکین که در پایگاه‌داده پلتفرم موجود است، به‌همراه داده‌های مرتبط بیرونی مانند برآورد افزایش / کاهش تولید آنها ناشی از تقاضای بازار و یا افزایش تعداد مشترکین جمع‌آوری و بررسی شود.
  • آماده‌سازی داده‌ها:

  • در این مرحله، داده‌های مختلف موردنیاز در مدل‌سازی از منابع مختلف انتخاب شده و بعد از تمیزسازی و یکپارچه‌سازی، از نظر ساختاری برای ارائه به مرحله بعدی آماده می‌شوند. این بخش از کار که قسمت مهمی از فرایند تحلیل است، شامل فعالیت‌های زیر است:
    • انتخاب داده: تعیین‌ اینکه کدام مجموعه‌داده برای مسئله موردنظر استفاده خواهد شد و ثبت دلایل گنجاندن / حذف آنها.
    • پاک‌سازی داده‌ها: این مرحله که اغلب از نظر زماني طولانی‌ترین مرحله است، به شناسایی داده‌های دارای خطا یا تکراری و حذف یا اصلاح آنها می‌پردازد.
    • ساخت داده‌های نهایی: با استفاده از منابع داده‌ای شناسایی‌شده، لازم است ویژگی‌های جدیدی استخراج شود که برای مسئله موردنظر مفید باشد. این کار می‌تواند با ترکیب برخی از داده‌ها (مانند نسبت مصرف گاز به تعداد خانوار در یک شهر) و یا شناسایی برخی ویژگی‌های مفید از داده‌ها انجام پذيرد.
    • یکپارچه‌سازی داده‌ها: در اين مرحله مجموعه‌ داده‌های نهایی با تجميع و کنار هم قراردادن داده‌های چندین منبع ایجاد خواهد شد.
    • ساختار دادن به داده‌ها: در صورت لزوم، داده‌ها مجدداً در قالب موردنظر ساختاردهي شده تا برای ساخت مدل آماده شوند. به عنوان نمونه در خصوص برخی از روش‌های مدل‌سازی مانند شبکه‌های عصبی باید همه داده‌ها عددی شوند، درحالی‌که برای برخی روش‌های دیگر مانند درخت تصمیم این الزام وجود ندارد.
  • مدل‌سازی:

  • مدل‌ها که نتیجه اجرای الگوریتم‌های تحلیل روی داده‌هاست، بیانگر روابط بین متغیرهای مسئله (مانند رابطه بین میزان مصرف ماه آینده گاز خانوارهای یک استان با متغیرهای ورودی از جمله مصرف گذشته آنها و دمای آب‌وهوا) هستند. در این مرحله، بر اساس نوع مسئله، روش‌های مختلف مدل‌سازی انتخاب‌شده و ایجاد می‌شوند؛ بنابراین اقدامات این گام شامل مراحل زير است:
    1- انتخاب روش‌های مدل‌سازی، 2- ایجاد دادگان آموزش و آزمایش برای ساخت و ارزیابی مدل،
    3- ایجاد مدل‌ها و 4- ارزیابی مدل‌های ساخته‌شده.

همان‌طور که فرایند CRISP-DM، بیان می‌کند، ساخت مدل و انتخاب مدل بهینه فرایندی تکرارشونده است و ممکن است بعد از چند تکرار حاصل شود.

  • ارزیابی:

  • بعدازاین که یک یا چند مدل که از نظر تحلیل داده‌ای کیفیت مناسب دارند، ساخته شدند، مدل از جنبه اهداف کسب‌وکاری مورد ارزیابی قرار می‌گیرد که آیا هدف موردنظر را تأمین می‌کند و آن هدف را با چه کیفیتی تأمین می‌کند. مروری بر مراحل انجام‌شده در ساخت مدل نیز صورت‌می‌گیرد تا در صورت لزوم گام‌هایی که به‌خوبی انجام‌نشده‌اند، مشخص شوند. بر اساس نتیجه ارزیابی، اقدام بعدی در استفاده از مدل ساخته‌شده و یا شروع مجدد فرایند ساخت مدل از ابتدا (درک کسب‌وکار و داده)، تعیین می‌شود.
  • استفاده از مدل (اجرا):

  • در این مرحله مدل ساخته‌شده مورداستفاده قرار می‌گیرد و در واقع از آن یک ماژول تحلیل در پلتفرم استفاده می‌شود. مثلاً، با ارائه داده‌های ورودی (مانند میزان مصرف گذشته، رشد تعداد خانوارها و یا دمای پیش‌بینی‌شده) مقدار خروجی (مانند میزان مصرف گاز خانوارها) محاسبه شده و نمایش داده‌می‌شود. این مرحله می‌تواند به‌سادگی تولید یک گزارش یا یک نمودار باشد و یا به پیچیدگی پیاده‌سازی یک فرایند جدید باشد (مثلاً در جایگزین‌کردن شير ايمني با ماژول شبیه‌ساز عملکرد آن).

سوالات متداول

تحلیل توصیفی چه تفاوتی با تحلیل پیش‌بینی دارد؟

تحلیل توصیفی مربوط به مرور داده‌های گذشته و حال است، در حالی‌که تحلیل پیش‌بینی بر اساس همین داده‌ها آینده را مدل‌سازی می‌کند.

آیا برای تحلیل داده‌های پلتفرم گاز به هوش مصنوعی نیاز داریم؟

بله، در تحلیل‌های پیش‌بینی و تجویزی استفاده از الگوریتم‌های یادگیری ماشین و شبکه‌های عصبی به دقت و بهره‌وری تحلیل کمک می‌کند.

کدام روش برای تحلیل داده‌های گاز مناسب‌تر است؟

روش CRISP-DM به‌دلیل ساختار منظم و امکان بازگشت‌پذیری در مراحل تحلیل، گزینه‌ای جامع و مطمئن برای این حوزه محسوب می‌شود.

آیا امکان استفاده از تحلیل داده برای تشخیص گاز دزدی وجود دارد؟

بله، با تحلیل تشخیصی و الگوریتم‌های تشخیص ناهنجاری می‌توان نقاط پرریسک و احتمال وجود مشترک غیرمجاز را شناسایی کرد.

دیدگاهتان را بنویسید