بهمن ۴, ۱۳۹۸

آموزش SSAS

تعریف SSAS

SSAS یک سرور OLAP چند بعدی و همچنین یک موتور آنالیز است که به شما امکان می دهد حجم زیادی از داده ها را برش داده و تکه کنید. SSAS خدمات تحلیل را با استفاده از ابعاد مختلف ارائه می دهد. به عبارتی ساده ، می توانید از SSAS برای ایجاد مکعب با استفاده از داده های داده های مارتد / انبار داده برای تحلیل عمیق تر و سریعتر داده استفاده کنید.

SQL Server شامل موتور(Engine) بسيار قدرتمندي براي ساخت ساختمان هاي داده چند بعدي(Multi-Dimensional) است که به شما اجازه مرتب کردن ،تجميع (Aggregate)و تحليل  (Analyze)داده ها را مي دهد و تحت عنوان SQL Server Analysis Services شناخته مي شود.

 

ssas

معماری ssas

نمای معماری SSAS مبتنی بر معماری سه لایه است که از آن تشکیل شده است :

  1. RDBMS: داده های منابع مختلف مانند اکسل ، بانک اطلاعاتی ، متن و دیگران را می توان با کمک ابزار ETL به RDBMS کشید.
  2. SSAS: داده های جمع آوری شده از RDBMS با استفاده از پروژه های خدمات تجزیه و تحلیل به مکعب های SSAS منتقل می شود. مکعب ها یک پایگاه داده تجزیه و تحلیل ایجاد می کنند و پس از آماده شدن بانک اطلاعاتی تجزیه و تحلیل ، می توان برای بسیاری از اهداف مورد استفاده قرار گرفت.
  3. مشتری: مشتریان می توانند با استفاده از داشبورد ، امتیازات ، پورتال ها و غیره به داده ها دسترسی پیدا کنند.

اصطلاحات مهم ssas

  • منبع اطلاعات (Data Source)

  • نمایش منبع داده (Data Source View)

  • مکعب (Cube)

  • جدول ابعاد (Dimension Table)

  • جدول واقعیت (Fact Table)

  • طرحواره (Schema)

منبع داده :

منبع داده در (SQL Server Analysis Services) اتصال به بانک اطلاعاتی یا انبار داده است که از آنها داده های مورد نیاز را وارد می کنیم. هر پروژه خدمات تحلیل باید حداقل یک منبع داده برای کار داشته باشد.

منبع داده در SSAS شامل اطلاعات اتصال است. این ترکیبی از ارائه دهنده ، نام سرور ، نام بانک اطلاعات و اطلاعات جعل هویت است. میتوان گفت منبع داده نوعی رشته اتصال است. این ارتباط بین بانک اطلاعاتی تجزیه و تحلیل و RDBMS برقرار می کند.

نمایش منبع داده :

نمای منبع داده در SSAS مجموعه ای از جداول یا نمایش ها از پایگاه داده است که برای طراحی مکعب مورد نیاز است (ما می توانیم این را به عنوان مجموعه داده بنامیم). خدمات تجزیه و تحلیل فقط می توانند به جداول یا نماهای داخل نمای منبع داده دسترسی داشته باشند ، هر چیزی خارج از نمای منبع داده قابل دسترسی نیست. برخی از ویژگیهای اساسی نمای منبع SSAS عبارتند از:

  • یک نمای منبع داده می تواند داده ها را از تنها یک منبع داده بکشد.
  • خدمات تجزیه و تحلیل به ما امکان می دهد تا چندین منبع داده از یک منبع داده واحد ایجاد کنیم.
  • خدمات تجزیه و تحلیل به ما امکان می دهد تا از منبع منبع داده چندین منبع داده ایجاد کنیم.
  • هرگونه تغییر در نمای منبع داده مانند تغییر نام جدول ، حذف چند ستون ناخواسته ، نمایانگر پایگاه داده زیرین نیست.

Cube :

Cube ها منابع داده ی چند بعدی می باشند که دارای ابعاد و Factهایی به عنوان KPI های خود می باشند. به منظور کار با این کیوب ها نیز باید از زبان کوئری نویسی تحت عنوان MDX استفاده شود که مشابه روش T-SQL می باشد و برای کار با کیوب های چند بعدی به کار می رود.

مثال های ساده ای از دایمنشن(ابعاد) عبارتند از تولید، جغرافی، زمان، مشتری؛ نوع حساب های بانکی و مثال های مشابه فکت ها عبارتند از سفارشات و فروشها؛ بالانس های روزانه و تراکنش های روزانه.

دو تئوری مهم در پیشبرد data warehouse و مراکز تجاری داده مربوط به Ralph Kimball  و  Bill Inmon می باشند که عمدتا در محیط های زمانی حقیقی مورد امتحان قرار گرفته اند.

کیمبال می گوید یک انبار داده در‌واقع یک کپی از نقل و انتقالات داده هاست که به صورت مشخص برای پرس و جو(query) ساختار یافته شده اند.

به طور کل داده از سیستم های OLTP  جمع آوری شده و به data warehouse آورده می شوند. منبع داده ی Cube از این مراکز داده و برنامه های کاربر به cube متصل می شوند.

دو شیوه برای طراحی کیوب ها در نظر گرفته می شود که یکی Star و دیگری Snowflake می باشدو هر کدام کاربرد خود را دارد. ساده ترین حالت طراحی همان معماری ستاره ای یا استار می باشد که در یک سطح به بررسی داده ها می پردازد.

MOLAP :

MOLAP از مکعب داده ساخته شده است که شامل اقدامات و ابعاد است. این شامل تمام اعضایی است که ممکن است در یک رابطه سلسله مراتبی باشند.

این مجموعه خاصی از قوانین است که به شما کمک می کند تا تعیین کنید که چگونه سلول های خاصی در یک مکعب پراکنده محاسبه می شوند و مقادیر چرخش شده درون آن سلسله مراتب را اندازه می گیرند.

MOLAP پرمصرف ترین نوع ذخیره سازی است. این برنامه برای ارائه حداکثر عملکرد پرس و جو به کاربران طراحی شده است. جمع آوری داده ها و داده ها در قالب بهینه سازی شده در مکعب ذخیره می شوند. داده های داخل مکعب فقط هنگام پردازش مکعب تازه می شوند ، بنابراین زمان تأخیر زیاد است .

از آنجا که هر دو جزئیات و اطلاعات کل به صورت محلی در سرور OLAP ذخیره می شوند ، حالت ذخیره سازی MOLAP بسیار کارآمد است و سریعترین عملکرد پرس و جو را ارائه می دهد.

جدول ابعاد :

SSAS Dimensions عبارت است از گروهی از صفات (چیزی جز ستونها) که براساس جداول ابعاد در نمای منبع داده ها ساخته شده اند. تمام این خصوصیات نشان داده شده به عنوان خدمات سلسله مراتبی و تجزیه و تحلیل ویژگی برای ما ایجاد گزینه ای برای ایجاد سلسله مراتب کاربر تعریف شده نیز می کند.

در SSAS ابعاد از دو نوع هستند مانند Database Dimension و Cube Dimension.

 

تفاوت بین ابعاد بانک اطلاعاتی و ابعاد مکعب در SSAS

  • بعد بانک اطلاعاتی فقط خصوصیات نام و شناسه دارد ، در حالیکه بعد Cube دارای چندین ویژگی دیگر است.
  • ابعاد بانک اطلاعاتی یک بار ایجاد شده است و ما می توانیم از آنها در چند مکعب استفاده کنیم.
  • ابعاد مکعب فقط یک نقطه اشاره به بعد Database است. ما نمی توانیم به ابعاد مکعب خارج از مکعب دسترسی پیدا کنیم
  • ابعاد مکعب می تواند بیش از موارد دیگر ایجاد کند .

 

جدول واقعیت:

جدول واقعیت مهمترین جدول در یک مدل بعدی است. جدول واقعیت شامل اندازه گیری / واقعیت و کلید خارجی جدول ابعاد است. به عنوان مثال ، عملیات حقوق و دستمزد.

 

تفاوت بین جدول ابعاد در برابر جدول واقعیت

مولفه های جدول واقعیت جدول ابعاد
تعریف اندازه گیری ها ، معیارها یا حقایق در مورد یک فرایند تجاری. جدول همراه با جدول واقعیت ها حاوی ویژگی های توصیفی است که به عنوان محدود کننده پرس و جو مورد استفاده قرار می گیرد.
مشخصه در مرکز یک ستاره یا طرح برف دانه واقع شده و با ابعاد احاطه شده است. به جدول واقعیت وصل شده و در لبه های ستاره یا طرح گلدان برفی واقع شده است
طرح توسط دانه آنها یا سطح اتمی آن تعریف شده است. باید با کلمات ، توصیفی ، کامل و با کیفیت تضمین شود.
وظیفه جدول واقعه یک رویداد قابل اندازه گیری است که برای آن داده های جدول ابعاد جمع آوری شده و برای تجزیه و تحلیل و گزارش استفاده می شود. جمع آوری اطلاعات مرجع در مورد یک تجارت.
نوع داده ها جداول حقایق می توانند شامل اطلاعاتی مانند فروش در برابر مجموعه ای از ابعاد مانند محصول و تاریخ باشند. جدول بعد Evert شامل صفاتی است که جزئیات ابعاد را توصیف می کند. به عنوان مثال ، ابعاد محصول می تواند شامل شناسه محصول ، دسته بندی محصولات و غیره باشد.
کلید جدول اصلی در حقیقت به عنوان کلیدهای خارجی به ابعاد ترسیم می شود. جدول Dimension دارای ستونهای اصلی کلید است که به صورت منحصر به فرد هر بعد را مشخص می کند.
ذخیره سازی به ذخیره برچسب های گزارش و فیلتر مقادیر دامنه در جداول بعد کمک می کند. داده های اتمی دقیق را درون ساختارهای بعدی بارگذاری کنید.
سلسله مراتب حاوی سلسله مراتب نیست دارای سلسله مراتب است. به عنوان مثال موقعیت مکانی می تواند شامل کشور ، کد پین ، ایالت ، شهر و غیره باشد

 

تفاوت های کلیدی جدول حقایق و واقعیت

  • جدول حقایق شامل اندازه گیری ها ، اندازه گیری ها و حقایق در مورد یک فرایند تجاری است در حالی که جدول Dimension همراهی با جدول واقعیت است که شامل ویژگی های توصیفی است که به عنوان محدود کننده پرس و جو مورد استفاده قرار می گیرد.
  • جدول واقعیت در مرکز یک ستاره یا طرح برف دانه قرار دارد ، در حالی که جدول Dimension در لبه های ستاره یا طرحواره های برف قرار دارد.
  • جدول واقعیت با توجه به دانه آنها یا سطح اتمی آن تعریف می شود ، در حالی که جدول ابعاد باید دارای کلمه ، توصیفی ، کامل و با کیفیت باشد.
  • جدول واقعیت ها به ذخیره ی برچسب های گزارش کمک می کند در حالی که جدول Dimension شامل اطلاعات دقیق است.
  • جدول واقعیت حاوی سلسله مراتب نیست ، در حالی که جدول Dimension شامل سلسله مراتب است.

طرحواره:

شمای بانک اطلاعاتی یک سیستم پایگاه داده و ساختار آن که به زبان رسمی توصیف شده است. این سیستم از سیستم مدیریت پایگاه داده پشتیبانی می کند. اصطلاح schema به معنای سازماندهی داده ها به عنوان نقشه ای از شیوه ساخت بانک اطلاعاتی است.

 

طرحواره ستاره ای و طرحواره های برف در SSAS

  • Star Schema: هر ابعادی که در (View Source View (DSV وجود دارد بطور مستقیم با جدول Fact یا اقدامات مرتبط یا مرتبط است.
  • Snowflake Schema: برخی از ابعاد موجود در نمایش داده ها (DSV) مستقیماً به جدول واقعیت پیوند دارند. و برخی از ابعاد بطور غیرمستقیم با جداول واقعیت (با کمک ابعاد میانی) مرتبط است.

 

طرحواره STAR طرحواره برف برفی
جدول واقعیت واقع در مرکز واقع شده توسط جدول ابعاد عادی احاطه شده است جدول واقعیت واقع در مرکز واقع شده توسط جدول ابعاد نرمال احاطه شده است
در Star Schema ، تمام ابعاد به طور مستقیم با جدول واقعیت پیوند خواهد یافت در برنامه Snowflake Schema ، برخی از ابعاد به طور مستقیم به جدول واقعیت و برخی از ابعاد به طور غیر مستقیم با جداول واقعیتها مرتبط هستند (با کمک ابعاد میانی)
درک طرح آسان است درک آن دشوار است
عملکرد پرس و جو را افزایش دهید زیرا ما می توانیم داده هایی را با تعداد پیوست کمتر استخراج کنیم برای استخراج داده ها باید به جداول بیشتری بپیوندیم تا تعداد بیشتری بپیوندند
ما اکثراً طرحواره های STAR را در یک بانک اطلاعاتی کوچک مشاهده می کنیم. یا می گوییم شرکت های کوچک. بیشتر شرکت های بزرگ یا هر پایگاه داده بزرگ همیشه به Snowflake Schema تعلق دارند.
با DE عادی سازی بانک اطلاعاتی ، می توانیم Schema Snowflake را به شمای ستاره تبدیل کنیم. با عادی سازی بانک اطلاعاتی به معنای تقسیم داده های جدول با استفاده از کلیدهای اصلی و خارجی ، می توان سریع ستاره ستاره را به Snowflake Schema تبدیل کرد.

 

نوع مدل ها در SSAS

مدل داده های چند بعدی

مدل داده های چند بعدی که از یک مکعب داده تشکیل شده است. این یک گروه از عملیات است که به شما امکان می دهد مقدار سلول ها را با استفاده از اعضای مکعب و ابعاد به عنوان مختصات پرس و جو کنید.

این قانون قوانینی را تعیین می کند که راه چگونگی چرخش مقادیر اندازه گیری را در سلسله مراتب یا چگونگی محاسبه مقادیر خاص در یک مکعب پراکنده تعیین می کند.

مدل سازی جدول

مدل سازی جدولی داده ها را در جداول مرتبط ترتیب می دهد. جدول به عنوان “ابعاد” یا “حقایق” تعیین نشده است و زمان توسعه کمتر از جدول است زیرا تمام جداول مرتبط با آن قادر به ارائه هر دو نقش هستند.

جدول در مقابل مدل چند بعدی

مولفه های جدول چند بعدی
حافظه در حافظه نهان ذخیره سازی مبتنی بر پرونده
ساختار ساختار سست ساختار سفت و سخت
بهترین ویژگی نیازی به انتقال داده از منبع نیست بهتر است وقتی داده ها در یک طرحواره ستاره قرار می گیرند.
نوع مدل مدل رابطه ای مدل ابعادی
DAX MDX
پیچیدگی ساده پیچیده
اندازه کوچکتر بزرگتر

 

ویژگی های اصلی SSAS

ویژگی های اساسی SSAS عبارتند از:

  • این سازگاری با سطح عقب را در سطح API ارائه می دهد.
  • می توانید از OLEDB برای OLAP برای API دسترسی مشتری و MDX به عنوان یک زبان پرس و جو استفاده کنید.
  • SSAS به شما کمک می کند تا معماری MOLAP ، HOLAP و ROLAP را بسازید
  • این امکان را به شما می دهد تا روی حالت مشتری-سرور یا حالت آفلاین کار کنید.
  • می توانید از ابزار SSAS با جادوگران و طراحان مختلف استفاده کنید.
  • ایجاد و مدیریت مدل داده انعطاف پذیر است.
  • برنامه را از پشتیبانی گسترده سفارشی کنید
  • ساختار دینامیکی ، گزارش تک کاره ، ابرداده مشترک و ویژگی های امنیتی را ارائه می دهد.

 

مزایای استفاده از SSAS

  •   به شما کمک می کند تا از مشاجره منابع با سیستم منبع خودداری کنید
  • این یک ابزار ایده آل برای تجزیه و تحلیل عددی است.
  • SSAS کشف الگوهای داده ای را که ممکن است بلافاصله با استفاده از ویژگی های داده کاوی که در محصول ایجاد شده است آشکار نمی کند ، امکان پذیر می کند.
  • این یک نمایه یکپارچه و یکپارچه از کلیه داده های کاری شما گزارش می دهد ، تجزیه و تحلیل شاخص های کلیدی شاخص عملکرد (KPI) داده کاوی.
  • SSAS پردازش تحلیلی آنلاین (OLAP) از داده های منابع مختلف را ارائه می دهد.
  • این اجازه می دهد تا کاربران را به تجزیه و تحلیل داده ها با میزبان ابزار ، از جمله SSRS و اکسل.

 

مضرات استفاده از SSAS

  • پس از انتخاب مسیری (Tabular یا چند بعدی) ، بدون شروع کار نمی توانید به نسخه دیگری مهاجرت کنید
  • شما مجاز به “ادغام” داده ها بین مکعب های Tabular و چند بعدی نیستید
  • اگر الزامات از طریق پروژه تغییر کند ، جدول می گوید که خطرناک است

 

چرا SSAS؟

علاوه بر معافیت های مالیاتی معمولی که برای مقررات بازنشستگی در دسترس است ، SSAS می تواند مزایای دیگری را برای صاحبان مشاغل کارآفرینی ارائه دهد از جمله:

  1. کنترل و انعطاف پذیری بیشتر بر دارایی های بازنشستگی
  2. کمک های مالی می تواند توسط بیش از یک کارفرما انجام شود
  3. ملک تجاری قابل خریداری و اجاره به تجارت شما (یا هر شخص ثالث) است
  4. وام ها می توانند به مشاغل شما ارتقا پیدا کنند
  5. با خرید سهام عدالت در شرکت خود سرمایه گذاری کنید
  6. می تواند به عنوان وسیله نقلیه بازنشستگی عمل کند که در آن هزینه ها به اندازه صندوق وابسته نیستند

 

برای آشنایی بیشتر با SSAS به اینجا مراجعه کنید.