تعريف داده هاي عظيم و ويژگي اين نوع داده ها
دادههاي عظيم دادههايي هستند با حجم بالاي دادهاي، كه تركيبي از دادههاي ساخت يافته و غير ساخت يافته را تحت پوشش قرار ميدهند و پردازش آنها با روشهاي سنتي پايگاه دادهاي رابطهاي امكان پذير نيست و به همين دليل براي مديريت آنها از تكنيكهاي خاصي استفاده ميشود. سه ويژگي خاص دادههاي عظيم هستند كه به عنوان يك معيار براي شناسايي داده هاي عظيم، استفاده ميشوند. اين سه ويژگي به ۳V معروف هستند و شامل مقدار، نوع و سرعت پردازش مي شوند كه در ويژگيهاي داده هاي عظيم آنها را تعريف خواهيم كرد.
ويژگي هاي داده هاي عظيم
حجم داده ها : مقدار داده ها در مجموعه هاي داده اي داده هاي عظيم، بالاست. اين حجم يكي از ويژگي هايي است كه براي داده هاي عظيم، به عنوان يك خصيصه اصلي شناسايي ميشود. همان طور كه در بخشهاي پيشين ذكر شد، حجم داده ها در جهان امروز رو به افزايش است و در پردازش داده ها، بايد در نظر گرفته شود. چرا كه در بسياري از موارد نياز به پالايش و فيلتر اطلاعات است و همچنين بايد طرق دسترسي و ذخيره سازي اطلاعات نيز، بر مبناي اين حجم، شخصي سازي شود.
سرعت پردازش: سرعت خلق، جريان، پردازش و تجميع اطلاعات بايد به گونه اي باشد كه متناسب با ويژگيه اي گروه هاي داده اي امروزي عمل كند. با توجه به سرعت توليد اطلاعات در دنياي امروز و نياز به پاسخگويي بلادرنگ در بسياري از برنامه هاي كاربردي و شبكه هاي اجتماعي، سرعت عمل و پردازش روي دادهها بايد به گونهاي باشد كه متناسب با اين ويژگي ها انجام شود. از طرفي، چون داده هاي عظيم معمولا به صورت توزيع شده، نگهداري ميشوند، برقراري ارتباطات و نحوه دسترسي به حافظه نيز بايد مورد توجه قرار گيرد.
انواع دادهاي گوناگون: داده هايي كه در گروه هاي داده اي داده هاي عظيم قرار ميگيرند، شامل انواع مختلف دادهاي از قبيل عكس، متن، ويدئو و …. هستند كه از منابع گوناگوني به دست آمدهاند. فرمتهاي مختلف دارند و دسته بندي آنها بسيار مشكل است و نميتوان قالب يا ساختار خاصي براي آنها تعريف كرد. داده هاي عظيم ازاين رو، غير ساختارمند هستند.
ارزش داده ها: به دليل حجم بالاي داده هاي عظيم، مثالهاي گوناگوني براي ارزيابي در اختيار قرار مي گيرد كه با توجه به اين حجم بالا اگر در زبرگروهي از اين دادهها، مشكل يا نقصي مشاهده شود، ميتوان داده ها را مجددًا پالايش و انتخاب كرد و اين امر در زماني كه در نتايج به دست آمده از ارزشيابي نيز مشكل داشته باشد، كاربرد دارد. همچنين بايد در نظر گرفت كه مقدار دادهاي در مجموعههاي دادهاي تا چه زماني، مورد اطمينان است و نتايج آن درست است. اين امر در دادههاي عظيم بسيار اهميت دارد، چرا كه بسياري از تصميمات و برنامه ريزيها، در حوزه ي صنايع مختلف؛ بر اساس پردازش اين داده ها صورت مي پذيرد.
صحت و يكپارچگي داده ها: به دليل توزيع پذير بودن دادههاي حجم، صحت و يكپارچگي داده ها اهميت زيادي پيدا ميكند، چرا كه بايد بخشهاي مختلف از يك مجموعه دادهاي روي سرويس دهندهاي مختلف قرار گرفتهاند، يكپارچه باشند و آخرين نسخه ي به روز شده ي آن نيز در قسمت هايي كه ممكن است اين مجموعه دادهاي روي سرويس دهنده هاي مختلف، كپي شدهاند، وجود داشته باشد.
دیدگاه ها