کلان داده یا بیگ دیتا (Big Data) را میتوان یکی از اصطلاحات پُرتکرار در حرفها و نوشتههای مربوط به فناوری اطلاعات دانست.بیگ دیتا یا کلان داده درواقع اصطلاحی است که برای حجم زیادی از دادهها استفاده میشود که خیلی سریع و پیچیده هستند و پردازش آنها با استفاده از روشهای سنتی، سخت و غیرممکن است. بهطور کلی ما با علم داده، دادهکاوری، تحلیل دادهها و یادگیری ماشین روبهرو هستیم. دسترسی و نگهداری حجم زیادی از اطلاعات و دادهها برای تحلیلهایی بعدی کاری زمانبر و پرهزینه است. وقتی از بیگ دیتا صحبت میکنیم، بیشتر از یک وضعیت حرف میزنیم؛ وضعیتی که در آن حجم زیادی از دادهها، با سرعت زیاد و تنوع گسترده تولید میشوند.
اما اینکه از چنین وضعیتی چگونه میتوان استفاده کرد، نیازمند دانشهای دیگری است. دانشمندان علوم دادهها (Data Scientists)، متخصصان هوش مصنوعی (Artificial Intelligence) و فعالان داده کاوی (Data-mining) از جمله کسانی هستند که میتوانند کاربردهای Big Data را در حوزههای مختلف بیابند و توسعه دهند.
بنابراین با وجودی که اصطلاح کاربردهای کلان داده (Big Data Applications) در فارسی و انگلیسی رایج است و ما هم آن را بهکار میبریم، همواره بهخاطر داشته باشید که منظور، کاربردهای تحلیل کلان دادههاست؛ وگرنه حجم و تنوع دادهها، به خودی خود کاربردی ندارد و اگر تحلیل و پردازش مناسب روی داده های حجیم انجام نشود، این دادهها از منظر مدیریت منابع، با سایر منابع هرز سازمانی تفاوتی نخواهند داشت.
انواع کلان داده کدام است؟
برای دستهبندی انواع کلان داده معمولا آنها را بر اساس میزان ساختاریافتگی دستهبندی میکنند. بر این اساس کلان داده به سه دسته مختلف تقسیم میشود.
۱- دادههای بدون ساختار
همه دادهها به روش ساختاریافته مرتب نمیشوند. تمام دادههای سازماننیافته شما، «دادههای بدون ساختار» هستند. تقریباً ۸۰٪ از دادههای سراسر جهان ساختار ندارند. هیچکس متن مکالمههای تلفنی خود را یادداشت نمیکند یا هر توییتی که میفرستد را با یک نشانه معنادار مشخص نمیکند. تقریباً هر کاری که شما با کامپیوتر انجام میدهید، دادههای بدون ساختار تولید میکند. این دادهها، ماهیت پیچیدهای دارند، فضای بیشتری را اشغال میکنند و بینظمی و به هم ریختگیشان، مدیریت و درک آنها را دشوار میکند.
اما برای بهدستآوردن اطلاعات مفید، دادهها باید قابل تفسیر باشند. باوجوداینکه تفسیر دادهها زمان و انرژی بیشتری میخواهد، اما نتیجه این تفسیر ارزشمندتر از جمعآوری ساده دادههای بدون ساختار است.
سختترین قسمت تحلیل دادههای بدون ساختار این است که به یک برنامه یاد بدهیم که اطلاعات بهدستآمده را درک کند. برای این کار باید اطلاعات را برای برنامه، به فرمهایی از دادههای ساختاریافته ترجمه کرد. این کار آسانی نیست و از قالبی به قالب دیگر متفاوت است. معمولاً برای این کار از روشهایی مانند تجزیه متن، پردازش طبیعی زبان و… استفاده میکنند.
۲- دادههای نیمهساختاریافته
دادههای نیمهساختاریافته، ترکیبی از دادههای ساختاریافته و بدون ساختار هستند. برای این دادهها الگوهای معنادار و جدولهای مخصوص طراحی نشده است. اما برای دادهها برچسبها و نشانههایی برای معناکردن وجود دارند که دادهها را برای ضبط و طبقهبندی و ساخت پرونده در مجموعههای داده آماده میکند که ذخیرهسازی آن را نسبت به دادههای ساختار نیافته آسانتر میکند.
۳- دادههای ساختاریافته
این نوع دادهها بسیار سازمانیافته هستند. تصور کنید صدها صفحه داده، در ستونها و ردیفهایی مرتب شدهاند. برای تمام عنوانها توضیح وجود دارد، متغیرها را بهراحتی میشود تشخیص داد و اعداد قابلدرک و ملموس هستند. معلوم است که کار با این دادهها آسان است و برای برنامهریزی بهراحتی میتوان دادهها را مرتب و جمعآوری کرد.
دادههای ساختاریافته از الگوها پیروی میکنند. این الگوها مشخص میکنند که هر داده کجاست و معنی آن چیست.
برای مثال، یک پایگاهداده حقوق و دستمزد کارمندان، دادههایی مثل اطلاعات شناسایی کارکنان، نرخ دستمزدشان، ساعت کار، نحوه پرداخت اضافهکاری و غیره را به ما میدهد. الگوی دادههای ساختاریافته، برای هر برنامهای که از آن استفاده میکنیم، هر یک از این موارد را تعریف خواهد کرد. پس این برنامه برای کشف معنای واقعی هرکدام از این موارد، مجبور نیست به جستجوی داده بپردازد، بلکه میتواند مستقیماً به جمعآوری و پردازش آن بپردازد.
صنعت بهداشت و درمان به سرعت درگیر تغییرات فناوری است. یک تغییر تدریجی از الگوی خدمات بهداشتی مبتنی بر خدمات که در درجه اول بر روی درمان بیماریها متمرکز شده اند ، به یک رویکرد نتیجه گرایانه که نه تنها شامل بررسی روش های مختلف درمانی است بلکه در واقع با هدف درک عوامل ایجاد کننده بیماری های مختلف و از بین بردن آنها نیز میباشد .افزایش قابل توجهی در داده های بهداشتی ، چه ساختاری و چه غیر ساختاری تولید نشده وجود دارد. سطح پیچیدگی بالای این داده ها مستلزم آن است که توسط تجزیه و تحلیل داده های بزرگ پردازش شده ،استنتاج های مربوط به آن بررسی شود و قابل اجرا ارائه شود. Telemedicine همچنین در حال بهره برداری از قدرت داده های بزرگ برای بهبود امکانات مراقبت های بهداشتی موجود است.
امروزه مزایا و کاربردها و امکاناتی که بیگ دیتا در اختیار ما میگذارد بر کسی پوشیده نیست. اما یکی از حیاتیترین و تاثیرگذارترین کاربرد بیگ دیتا در پزشکی از راه دور و تشخیص و درمان انواع بیماریها است.
در واقع ، سالهاست که جمع آوری مقادیر عظیمی از داده ها برای مصارف پزشکی پرهزینه و زمان بر بوده است. با فن آوری های همیشه در حال بهبود امروزه ، نه تنها جمع آوری چنین داده هایی بلکه تبدیل آن به بینش های مهم مربوطه ، که می توان از آن برای ارائه مراقبت بهتر استفاده کرد ، آسان تر می شود. هدف از تجزیه و تحلیل داده های مراقبت های بهداشتی این است: استفاده از یافته های داده محور برای پیش بینی و حل مسئله قبل از اینکه بسیار دیر شود ، روش ها و متد های درمانی را سریع تر ارزیابی کرده ، پیگیری بهتری از سلامتی فردی انجام دهید ، پیگیری بهتر بیماران را در سلامت را توانمند سازی کنید .
چرا ما در بهداشت و درمان نیاز به تجزیه و تحلیل داده های بزرگ داریم؟
به دلیل افزایش هزینه ها نیاز به داده های بزرگ در مراقبت های بهداشتی نیز وجود دارد. به عبارت دیگر ، هزینه ها بسیار بالاتر از آنچه که باید بود ، بوده است و در 20 سال گذشته افزایش یافته است. بدیهی است که ما در این زمینه به برخی تفکرات هوشمندانه و مبتنی بر داده نیاز داریم. و مشوقهای فعلی نیز در حال تغییر هستند: بسیاری از شرکتهای بیمه از برنامه های هزینه خدمات (که با استفاده از روشهای درمانی گران و بعضا غیر ضروری پاداش می گیرند و تعداد زیادی از بیماران را سریعا درمان می کنند) تغییر می دهند به برنامه هایی که اولویت نتایج بیماران را ارائه می دهد.
4 روشی که Big Data در پیشرفت Telemedicine کمک می کند آورده شده است:
. پیگیری سلامت بیمار و تجزیه و تحلیل پیش بینی شده
. نظارت از راه دور بر بیمار و پیشگیری از افزایش بیماری
. تشخیص دقیق و پزشکی دقیق
.پیش بینی روند عفونت و مداخلات به موقع
تجزیه و تحلیل داده های بزرگ به پزشکان امکان دسترسی به حجم گسترده ای از اطلاعات را می دهد که باعث افزایش صحت تشخیص و در نتیجه کارآیی در ارائه خدمات درمانی می شود. تلفیق توان Telehealth با Big data پتانسیل تغییر در سیستم تحویل مراقبت های بهداشتی را دارد و برای بیماران و همچنین ارائه دهندگان مراقبت های بهداشتی سود بزرگی به همراه دارد.
امنیت داده ها و نگرانی های مربوط به حریم خصوصی از بزرگترین تهدید برای این پیشرفت ها است. اجرای اقدامات امنیتی مناسب باید تضمین شده باشد تا مخزن وسیع داده های مراقبت های بهداشتی از پتانسیل کامل بهره مند باشد.
همچنین بخوانید:
تاثیر اینترنت اشیا در گسترش تله مدیسین
مروری بر تله پاتولوژی یا آسیبشناسی از راه دور
مروری بر مزایای تله ویزیت