آشنایی با کلان داده و کاربرد آن در تله مدیسین

کلان داده یا بیگ دیتا (Big Data) را می‌توان یکی از اصطلاحات پُرتکرار در حرف‌ها و نوشته‌های مربوط به فناوری اطلاعات دانست.بیگ دیتا یا کلان داده درواقع اصطلاحی است که برای حجم زیادی از داده‌ها استفاده می‌شود که خیلی سریع و پیچیده هستند و پردازش آنها با استفاده از روش‌های سنتی، سخت و غیرممکن است. به‌طور کلی ما با علم داده، داده‌کاوری، تحلیل داده‌ها و یادگیری ماشین روبه‌رو هستیم. دسترسی و نگهداری حجم زیادی از اطلاعات و داده‌ها برای تحلیل‌هایی بعدی کاری زمان‌بر و پرهزینه است. وقتی از بیگ دیتا صحبت می‌کنیم، بیشتر از یک وضعیت حرف می‌زنیم؛ وضعیتی که در آن حجم زیادی از داده‌ها، با سرعت زیاد و تنوع گسترده تولید می‌شوند.

اما این‌که از چنین وضعیتی چگونه می‌توان استفاده کرد، نیازمند دانش‌های دیگری استدانشمندان علوم داده‌ها (Data Scientists)، متخصصان هوش مصنوعی (Artificial Intelligence) و فعالان داده کاوی (Data-mining) از جمله کسانی هستند که می‌توانند کاربردهای Big Data را در حوزه‌های مختلف بیابند و توسعه دهند.

بنابراین با وجودی که اصطلاح کاربردهای کلان داده (‌Big Data Applications) در فارسی و انگلیسی رایج است و ما هم آن را به‌کار می‌بریم، همواره به‌خاطر داشته باشید که منظور، کاربردهای تحلیل کلان داده‌هاست؛ وگرنه حجم و تنوع داده‌ها، به خودی خود کاربردی ندارد و اگر تحلیل و پردازش مناسب روی‌ داده های حجیم انجام نشود، این داده‌ها از منظر مدیریت منابع، با سایر منابع هرز سازمانی تفاوتی نخواهند داشت.

 

انواع کلان‌ داده کدام است؟

برای دسته‌بندی انواع کلان‌ داده معمولا آن‌ها را بر اساس میزان ساختاریافتگی دسته‌بندی می‌کنند. بر این اساس کلان‌ داده به سه دسته مختلف تقسیم می‌شود.

 

۱- داده‌های بدون ساختار

همه داده‌ها به روش ساختاریافته مرتب نمی‌شوند. تمام داده‌های سازمان‌نیافته شما، «داده‌های بدون ساختار» هستند. تقریباً ۸۰٪ از داده‌های سراسر جهان ساختار ندارند. هیچ‌کس متن مکالمه‌های تلفنی خود را یادداشت نمی‌کند یا هر توییتی که می‌فرستد را با یک نشانه معنادار مشخص نمی‌کند. تقریباً هر کاری که شما با کامپیوتر انجام می‌دهید، داده‌های بدون ساختار تولید می‌کند. این داده‌ها، ماهیت پیچیده‌ای دارند، فضای بیشتری را اشغال می‌کنند و بی‌نظمی و به هم ریختگی‌شان، مدیریت و درک آنها را دشوار می‌کند.

اما برای به‌دست‌آوردن اطلاعات مفید، داده‌ها باید قابل تفسیر باشند. باوجوداینکه تفسیر داده‌ها زمان و انرژی بیشتری می‌خواهد، اما نتیجه این تفسیر ارزشمندتر از جمع‌آوری ساده داده‌های بدون ساختار است.

سخت‌ترین قسمت تحلیل داده‌های بدون ساختار این است که به یک برنامه یاد بدهیم که اطلاعات به‌دست‌آمده را درک کند. برای این کار باید اطلاعات را برای برنامه، به فرم‌هایی از داده‌های ساختاریافته ترجمه کرد. این کار آسانی نیست و از قالبی به قالب دیگر متفاوت است. معمولاً برای این کار از روش‌هایی مانند تجزیه متن، پردازش طبیعی زبان و… استفاده می‌کنند.

 

۲- داده‌های نیمه‌ساختاریافته

داده‌های نیمه‌ساختاریافته، ترکیبی از داده‌های ساختاریافته و بدون ساختار هستند. برای این داده‌ها الگوهای معنادار و جدول‌های مخصوص طراحی نشده است. اما برای داده‌ها برچسب‌ها و نشانه‌هایی برای معناکردن وجود دارند که داده‌ها را برای ضبط و طبقه‌بندی و ساخت پرونده در مجموعه‌های داده آماده می‌کند که ذخیره‌سازی آن را نسبت به داده‌های ساختار نیافته آسان‌تر می‌کند.

 

۳- داده‌های ساختاریافته

این نوع داده‌ها بسیار سازمان‌یافته هستند. تصور کنید صدها صفحه داده، در ستون‌ها و ردیف‌هایی مرتب شده‌اند. برای تمام عنوان‌ها توضیح وجود دارد، متغیرها را به‌راحتی می‌شود تشخیص داد و اعداد قابل‌درک و ملموس هستند. معلوم است که کار با این داده‌ها آسان است و برای برنامه‌ریزی به‌راحتی می‌توان داده‌ها را مرتب و جمع‌آوری کرد.

داده‌های ساختاریافته از الگوها پیروی می‌کنند. این الگوها مشخص می‌کنند که هر داده کجاست و معنی آن چیست.

برای مثال، یک پایگاه‌داده حقوق و دستمزد کارمندان، داده‌هایی مثل اطلاعات شناسایی کارکنان، نرخ دستمزدشان، ساعت کار، نحوه پرداخت اضافه‌کاری و غیره را به ما می‌دهد. الگوی داده‌های ساختاریافته، برای هر برنامه‌ای که از آن استفاده می‌کنیم، هر یک از این موارد را تعریف خواهد کرد. پس این برنامه برای کشف معنای واقعی هرکدام از این موارد، مجبور نیست به جستجوی داده بپردازد، بلکه می‌تواند مستقیماً به جمع‌آوری و پردازش آن بپردازد.

صنعت بهداشت و درمان به سرعت درگیر تغییرات فناوری است. یک تغییر تدریجی از الگوی خدمات بهداشتی مبتنی بر خدمات که در درجه اول بر روی درمان بیماریها متمرکز شده اند ، به یک رویکرد نتیجه گرایانه که نه تنها شامل بررسی روش های مختلف درمانی است بلکه در واقع با هدف درک عوامل ایجاد کننده بیماری های مختلف و از بین بردن آنها نیز میباشد .افزایش قابل توجهی در داده های بهداشتی ، چه ساختاری و چه غیر ساختاری تولید نشده وجود دارد. سطح پیچیدگی بالای این داده ها مستلزم آن است که توسط تجزیه و تحلیل داده های بزرگ پردازش شده ،استنتاج های مربوط به آن بررسی شود و قابل اجرا ارائه شود. Telemedicine همچنین در حال بهره برداری از قدرت داده های بزرگ برای بهبود امکانات مراقبت های بهداشتی موجود است.

امروزه مزایا و کاربردها و امکاناتی که بیگ دیتا در اختیار ما می‌گذارد بر کسی پوشیده نیست. اما یکی از حیاتی‌ترین و تاثیرگذارترین کاربرد بیگ دیتا در پزشکی از راه دور و تشخیص و درمان انواع بیماری‌ها است.

در واقع ، سالهاست که جمع آوری مقادیر عظیمی از داده ها برای مصارف پزشکی پرهزینه و زمان بر بوده است. با فن آوری های همیشه در حال بهبود امروزه ، نه تنها جمع آوری چنین داده هایی بلکه تبدیل آن به بینش های مهم مربوطه ، که می توان از آن برای ارائه مراقبت بهتر استفاده کرد ، آسان تر می شود. هدف از تجزیه و تحلیل داده های مراقبت های بهداشتی این است: استفاده از یافته های داده محور برای پیش بینی و حل مسئله قبل از اینکه بسیار دیر شود ، روش ها و متد های درمانی را سریع تر ارزیابی کرده ، پیگیری بهتری از سلامتی فردی انجام دهید ، پیگیری بهتر بیماران را در سلامت را توانمند سازی کنید .

 

چرا ما در بهداشت و درمان نیاز به تجزیه و تحلیل داده های بزرگ داریم؟

به دلیل افزایش هزینه ها نیاز به داده های بزرگ در مراقبت های بهداشتی نیز وجود دارد. به عبارت دیگر ، هزینه ها بسیار بالاتر از آنچه که باید بود ، بوده است و در 20 سال گذشته افزایش یافته است. بدیهی است که ما در این زمینه به برخی تفکرات هوشمندانه و مبتنی بر داده نیاز داریم. و مشوقهای فعلی نیز در حال تغییر هستند: بسیاری از شرکتهای بیمه از برنامه های هزینه خدمات (که با استفاده از روشهای درمانی گران و بعضا غیر ضروری پاداش می گیرند و تعداد زیادی از بیماران را سریعا درمان می کنند) تغییر می دهند به برنامه هایی که اولویت نتایج بیماران را ارائه می دهد.

 

4 روشی که Big Data در پیشرفت Telemedicine کمک می کند آورده شده است:

پیگیری سلامت بیمار و تجزیه و تحلیل پیش بینی شده

نظارت از راه دور بر بیمار و پیشگیری از افزایش بیماری

تشخیص دقیق و پزشکی دقیق

.پیش بینی روند عفونت و مداخلات به موقع

 

تجزیه و تحلیل داده های بزرگ به پزشکان امکان دسترسی به حجم گسترده ای از اطلاعات را می دهد که باعث افزایش صحت تشخیص و در نتیجه کارآیی در ارائه خدمات درمانی می شود. تلفیق توان Telehealth با  Big data پتانسیل تغییر در سیستم تحویل مراقبت های بهداشتی را دارد و برای بیماران و همچنین ارائه دهندگان مراقبت های بهداشتی سود بزرگی به همراه دارد.

امنیت داده ها و نگرانی های مربوط به حریم خصوصی از بزرگترین تهدید برای این پیشرفت ها است. اجرای اقدامات امنیتی مناسب باید تضمین شده باشد تا مخزن وسیع داده های مراقبت های بهداشتی از پتانسیل کامل بهره مند باشد.

 

همچنین بخوانید:

تاثیر اینترنت اشیا در گسترش تله مدیسین

مروری بر تله پاتولوژی یا آسیب‌شناسی از راه دور

مروری بر مزایای تله ویزیت

 

بالا