שנתיים אחרי פיגועי ה-11 בספטמבר במרכז הסחר העולמי בניו-יורק, וארגוני הביון הגדולים בעולם עדיין אינם ערוכים למיון יעיל של כמויות המידע המודיעיני הענקיות הנצברות מדי יום. מחקר חדש, הנערך כעת במכללה האקדמית להנדסה 'אורט בראודה', מנסה לייעל את כריית הנתונים, כדי שלא יחזור על עצמו המקרה - שהמידע על פיגוע צפוי היה בידי המודיעין, אך לא אותר בזמן.
מומחי כריית הנתונים מחפשים כיום אלגוריתמים ממוחשבים לאיתור המידע הרצוי. למרות שבעבר פיתחו חוקרים אלגוריתמים מסוג זה, עד כה, לא נעשה באמצעותם ניתוח של המידע שנאסף. במכללה האקדמית להנדסה נערך מחקר, הבודק את יעילותם של אלגוריתמים אלה.
"כריית נתונים" הוכנסה השנה לתוכנית הלימודים במכללה האקדמית להנדסה 'אורט בראודה'. הסטודנטים יעסקו בלימוד, מחקר ופיתוח אלגוריתמים המסייעים בכריית נתונים במסגרת מסלולי ביו-אינפורמטיקה ואבטחת מידע.
דר' זאב וולקוביץ, מומחה בכריית נתונים מהמכללה, חוקר תחום זה בימים אלה, יחד עם מספר מומחים מהטכניון ומאוניברסיטאות בארה"ב. אחת ממטרותיהם המחקריות היא, בין השאר: בניית אלגוריתמים חדשניים שישמשו כלי לקיטלוג יעיל יותר של בסיסי נתונים רחבים ואתרי אינטרנט, בכוונה לצמצם את תחום החיפוש ואת זמן החיפוש.
הבסיס הטכנולוגי לשיטה, הוא יצירת תבניות נתונים (קלסטרים) בעלי מאפיינים דומים. הצגת המכנה המשותף בין תבניות אלה, תסייע למערכת המחשב "להבין" את התכונות הבולטות ולנתח אותן.
לדברי וולקוביץ, פיתוח תחום "כריית הנתונים" יועיל לא רק במיקוד מידע בטחוני, אלא גם יסייע בתחום הביואינפורמטיקה, בתחום הרפואה ובתחום אבטחת המידע.
דר' וולקוביץ' אמר, כי "קיימים תחומים מעשיים שבהם ניתן להשתמש באלגוריתמים שאנחנו מפתחים, ביניהם: חיפוש מהיר ואיתור מחרוזות גנים ורצפים גנטיים, כדי להגיע לאבחון מהיר יותר ומדוייק יותר של מחלות או בעיות רפואיות. ניתן לזהות באמצעותם פריצות מקוונות למחשבים או איתור פעילות חשודה שעלולה לפגוע במחשבים או באתרי אינטרנט, חדירות לקבצים מוצפנים, גניבת מידע ועוד".
כחלק מתוכנית המחקר, יבדקו החוקרים - יחד עם הסטודנטים שיתמחו בכריית נתונים - את יעילותו של סטנדרט ההצפנה החדש (אלגוריתם רג'ינדל) שהוכנס השנה להצפנת הנתונים. בשיתוף עם גורמים נוספים ברחבי העולם, נבדקת עמידותו של תקן הצפנת המידע באמצעות האלגוריתמים ויכולתו להישמר מאובטח.
רקע
אחת התוצאות מנפילת מגדלי התאומים בספטמבר 2001, היתה גידול במספר ובהיקף המחקרים המוקדשים להבנת תחום "כריית נתונים". ההתעניינות בארה"ב ובכל העולם בתחום "כריית הנתונים" התרחבה ב-3 השנים האחרונות, ולא בכדי: מסתבר כי בימים שקדמו לפיגוע במגדלי התאומים נאספו נתונים והקלטות לגבי תכנון אירוע הטרור, אולם עומס המידע העצום שהגיע מלווינים, האזנות, מיליוני תיבות דואר אלקטרוני ועוד - לא היה מאורגן במנגנון ממוחשב שביכולתו לברור את הנתונים. התוצאה ידועה: גורמי המודיעין לא הצליחו להגיע בזמן למידע הרלוונטי, ולפעול.
כיום, על סמך ניסיון העבר, ובעידן של כוננות כתומה בארה"ב - בתדירות גבוהה, מושקע עיקר המאמץ בזיהוי מודיעיני של גורמים עויינים מתוך בסיסי מידע רחבים, המתעדכנים בכל רגע באמצעות תיעוד לוויני של שיחות, תכתובות ומאגרי מידע בשדות התעופה.
בארה"ב אף מעוניינים להכניס לשירות בקרוב, בשדות תעופה שונים, מכשירים ייחודים שיוכלו ליצור מאגר נתונים על-סמך צילום טביעת עין, בדיקות DNA ועוד.