תוכנות שהופכות מילים לטקסט באופן פשוט ויעיל הן אוצר של ממש עבור רבים מאיתנו. יכולותיהן הופכות לשימושיות במצבים שונים - למשל, הן יכולות לחסוך לנו את הנטל שכרוך בהקלדת ההודעות שלנו ביישומוני שיחוח (צ׳ט), לסייע בכתיבת הערות במהלך פגישות וראיונות, ולסייע לבעלי מוגבלויות.
בחברת אבטחת המידע ESET מסבירים כי מצד שני, העלייה המטאורית של תוכנות להמרת שמע לטקסט המבוססות על בינה מלאכותית מעלה חששות הנוגעים לאבטחה ופרטיות - ומסיבה טובה. להלן נבחן מספר שיקולי אבטחה עיקריים הקשורים ליישומונים האלה ונמליץ על צעדים פשוטים לצמצום הסיכונים הפוטנציאליים.
סיכונים הקשורים ליישומוני תמלול שמע פרטיות ישנם כמה ישומונים ובוטים ייעודיים שמציעים שירות של תמלול אוטומטי. בנוסף, יכולות כאלה קיימות בצורה מובנית במידה מסוימת במכשירים ובמערכות הפעלה רבות, וגם ביישומוני שיחוח ותקשורת וידאו מוכרות.
האפשרויות האלה, שמסתמכות על זיהוי דיבור ועל אלגוריתמים המבוססים על למידת מכונה, מסופקים ע"י החברה שמפתחת את התוכנה או ע"י שירות חיצוני. האפשרות השנייה מעלה עוד חששות רבים הנוגעים לפרטיות נתונים.
האם קטע השמע ישמש כדי לשפר את האלגוריתם? האם הוא יאוחסן בשרתים, של החברה עצמה או של ספק השירות החיצוני, במהלך עיבוד התוכן? כיצד מאובטחת העברת המידע הזו, במיוחד במקרים בהם עיבוד השמע מבוצע ע"י ספק חיצוני?
כמובן, תמלול ידני, שמבוצע ע"י בני אדם, אינו מגיע ללא סיכונים לפרטיות. זה נכון במיוחד אם האנשים שמתמללים את קטע השמע לומדים את המידע המסווג שנשמע בהם, ואם מידע כזה משותף עם קבלנים חיצוניים ללא הסכמת המשתמש. לדוגמה, חברת פייסבוק (כיום Meta)
ספגה ביקורת ציבורית קשה בשנת 2019 על כך ששילמה למאות קבלנים חיצוניים עבור תמלול הודעות קוליות של משתמשים מסוימים ב-Facebook Messenger.
איסוף נתונים ואחסונם
ישומונים רבים מסוגים שונים מבקשים הרשאות כדי לגשת למידע על המכשיר או על המשתמש, כמו מיקום, אנשי קשר, שיחות ביישומוני מסרים מיידיים - וזאת גם אם אין להם
צורך בהרשאה כזאת כדי למלא את תפקידן. איסוף המידע הזה גורם לסיכון אם המידע מנוצל לרעה או משותף עם גורמים חיצוניים ללא הסכמה מודעת של המשתמש, או אם הוא לא מאובטח כהלכה בשרתי החברה שמאחסנת אותו.
ישומונים לתמלול שמע, למשל, נוטיפ לאסוף קבצי שמע שכוללים לא רק את המילים שנאמרו מפיו של אדם אחד, אלא גם את אלו של כל הקרובים, החברים והשותפים לעבודה. בסופו של דבר, ישומונים כאלה עשויים להפוך את המשתמשים לפגיעים למתקפות סייבר או לפגיעות בפרטיות.
ישומונים זדוניים אם אתם מחפשים תוכנת תמלול, עליכם להיזהר גם מפני ישומונים זדוניים וצ׳טבוטים. גם פושעי סייבר עוקבים אחר המגמות החדשות, ומכיוון שהתוכנות האלה הפכו לפופולריות במיוחד, הם עשויים לנסות ולהשיק ישומונים מזויפים כדי להדביק את קורבנותיהם בנוזקות.
אותם היישומונים הזדוניים עשויים להופיע כהעתקים מדויקים של ישומונים לגיטימיים, מה שיקשה על המשתמשים להבדיל בין הדוף למקור. המזויף עשוי להצליח מאוד במשימתו הזדונית, עד כדי כך שלא תטרחו לבדוק את הלגיטימיות שלו, ובטח לא את מדיניות הפרטיות שלו.
בעבר זוהו מקרים בהם פושעי סייבר השיקו ישומונים הנחזים להיות ישומונים פופולריים, כמו תוכנות להמרת קבצים ולקריאתם, עורכי וידאו ומקלדות חלופיות. למעשה, ראינו מגוון רחב של ישומונים זדוניים שטענו כי הם מציעים אפשרויות שונות, החל בתוכנות לקריאת קבצי PDF
וקודי QR וכלה בתוכנות לתרגום ולעריכת תמונות.
גניבת מידע קטעי שמע וטקסט גנובים יכולים לשמש ככלי לביצוע מתקפות סייבר, ובמיוחד כאלה הכוללים שימוש ב
קטעי שמע מסוג "זיוף עמוק" בהם ניתן להשתמש כחלק ממתקפות הנדסה חברתית או להפצת חדשות כזב.
בדרך כלל, התהליך יהיה מורכב משני שלבים: אימון מודל למידת המכונה ושימוש במודל עצמו. בצעד הראשון, המודל משתמש בטכניקות עיבוד אותות השמע ועיבוד השפה הטבעי כדי ללמוד כיצד מילים שונות מבוטאות וכיצד משפטים בנויים. לאחר שהמודל אומן באמצעות כמות מספקת של נתונים, הוא יוכל ליצור טקסט מתוך קובץ שמע.
תוקף יוכל להשתמש במודל כדי לבצע שינויים בקבצי שמע גנובים ולגרום לקורבנות להגיד דברים שלא אמרו מעולם, באופן שישמש לסחיטה או
להתחזות לקורבן כדי לרמות את המעסיק שלו או קרובי המשפחה שלו. בנוסף, הם יכולים להתחזות לדמות ציבורית כדי ליצור חדשות כזב.