סיווג AI יכול להוסיף תוויות באופן אוטומטי לתוכן רגיש בארגון שלכם ב-Google Drive באמצעות מודלים של AI בהתאמה אישית שהארגון מאמן, בלי צורך בתכנות. אדמינים קובעים על אילו נתונים המודלים מתאמנים, כך שכל מודל הוא ייחודי לארגון שלכם ורק הארגון שלכם יכול להשתמש בו. אתם יכולים ליצור עד 5 מודלים ייחודיים של סיווג קבצים בעזרת AI לארגון שלכם.
אתם יכולים להשתמש בקבצים שסווגו על ידי AI במדיניות אבטחה כמו כללי הגנה על נתונים, Vault ועוד.
הערה: כדי שסיווג ה-AI יוסיף תוויות לקבצים, הם צריכים להיות בתיקיות אחסון שיתופי או בבעלות של משתמשים עם רישיונות שתומכים בתוויות סיווג.
סקירה כללית של סיווג קבצים בעזרת AI
אלה השלבים הבסיסיים להגדרת סיווג באמצעות AI כדי להוסיף תוויות באופן אוטומטי לקבצים חדשים וקיימים ב-Drive.
1. יוצרים מודל: קודם בוחרים או יוצרים תווית סיווג, שמודל ה-AI יחיל באופן אוטומטי על קבצים אחרי האימון שלו. אתם גם יוצרים את תווית האימון, שמשמשת לאימון המודל לזיהוי התוכן הרגיש של הארגון. אחר כך יוצרים מודל AI כדי להשתמש בתוויות האלה.
2. אימון המודל: אחרי שיוצרים את התוויות, המתייגים הייעודיים מסווגים קבצים ב-Drive באמצעות תווית האימון כדי ליצור את מערך נתוני האימון. לאחר מכן המודל משתמש במערך הנתונים כדי ללמוד איך לסווג קבצים רגישים.
3. הפעלת סיווג באמצעות AI: אחרי שהמודל מאומן, אפשר להגדיר תיוג אוטומטי של קבצים, שנקרא החלה אוטומטית. במהלך ההגדרה, בוחרים אילו אפשרויות של תוויות להפעיל ואילו משתמשים הם הבעלים של הקבצים שרוצים שסיווג ה-AI יחיל עליהם תוויות. לאחר מכן המודל מתחיל לתייג באופן אוטומטי קבצים רגישים.
4. מעקב אחרי המודל: אפשר להשתמש ביומן האירועים של Drive כדי לעקוב אחרי מספר הקבצים שסווגו, וגם אחרי מספר המשתמשים שאישרו או שינו תווית שהוחלה באופן אוטומטי (אם יש להם הרשאות).
לפני שמתחילים
- איך עובדות תוויות סיווג ואיך יוצרים אותן. פרטים נוספים זמינים במאמר התחלת העבודה כאדמינים של תוויות סיווג.
- בחירת המתייגים הייעודיים – קבוצת משתמשים בארגון שיכולים להוסיף את תווית האימון באופן ידני לקבצים רגישים.
- יוצרים הגדרות לקבוצת משתמשים רק עבור משתמשים שמוגדרים כמתייגים. הוראות מפורטות מופיעות במאמר בנושא התאמה אישית של הגדרות של שירות באמצעות הגדרות לקבוצות משתמשים.
- מפעילים את ההרשאות הבאות בחשבון האדמין: ניהול תוויות סיווג, ניהול כללי DLP וצפייה בכללי DLP.
יצירת מודל
כדי ליצור מודל, קודם צריך לבחור תווית סיווג קיימת או ליצור תווית חדשה. בשלב הבא, צריך ליצור תווית תואמת לאימון – באופן אוטומטי (מומלץ) או באופן ידני באמצעות המרכז לניהול תוויות – שמתייגת המסמכים המיועדת ישתמש בה.
בחירה או יצירה של תווית סיווג
צריך להפעיל את הסיווג ב-Drive וב-Docs. אחרי האימון, מודל ה-AI מחיל באופן אוטומטי את תווית הסיווג על קבצים רגישים ב-Drive. המודל מאומן על שדה אחד בלבד לכל תווית, שחייב להיות רשימת תגים או רשימת אפשרויות.
מומלץ להשתמש בתווית רגישות עם תיוג, כי היא מוצגת בצורה בולטת במסמכים:
כשמשתמשים בשדה של רשימת אפשרויות או רשימת תגים לתווית סיווג, השדה צריך:
- להכיל לפחות 2 אפשרויות ועד 7 אפשרויות
- לפרסם
אם יש לכם תווית קיימת שעומדת בדרישות האלה, אתם יכולים להשתמש בה כתווית סיווג. אחרת, אפשר להשתמש במנהל התוויות כדי ליצור תווית, לפני או במהלך הגדרת המודל (בהמשך הדף). פרטים נוספים זמינים במאמר בנושא יצירת תוויות סיווג בארגון.
יצירת תווית אימון
תווית האימון כמעט זהה לתווית הסיווג, והיא משמשת רק למטרות אימון על ידי מתייגים ייעודיים. כשיוצרים את המודל (בהמשך הדף הזה), אפשר ליצור אוטומטית את תווית האימון כדי לוודא שהיא תואמת לתווית הסיווג.
אפשר גם ליצור תווית אימון משלכם באופן ידני באמצעות המרכז לניהול תוויות, לפני הגדרת המודל או במהלך ההגדרה. פרטים נוספים מופיעים בהמשך הדף בקטע איך יוצרים ידנית תוויות לאימון?
יצירת המודל
-
במסוף Google Admin, נכנסים לתפריט
אבטחה
שליטה בגישה ובנתונים
סיווג נתונים לקטגוריות.
כדי לעשות את זה צריך הרשאת אדמין לניהול תוויות סיווג.
- בקטע סיווג קבצים בעזרת AI, לוחצים על יצירת מודל.
- ברשימה תווית סיווג, בוחרים תווית סיווג ושדה קיימים לאימון המודל, או לוחצים על יצירת תווית כדי ליצור תווית באמצעות מנהל התוויות.
אם יצרתם תווית במנהל התוויות, חוזרים לדף יצירת מודל. יכול להיות שתצטרכו לרענן את הדף כדי לראות את התווית החדשה ברשימה.
- כדי לבחור את תווית הסיווג, בוחרים את השדה המתאים שרוצים להשתמש בו ברשימה שם השדה.
- לוחצים על המשך.
- (אופציונלי) אפשר ליצור ולפרסם באופן אוטומטי תווית אימון שתואמת לתווית הסיווג:
- לוחצים על יצירת תווית אימון.
- בהודעה שמופיעה, לוחצים על עדכון הרשאות התווית. התווית נפתחת במצב עריכה במנהל התוויות בכרטיסייה נפרדת.
- לוחצים על הרשאות
עריכה, ואז מעניקים את ההרשאה אפשרות להוסיף תוויות ולהגדיר בהן ערכים להגדרות לקבוצת משתמשים שמכילה את המשתמשים שמתייגים את הקבצים.
- לוחצים על שמירה וסוגרים את הכרטיסייה של מרכז ניהול התוויות.
הערה: אפשר גם להגדיר הרשאות לתוויות מאוחר יותר. אבל חשוב שרק למתייגים תהיה גישה לתווית האימון.
- (אופציונלי) אם כבר יצרתם תווית אימון, בוחרים אותה ברשימה תווית אימון.
- (אופציונלי) כדי ליצור תווית אימון משלכם, לוחצים על מעבר למנהל התוויות.
חשוב: מוודאים שהתווית עומדת בקריטריונים של תוויות אימון, ומגדירים את הרשאות הגישה לתווית כך שרק המתייגים יוכלו לגשת אליה. פרטים נוספים מופיעים בקטע הנחיות לגבי תוויות הדרכה בהמשך הדף.
חוזרים לדף יצירת מודל. יכול להיות שתצטרכו לרענן את הדף כדי לראות את תווית האימון החדשה ברשימה.
- בדף יצירת מודל, לוחצים על המשך.
- מזינים שם תיאורי למודל.
- לוחצים על יצירת מודל.
אחרי שיוצרים את המודל, בדף פרטי המודל מוצגות תווית האימון ותווית הסיווג שבחרתם.
אימון המודל
כדי לאמן את מודל ה-AI, צריך ליצור מערך נתונים לאימון ואז להתחיל את תהליך האימון הראשוני. במהלך הרצת אימון, המודל לומד מהדוגמאות במערך הנתונים.
אימון מחדש אוטומטי: אחרי הרצת האימון הראשונית, המודל עובר אימון מחדש כל שבועיים כדי לשפר את רמת הדיוק שלו או לשמור עליה. בכל שלב אפשר לאמן את המודל מחדש ידנית. אחרי כל הרצת אימון מתפרסם מודל חדש, והתזמון האוטומטי של האימון מחדש מתאפס לעוד שבועיים.
יצירת קבוצת נתונים לאימון
כדי ליצור מערך נתונים לאימון, המתייגים הייעודיים צריכים להוסיף את תווית האימון לפחות ל-100 קבצים לכל תווית אפשרית. לדוגמה, אם לתווית יש 3 אפשרויות – נניח 'לשימוש פנימי בלבד', 'סודי' ו'ציבורי' – צריך לפחות 300 קובצי אימון. עם זאת, מומלץ להוסיף יותר מ-100 קבצים לכל תווית אפשרית, כי סביר להניח שחלק מהקבצים לא יעמדו בדרישות של מערך הנתונים לאימון. מידע נוסף על יצירת תוויות לדוגמאות אימון באיכות גבוהה
הערה: מערך הנתונים לאימון יכול לכלול עד מיליון קבצים.
אחרי שיוצרים את המודל, הוא בודק באופן אוטומטי תוך כ-24 שעות כמה קבצים סומנו לצורך אימון. לאחר מכן, המערכת בודקת באופן רציף לאורך כל היום.
כדי לבדוק כמה קבצים סומנו בתווית:
-
במסוף Google Admin, נכנסים לתפריט
אבטחה
שליטה בגישה ובנתונים
סיווג נתונים לקטגוריות.
כדי לעשות את זה צריך הרשאת אדמין לניהול תוויות סיווג.
- בקטע סיווג קבצים בעזרת AI, לוחצים על הצגת nn מודלים.
- בקטע פעולות של המודל, בוחרים באפשרות הצגת פרטים.
- בחלונית שבראש הדף, בקטע קובצי אימון למודל פעיל, אפשר לראות את מספר הקבצים עם התוויות.
אם יש למודל מספיק קבצים לאימון, המצב יהיה 'מוכן לאימון'
הרצת אימון
בדרך כלל הרצת אימון נמשכת 4 עד 6 שעות, אבל היא יכולה להימשך יותר זמן במערכי נתונים גדולים יותר. כדי שהמודל ילמד לתייג את הקבצים בצורה מדויקת, כנראה שיהיה צריך להריץ כמה תהליכי אימון.
במהלך הרצת אימון, המודל משווה את הסיווג שהוא בוחר לקובץ לתווית האימון שמוחלת על הקובץ כדי ליצור ציונים. פרטים נוספים זמינים במאמר איך מחושבים הציונים.
אחרי הרצת אימון, אפשר לבדוק את רמת הדיוק של המודל.
כדי להריץ אימון:
-
במסוף Google Admin, נכנסים לתפריט
אבטחה
שליטה בגישה ובנתונים
סיווג נתונים לקטגוריות.
כדי לעשות את זה צריך הרשאת אדמין לניהול תוויות סיווג.
- בקטע סיווג קבצים בעזרת AI, לוחצים על הצגת nn מודלים.
- בדף פרטי המודל, בקטע פעולות שמתייחס למודל, בוחרים באפשרות הצגת פרטים.
- בחלונית ההדרכה בחלק העליון של הדף, לוחצים על התחלת הרצת אימון.
הערה: הכפתור הזה זמין רק אם המתייגים הוסיפו תוויות למספר המינימלי של קבצים לאימון.
אחרי האימון: בדיקת ציוני המודל
אחרי הרצת אימון, המודל מתפרסם עם ציוני אחוזים לכל אפשרות של תווית. כל ציון, שנקרא ציון היזכרות, הוא אחוז הדוגמאות לאימון שהמודל סיווג בצורה נכונה אחרי שהוא בדק את עצמו:
- מתחת ל-50% – רמת דיוק נמוכה. המודל צריך נתונים טובים יותר והוא עדיין לא מוכן.
- 50% עד 80% – דיוק בינוני. יכול להיות שהמודל יהיה מוכן על בסיס מוגבל.
- מעל 80% – רמת דיוק גבוהה. המודל מוכן לסיווג קבצים בארגון שלכם.
כדי לבדוק את רמת הדיוק של המודל אחרי הרצת אימון:
בדף פרטי המודל אפשר לראות את ציוני המודל:
- בחלונית תוצאות האימון בחלק העליון של הדף, בקטע הקבצים והציונים הנוכחיים שנעשה בהם שימוש
- בחלונית קבוצת הנתונים הנוכחית לאימון
הפעלת סיווג קבצים בעזרת AI
אחרי שמודל ה-AI מאומן להשגת רמת דיוק מינימלית (לפחות 50%), אפשר לבחור אפשרויות לתוויות ולהפעיל תיוג אוטומטי של קבצים, או החלה אוטומטית. עם זאת, כדי להשיג את התוצאות הכי טובות, מומלץ להמתין עד שציוני המודל של כל אפשרויות התיוג יגיעו ל-80% לפחות.
כדי להפעיל את היישום האוטומטי
-
במסוף Google Admin, נכנסים לתפריט
אבטחה
שליטה בגישה ובנתונים
סיווג נתונים לקטגוריות.
כדי לעשות את זה צריך הרשאת אדמין לניהול תוויות סיווג.
- בקטע סיווג קבצים בעזרת AI, לוחצים על הצגת nn מודלים.
- בדף פרטי המודל, בקטע פעולות שמתייחס למודל, בוחרים באפשרות הצגת פרטים.
- בחלונית ההדרכה, לוחצים על הגדרה של החלת המלצות באופן אוטומטי.
הערה: הלחצן הזה זמין רק אם לפחות אפשרות אחת של תוויות הגיעה לרמת דיוק של 50%.
לחלופין, אם הגדרתם בעבר יישום אוטומטי, בקטע קבצים שמסומנים בתווית AI, לוחצים על עריכת היישום האוטומטי.
- מסמנים את התיבות שלצד אפשרויות התוויות שרוצים לאפשר למודל ה-AI ליישם אוטומטית.
- כדי לבחור יחידות ארגוניות או קבוצות ספציפיות שהקבצים שבהן יקבלו תוויות אוטומטיות מהמודל, לוחצים על שמירה והמשך. הגדרת ברירת המחדל היא ארגון ההורה ברמה העליונה.
אפשר גם ללחוץ על שמירה כדי לבחור משתמשים מאוחר יותר.
- אם בחרתם באפשרות 'בחירת משתמשים', בצד, בוחרים יחידה ארגונית או קבוצת משתמשים.
ההגדרות של קבוצות מבטלות את ההגדרות של היחידות הארגוניות. מידע נוסף
- לוחצים על מופעל – התווית מוחלת באופן אוטומטי עם אחת מהאפשרויות שלמטה.
- לוחצים על שמירה.
בדף פרטי המודל, הסטטוס של ההחלה האוטומטית הנוכחית של הכלל הוא מופעל.
הערה: אפשר לעקוב אחרי סיווג קבצים בעזרת AI באמצעות יומן האירועים של Drive. פרטים נוספים זמינים בקטע מעקב אחרי אירועים של תוויות סיווג קבצים בעזרת AI בהמשך הדף.
כשסיווג קבצים בעזרת AI סורק קבצים
אחרי שמפעילים את היישום האוטומטי לקבצים בבעלות המשתמשים ולאחסון שיתופי, סיווג ה-AI סורק את הקבצים (במצב מנוחה) לפחות פעם אחת תוך שבוע עד שבועיים. סיווג באמצעות AI סורק גם קבצים בכל פעם שהם מועלים או משתנים, ויכול לשנות את התווית שהוחלה אם התוכן של הקובץ משתנה.
איך המערכת מטפלת בסתירות בין כללים שמוחלים באופן אוטומטי
כללי הגנה על נתונים
ערכי התוויות שמוגדרים על ידי כללי הגנה על נתונים מקבלים עדיפות על פני סיווג קבצים בעזרת AI, ושניהם מקבלים עדיפות על פני סיווג ברירת מחדל.
מספר כללים
אם 2 כללים או יותר מאותו סוג מנסים להחיל על אותו קובץ אפשרויות שונות של תוויות, תוחל האפשרות שמופיעה גבוה יותר ברשימת האפשרויות של התווית. לדוגמה, יכול להיות שיש לכם תווית עם שדה שכולל 3 אפשרויות במרכז ניהול התוויות:
- סודי
- פנימי
- גלוי לכולם
אם כלל 1 מנסה להגדיר את התווית כסודית וכלל 2 מנסה להגדיר את התווית כציבורית לאותו קובץ, התווית סודית תוחל. לפני שמגדירים כללים, חשוב לוודא שאפשרויות השדה של התווית מופיעות בסדר העדיפות המועדף.
תוויות שהמשתמשים מוסיפים
לתוויות שמשתמשים מוסיפים לקבצים יש עדיפות על פני תוויות שנוספו באמצעות AI. כלומר, סיווג קבצים בעזרת AI לא משנה תוויות שמשתמשים הגדירו בעבר.
מעקב אחרי המודל
פרטים על האופן שבו סיווג קבצים בעזרת AI מתייג קבצים ביומן האירועים של Drive. לכל אפשרות של תווית, ביומן מוצג מספר הקבצים שסווגו באמצעות החלה אוטומטית ומספר המשתמשים שאישרו את התווית שהוחלה אוטומטית או שינו אותה. למשתמשים צריכות להיות הרשאות כדי לבצע פעולות על תוויות שמוחלות באופן אוטומטי.
ההרשאות שנדרשות למשתמשים כדי ליצור אינטראקציה עם תוויות שהוחלו באופן אוטומטי
כדי לבצע פעולות בתוויות שהמערכת החילה באופן אוטומטי, המשתמשים צריכים הרשאות לקובץ ולתווית. אפשר להגדיר הרשאות לתווית הסיווג במרכז ניהול התוויות. פרטים נוספים זמינים במאמר בנושא יצירת תוויות סיווג בארגון.
- כדי לראות תוויות שנוספו אוטומטית, המשתמשים צריכים לקבל את ההרשאה אפשר לראות את התווית הזו לתווית הסיווג.
- כדי לאשר ולשנות תוויות שנוספו באופן אוטומטי, המשתמשים צריכים את ההרשאה אפשרות להוסיף תוויות ולהגדיר בהן ערכים לתווית הסיווג, וצריכה להיות להם הרשאת עריכה או בעלות על הקובץ.
הצגת אירועי סיווג קבצים בעזרת AI ביומן האירועים של Drive
-
במסוף Google Admin, נכנסים לתפריט
אבטחה
שליטה בגישה ובנתונים
סיווג נתונים לקטגוריות.
כדי לעשות את זה צריך הרשאת אדמין לניהול תוויות סיווג.
- בקטע סיווג קבצים בעזרת AI, לוחצים על הצגת nn מודלים.
- בדף פרטי המודל, בקטע קבצים עם תוויות AI, בוחרים באפשרות הצגת קבצים של אפשרות התווית שרוצים לראות את האירועים שלה.
הכלי לחקירת אבטחה נפתח בכרטיסייה חדשה, ומוצגות בו תוצאות החיפוש ביומן האירועים של Drive לגבי שני אירועים שקשורים לסיווג באמצעות AI: התווית הוחלה והערך של שדה התווית השתנה.
- לוחצים על תיאור האירוע כדי לקבל פרטים נוספים, כמו:
- השם והסוג של המסמך שסומן
- הערך של שדה התווית שהוקצה למסמך (לדוגמה, סודי או מוגבל)
ניהול המודל
השבתת ההחלה האוטומטית של תווית סיווג
כדי להשבית את ההחלה האוטומטית לכל האפשרויות של התוויות או רק לאפשרויות ספציפיות:
-
במסוף Google Admin, נכנסים לתפריט
אבטחה
שליטה בגישה ובנתונים
סיווג נתונים לקטגוריות.
כדי לעשות את זה צריך הרשאת אדמין לניהול תוויות סיווג.
- בקטע סיווג קבצים בעזרת AI, לוחצים על הצגת nn מודלים.
- בדף פרטי המודל, בקטע פעולות שמתייחס למודל, בוחרים באפשרות הצגת פרטים.
- בקטע קבצים עם תוויות שנוצרו על ידי AI, לוחצים על עריכת ההחלה האוטומטית.
- מבטלים את הסימון בתיבות של אפשרויות התוויות שרוצים להשבית את ההוספה האוטומטית שלהן.
כדי להשהות לחלוטין את ההוספה האוטומטית, צריך לבטל את הסימון בכל האפשרויות.
כדי להשבית לחלוטין את ההחלה האוטומטית ביחידות ארגוניות או בקבוצות ספציפיות:
אפשר להשבית לגמרי את ההחלה האוטומטית על תוכן בבעלות המשתמשים ביחידות ארגוניות או בקבוצות ספציפיות.
-
במסוף Google Admin, נכנסים לתפריט
אבטחה
שליטה בגישה ובנתונים
סיווג נתונים לקטגוריות.
כדי לעשות את זה צריך הרשאת אדמין לניהול תוויות סיווג.
- בקטע סיווג קבצים בעזרת AI, לוחצים על הצגת nn מודלים.
- בדף פרטי המודל, בקטע פעולות שמתייחס למודל, בוחרים באפשרות הצגת פרטים.
- בתפריט פעולות נוספות בראש הדף, לוחצים על ניהול יישום אוטומטי
עדכון של יחידות ארגוניות או קבוצות שהופעלו.
- בצד ימין, לוחצים על יחידה ארגונית או קבוצה כדי לבחור אותה.
- בוחרים באפשרות מושבת – התווית לא מוחלת באופן אוטומטי.
- לוחצים על שמירה.
מחיקת מודל
יכול להיות שתצטרכו למחוק מודל – למשל, אם דיוק המודל לא משתפר. אם מוחקים מודל, כל הגדרות סיווג קבצים בעזרת AI שלו מוסרות באופן סופי. הערה:
- התוויות שנעשה בהן שימוש רק במודל הזה יוסרו מהגדרות הסיווג, וכל הגרסאות של המודל יימחקו.
- תוויות האימון יישארו בקבצים. אחרי שמוחקים את המודל, אפשר להגדיר מודל חדש לשימוש באותה תווית אימון (או בתווית אחרת).
- כל החלת תוויות אוטומטית שהפעלתם למודל הזה תופסק מיד, אבל תוויות שכבר הוחלו באופן אוטומטי יישארו בקבצים.
- אם משאירים את תווית האימון וקובצי האימון הקיימים, תוצאות המודל יהיו דומות.
- אם יוצרים מחדש את אותה תווית סיווג למודל חדש, תכונת סיווג קבצים בעזרת AI מתעלמת מהסיווגים של מודלים קודמים ומחליפה אותם. כך תוכלו לעבד מחדש את הקבצים של הארגון ב-Drive. האפשרות הזו יכולה להיות שימושית אם ביצעתם שיפורים משמעותיים באיכות המודל מאז הפריסה הראשונית.
כדי למחוק מודל:
-
במסוף Google Admin, נכנסים לתפריט
אבטחה
שליטה בגישה ובנתונים
סיווג נתונים לקטגוריות.
כדי לעשות את זה צריך הרשאת אדמין לניהול תוויות סיווג.
- בקטע סיווג קבצים בעזרת AI, לוחצים על הצגת nn מודלים.
- בדף פרטי המודל, בקטע פעולות שמתייחס למודל, בוחרים באפשרות הצגת פרטים.
- בדף פרטי המודל, בקטע פעולות בצד שמאל, לוחצים על מחיקת המודל.
בתיבת הדו-שיח מחיקת המודל מפורטים ההשפעות של מחיקת המודל.
- כדי להמשיך, לוחצים על מחיקת המודל.
שאלות נפוצות
תוויות אימון וסיווג
מהן הדרישות לתוויות סיווג ולתוויות אימון?
גם תוויות הסיווג וגם תוויות האימון צריכות לעמוד בקריטריונים הבאים:
- צריך להוסיף לפחות 2 אפשרויות ולא יותר מ-7 אפשרויות.
- האפשרויות שלהם צריכות להיות באותו סדר.
לדוגמה, אם לתווית הסיווג יש אפשרויות בסדר הזה:
- אפשרות 1
- אפשרות 2
- אפשרות 3
אי אפשר לסדר את האפשרויות של תווית האימון באופן הבא:
- אפשרות 2
- אפשרות 1
- אפשרות 3
- חובה לפרסם את האפליקציה.
- להשתמש בתוויות עם הרשאות גישה שונות. תווית האימון צריכה להיות זמינה רק לאנשים בארגון שיכולים להוסיף תוויות, כדי שהם יוכלו לאמן את המודל. יכול להיות שלתווית הסיווג יש גישה רחבה יותר.
איך יוצרים תווית אימון באופן ידני?
- מוודאים שהתווית עומדת בקריטריונים הנדרשים לתווית.
- כדי שהמתייגים הייעודיים יוכלו לזהות את תווית האימון ולהחיל אותה בקלות כשיוצרים את מערך נתוני האימון, כדאי להוסיף לתווית את המילה train או training.
- מוסיפים שדה תיאור לתווית האימון כדי לעזור עוד יותר למי שמוגדרים לתייג להבין את המטרה שלה.
- חשוב להגדיר את הרשאות התווית לרק המתייגים הייעודיים שלכם – כלומר, אלה שיזהו קבצים לאימון המודל – באמצעות הגדרות לקבוצת משתמשים שיצרתם למתייגים. למשתמשים שמוסיפים תוויות צריכה להיות הרשאה מסוג אפשרות להחיל תוויות ולהגדיר עבורן ערכים. פרטים נוספים זמינים במאמר בנושא יצירת תוויות סיווג בארגון.
האם אפשר להשתמש בתווית הסיווג כתווית אימון?
מערכי נתונים לאימון
אילו קבצים מתאימים לאימון המודל?
כדי לקבל את התוצאות הטובות ביותר באימון המודל, חשוב שהאנשים בארגון שיכולים להוסיף תוויות יפעלו לפי ההנחיות הבאות:
- ודאו שכל קובץ מכיל לפחות 500 תווים.
- בוחרים קבצים שמייצגים תוכן שהמשתמשים יוצרים, משתפים ומשתמשים בו בארגון.
- מומלץ להוסיף תווית למספר דומה של קבצים לכל אפשרות של תווית, עם מינימום של 100 קבצים לכל אפשרות. כך המודל יכול להבין את הנתונים בצורה מקיפה ולשפר את הציונים.
- צריך לכלול מגוון מייצג של קבצים לכל סוג אפשרות. לדוגמה, אל תסמנו 100 קורות חיים כקבוצה הכוללת של קבצים לדוגמה לסיווג 'סודי ביותר' אם חוזים הם גם סוג קובץ נפוץ עם הסיווג 'סודי ביותר' בארגון שלכם.
- החלת התווית של ההדרכה רק על קבצים שנמצאים בבעלות הארגון, בין אם הם בבעלות ישירה של משתמשים או מאוחסנים בתיקיות אחסון שיתופי. סיווג קבצים בעזרת AI לא מעבד קבצים שנמצאים בבעלות של משתמשים חיצוניים או באחסון שיתופי חיצוני.
האם אפשר לאמן את המודל על קבצים שכבר תויגו?
האם אפשר לאמן את המודל בכמה שפות?
איך הציונים מחושבים במהלך ההדרכה?
אחרי שאני מאמן מודל, האם אפשר "להקפיא" אותו כדי להפסיק את האימון מחדש באופן אוטומטי?
האם משתמשים יכולים לשנות או לתקן תוויות וערכים בשדות?
הוספה אוטומטית
האם סיווג קבצים בעזרת AI יכול להעריך תמונות, סרטונים וקובצי אודיו?
האם סיווג קבצים בעזרת AI פועל רק כדי להוסיף תוויות לתוכן רגיש?
האם סיווג קבצים בעזרת AI פועל כשההצפנה מצד הלקוח (CSE) מופעלת?
איך ומתי סיווג קבצים בעזרת AI משנה את התוויות שנוספו אוטומטית?
אחרי שמפעילים את ההחלה האוטומטית, סיווג קבצים בעזרת AI סורק ומסווג את כל הקבצים במצב מנוחה שמהם הוא יכול לחלץ מספיק טקסט. הקבצים האלה נסרקים לפחות פעם אחת.
סיווג הקבצים בעזרת AI מעבד מחדש קבצים באופן תקופתי כשהתוכן משתנה. שינויים בתוכן עשויים להוביל לחיזוי שונה של קובץ. אם סיווג קבצים בעזרת AI מזהה אפשרות ישנה ואפשרות חדשה לקובץ, הוא יבחר באפשרות שמופיעה גבוה יותר ברשימת האפשרויות. לדוגמה, אם בשדה יש שלוש אפשרויות שמופיעות במרכז ניהול התוויות:
- סודי
- פנימי
- גלוי לכולם
נניח שסיווג קבצים בעזרת AI מסווג קובץ כפנימי, והתוכן משתנה כך שמודל סיווג ה-AI חוזה סודי. במקרה הזה, הסיווג של הקובץ ישתנה לסודי. עם זאת, אם המודל לסיווג קבצים בעזרת AI חוזה שהסיווג הוא גלוי לכולם, הסיווג של הקובץ יישאר פנימי.
סיווג קבצים בעזרת AI לא משנה תוויות שהוחלו אוטומטית וערכים בשדות שנבדקו או שונו על ידי משתמשים.
אם המודל משתנה, האם המודל מעריך מחדש קבצים קיימים באופן אוטומטי?
הקבצים שלכם מעובדים על ידי המודל העדכני ביותר כשהם נוצרים או משתנים. כשמתפרסמת גרסה חדשה של מודל, קבצים קיימים לא עוברים עיבוד מחדש באופן אוטומטי. עם זאת, יכול להיות שהמודל יעבד מחדש את כל הקבצים שלכם מעת לעת עם הגרסה העדכנית, ללא קשר לעדכונים ספציפיים של המודל או לאימון מחדש.
האם סיווג קבצים בעזרת AI מקבל עדיפות על פני שיטות סיווג אחרות כשיש כמה שיטות פעילות?
- כלל DLP ללא החלפה של משתמש
- סיווג ידני
- כלל DLP עם שינוי של משתמש
- סיווג קבצים בעזרת AI
- סיווג ברירת המחדל
לאילו סוגים של קבצים אפשר להוסיף תוויות סיווג קבצים בעזרת AI?
- סיווג קבצים בעזרת AI משתמש באותו עיבוד של טקסט שניתן לאינדוקס כמו ב-DLP ב-Drive. פרטים נוספים מופיעים ברשימת סוגי הקבצים שנסרקים על ידי DLP. אין תמיכה בקובצי אודיו ווידאו.
- כדי שסיווג קבצים בעזרת AI יוסיף תווית לקובץ, הקובץ צריך להכיל כמות מינימלית של טקסט. כתוצאה מכך, יכול להיות שקבצים מסוימים, כמו מסמכים קצרים מאוד ותמונות עם כמויות קטנות של טקסט, לא יסווגו.
מה קורה כשמשביתים אפשרות להחלה אוטומטית?
קבצים שסיווג קבצים בעזרת AI הוסיף להם תוויות בעבר ישמרו את התווית ואת ערכי האפשרויות גם אחרי שהאפשרות מושבתת.
האם אפשר לבטל את ההחלה האוטומטית של תוויות?
רישוי
איך התכונה פועלת אצל משתמשים שאין להם רישיון מתאים?
הבעלות על קבצים עם תווית אימון יכולה להיות של כל משתמש שיש לו רישיון שתומך בתוויות סיווג ב-Drive. עם זאת, סיווג קבצים בעזרת AI מוסיף תוויות רק לקבצים שנמצאים באחסון שיתופי או בבעלות של משתמשים עם רישיונות שתומכים בסיווג קבצים בעזרת AI. קבצים שנמצאים בבעלות משתמשים שאין להם רישיון נתמך לא יעברו עיבוד על ידי סיווג קבצים בעזרת AI.
אם לאף משתמש אין רישיון שתומך בסיווג קבצים בעזרת AI, היישום האוטומטי מושבת ומודל הסיווג נמחק. עם זאת, תוויות אימון ותוויות שמוחלות על ידי סיווג קבצים בעזרת AI נשארות בקבצים.