הוספה אוטומטית של תוויות לקבצים ב-Google Drive באמצעות סיווג בעזרת AI

התכונה הזו כלולה במהדורות Frontline Plus ו-Enterprise Plus. היא כלולה גם בתוספים Gemini Enterprise–Legacy,‏ Gemini Education Premium ו-AI Security. השוואה בין תוספים

סיווג קבצים בעזרת AI יכול לתייג באופן אוטומטי תוכן רגיש בארגון שלכם ב-Google Drive באמצעות מודלים מותאמים אישית של AI שהארגון מאמן, בלי צורך בתכנות. בתור אדמינים, אתם קובעים את הנתונים שמשמשים לאימון המודלים, כך שכל מודל הוא ייחודי לארגון שלכם ורק הארגון יכול להשתמש בו. אתם יכולים ליצור עד 5 מודלים ייחודיים של סיווג קבצים בעזרת AI לארגון שלכם.

אתם יכולים להשתמש בקבצים שסווגו על ידי AI במדיניות אבטחה כמו כללי הגנה על נתונים, Vault ועוד.

הערה: כדי שסיווג ה-AI יוסיף תוויות לקבצים, הם צריכים להיות בתיקיות אחסון שיתופי או בבעלות של משתמשים עם רישיונות שתומכים בתוויות סיווג.

סקירה כללית של סיווג קבצים בעזרת AI

אלה השלבים הבסיסיים להגדרת סיווג באמצעות AI כדי להוסיף תוויות באופן אוטומטי לקבצים חדשים וקיימים ב-Drive.

1. יצירת מודל: קודם בוחרים או יוצרים תווית סיווג, שמודל ה-AI יחיל באופן אוטומטי על קבצים אחרי האימון שלו. בנוסף, יוצרים את תווית האימון, שמשמשת לאימון המודל לזיהוי התוכן הרגיש של הארגון. אחר כך יוצרים מודל AI כדי להשתמש בתוויות האלה.

2. אימון המודל: אחרי שיוצרים את התוויות, המתייגים הייעודיים מסווגים קבצים ב-Drive באמצעות תווית האימון כדי ליצור את מערך נתוני האימון. לאחר מכן המודל משתמש במערך הנתונים כדי ללמוד איך לסווג קבצים רגישים.

3. הפעלת סיווג קבצים בעזרת AI: אחרי שהמודל מאומן, אפשר להגדיר תיוג אוטומטי של קבצים, שנקרא החלה אוטומטית. במהלך ההגדרה, בוחרים אילו אפשרויות של תוויות להפעיל ואילו משתמשים הם הבעלים של הקבצים שרוצים שסיווג קבצים בעזרת AI יחיל עליהם תוויות. לאחר מכן המודל מתחיל לתייג באופן אוטומטי קבצים רגישים.

4. מעקב אחרי המודל: אפשר להשתמש ביומן האירועים של Drive כדי לעקוב אחרי מספר הקבצים שסווגו, וגם אחרי מספר המשתמשים שאישרו או שינו תווית שהוחלה באופן אוטומטי (אם יש להם הרשאות).

לפני שמתחילים

יצירת מודל

כדי ליצור מודל, קודם צריך לבחור תווית סיווג קיימת או ליצור תווית חדשה. בשלב הבא, צריך ליצור תווית תואמת לאימון – באופן אוטומטי (מומלץ) או באופן ידני באמצעות המרכז לניהול תוויות – שמתייגי התוויות המיועדים ישתמשו בה.

בחירה או יצירה של תווית סיווג

צריך להפעיל את הסיווג ב-Drive וב-Docs. אחרי האימון, מודל ה-AI מחיל באופן אוטומטי את תווית הסיווג על קבצים רגישים ב-Drive. המודל מאומן על שדה אחד בלבד לכל תווית, שחייב להיות רשימת תגים או רשימת אפשרויות.

מומלץ להשתמש בתווית רגישות עם תיוג, כי היא מוצגת בצורה בולטת במסמכים:

כשמשתמשים בשדה של רשימת אפשרויות או רשימת תגים לתווית סיווג, השדה צריך:

  • להכיל לפחות 2 אפשרויות ועד 7 אפשרויות
  • לפרסם

אם יש לכם תווית קיימת שעומדת בדרישות האלה, אתם יכולים להשתמש בה כתווית סיווג. אחרת, אפשר להשתמש במנהל התוויות כדי ליצור תווית, לפני או במהלך הגדרת המודל (בהמשך הדף). פרטים נוספים זמינים במאמר בנושא יצירת תוויות סיווג בארגון.

יצירת תווית אימון

תווית האימון כמעט זהה לתווית הסיווג, והיא משמשת רק למטרות אימון על ידי מתייגים ייעודיים. כשיוצרים את המודל (בהמשך הדף), אפשר ליצור אוטומטית את תווית האימון כדי לוודא שהיא תואמת לתווית הסיווג.

אפשר גם ליצור תווית אימון משלכם באופן ידני באמצעות המרכז לניהול תוויות, לפני שמגדירים את המודל או במהלך ההגדרה. פרטים נוספים מופיעים בהמשך הדף בקטע איך יוצרים ידנית תוויות לאימון?

יצירת המודל

  1. במסוף Google Admin, נכנסים לתפריט ואז אבטחה ואז שליטה בגישה ובנתונים ואז סיווג נתונים לקטגוריות.

    כדי לעשות את זה צריך הרשאות אדמין לצפייה בכללי DLP וניהול כללי DLP.

  2. בקטע סיווג קבצים בעזרת AI, לוחצים על יצירת מודל.
  3. ברשימה תווית סיווג, בוחרים תווית סיווג ושדה קיימים לאימון המודל, או לוחצים על יצירת תווית כדי ליצור תווית באמצעות מנהל התוויות.

    אם יצרתם תווית במנהל התוויות, חוזרים לדף יצירת מודל. יכול להיות שתצטרכו לרענן את הדף כדי לראות את התווית החדשה ברשימה.

  4. כדי לבחור את תווית הסיווג, בוחרים את השדה המתאים שרוצים להשתמש בו ברשימה שם השדה.
  5. לוחצים על המשך.
  6. (אופציונלי) אפשר ליצור ולפרסם באופן אוטומטי תווית אימון שתואמת לתווית הסיווג:
    1. לוחצים על יצירת תווית אימון.
    2. לוחצים על עדכון הרשאות התווית בהודעה שמופיעה. התווית נפתחת במצב עריכה במנהל התוויות בכרטיסייה נפרדת.
    3. לוחצים על הרשאות ואז עריכה, ואז מעניקים את ההרשאה אפשרות להוסיף תוויות ולהגדיר בהן ערכים להגדרות לקבוצת משתמשים שמכילה את המשתמשים שמתייגים את הקבצים.
    4. לוחצים על שמירה וסוגרים את הכרטיסייה של מרכז ניהול התוויות.

      הערה: אפשר להגדיר את הרשאות הגישה לתווית גם בשלב מאוחר יותר, אבל חשוב שרק המתייגים יקבלו גישה לתווית האימון.

  7. (אופציונלי) אם כבר יצרתם תווית אימון, בוחרים אותה ברשימה תווית אימון.
  8. (אופציונלי) כדי ליצור תווית אימון משלכם, לוחצים על מעבר למרכז לניהול תוויות.

    חשוב: ודאו שהתווית שלכם עומדת בקריטריונים של תוויות אימון, והגדירו את הרשאות הגישה לתווית כך שרק המתייגים יוכלו לגשת אליה. פרטים נוספים מופיעים בהמשך הדף בקטע הנחיות לגבי תוויות הדרכה.

    חוזרים לדף יצירת מודל. יכול להיות שתצטרכו לרענן את הדף כדי לראות את תווית האימון החדשה ברשימה.

  9. בדף יצירת מודל, לוחצים על המשך.
  10. מזינים שם תיאורי למודל.
  11. לוחצים על יצירת מודל.

אחרי שיוצרים את המודל, בדף פרטי המודל מוצגות תווית האימון ותווית הסיווג שבחרתם.

אימון המודל

כדי לאמן את מודל ה-AI, צריך ליצור מערך נתונים לאימון ואז להתחיל את הרצת האימון הראשונית. במהלך הרצת אימון, המודל לומד מהדוגמאות במערך הנתונים.

האימון מחדש מתבצע אוטומטית: אחרי הרצת האימון הראשונית, המודל עובר אימון מחדש כל שבועיים כדי לשפר את רמת הדיוק שלו או לשמור עליה. אפשר לאמן את המודל מחדש ידנית בכל שלב. אחרי כל הרצת אימון מתפרסם מודל חדש, והתזמון האוטומטי של האימון מחדש מתאפס לעוד שבועיים.

יצירת קבוצת נתונים לאימון

כדי ליצור מערך נתונים לאימון, המתייגים הייעודיים צריכים להוסיף את תווית האימון לפחות ל-100 קבצים לכל תווית אפשרית. לדוגמה, אם לתווית יש 3 אפשרויות – נניח 'לשימוש פנימי בלבד', 'סודי' ו'ציבורי' – צריך לפחות 300 קובצי אימון. עם זאת, מומלץ להוסיף יותר מ-100 קבצים לכל תווית אפשרית, כי סביר להניח שחלק מהקבצים לא יעמדו בדרישות של מערך הנתונים לאימון. מידע נוסף על יצירת תוויות לדוגמאות אימון באיכות גבוהה

הערה: מערך הנתונים לאימון יכול לכלול עד מיליון קבצים.

אחרי שיוצרים את המודל, הוא בודק באופן אוטומטי תוך כ-24 שעות כמה קבצים סומנו לצורך אימון. לאחר מכן, המערכת בודקת באופן רציף לאורך כל היום.

כדי לבדוק כמה קבצים סומנו בתווית:

  1. במסוף Google Admin, נכנסים לתפריט ואז אבטחה ואז שליטה בגישה ובנתונים ואז סיווג נתונים לקטגוריות.

    כדי לעשות את זה צריך הרשאות אדמין לצפייה בכללי DLP וניהול כללי DLP.

  2. בקטע סיווג קבצים בעזרת AI, לוחצים על הצגת nn מודלים.
  3. בקטע פעולות של המודל, בוחרים באפשרות הצגת פרטים.
  4. בחלונית שבראש הדף, בקטע קובצי אימון למודל פעיל, אפשר לראות את מספר הקבצים עם התוויות.

אם יש למודל מספיק קבצים לאימון, המצב יהיה 'מוכן לאימון'

הרצת אימון

הרצת אימון נמשכת בדרך כלל 4 עד 6 שעות, אבל יכולה להימשך יותר זמן אם קבוצות הנתונים גדולות יותר. כנראה שיהיה צריך להריץ כמה הרצות אימון כדי שהמודל ילמד איך להוסיף תווית לקבצים בצורה מדויקת.

במהלך הרצת אימון, המודל משווה את הסיווג שהוא בוחר לקובץ לתווית האימון שמוחלת על הקובץ כדי ליצור ציונים. פרטים נוספים זמינים במאמר איך מחושבים הציונים.

אחרי הרצת אימון, אפשר לבדוק את רמת הדיוק של המודל.

כדי להתחיל הרצת אימון:

  1. במסוף Google Admin, נכנסים לתפריט ואז אבטחה ואז שליטה בגישה ובנתונים ואז סיווג נתונים לקטגוריות.

    כדי לעשות את זה צריך הרשאות אדמין לצפייה בכללי DLP וניהול כללי DLP.

  2. בקטע סיווג קבצים בעזרת AI, לוחצים על הצגת nn מודלים.
  3. בדף פרטי המודל, בקטע פעולות שמתחת למודל, בוחרים באפשרות הצגת פרטים.
  4. בחלונית ההדרכה בחלק העליון של הדף, לוחצים על התחלת הרצת אימון.

    הערה: הכפתור הזה זמין רק אם המתייגים הוסיפו תוויות למספר המינימלי של קובצי אימון.

אחרי האימון: בדיקת ציוני המודל

אחרי הרצת אימון, המודל מתפרסם עם ציוני אחוזים לכל תווית אפשרית. כל ציון, שנקרא ציון היזכרות, הוא אחוז הדוגמאות לאימון שהמודל סיווג בצורה נכונה אחרי שהוא בדק את עצמו:

  • מתחת ל-50% – רמת דיוק נמוכה. המודל צריך נתונים טובים יותר והוא עדיין לא מוכן.
  • בין 50% ל-80% – דיוק בינוני. יכול להיות שהמודל מוכן לשימוש מוגבל.
  • מעל 80% – רמת דיוק גבוהה. המודל מוכן לסיווג קבצים בארגון שלכם.

כדי לבדוק את רמת הדיוק של המודל אחרי הרצת אימון:

בדף פרטי המודל אפשר לראות את ציוני המודל:

  • בחלונית תוצאות האימון בחלק העליון של הדף, בקטע הקבצים והציונים הנוכחיים שנעשה בהם שימוש
  • בחלונית קבוצת הנתונים הנוכחית לאימון

הפעלת סיווג קבצים בעזרת AI

אחרי שמודל ה-AI עובר אימון ומגיע לרמת דיוק מינימלית (לפחות 50%), אפשר לבחור אפשרויות לתוויות ולהפעיל תיוג אוטומטי של קבצים או החלה אוטומטית. עם זאת, כדי להשיג את התוצאות הכי טובות, מומלץ לחכות עד שהציונים של המודל לכל האפשרויות לתוויות יגיעו ל-80% לפחות.

כדי להפעיל את היישום האוטומטי

  1. במסוף Google Admin, נכנסים לתפריט ואז אבטחה ואז שליטה בגישה ובנתונים ואז סיווג נתונים לקטגוריות.

    כדי לעשות את זה צריך הרשאות אדמין לצפייה בכללי DLP וניהול כללי DLP.

  2. בקטע סיווג קבצים בעזרת AI, לוחצים על הצגת nn מודלים.
  3. בדף פרטי המודל, בקטע פעולות שמתחת למודל, בוחרים באפשרות הצגת פרטים.
  4. בחלונית ההדרכה, לוחצים על הגדרה של החלת המלצות באופן אוטומטי.

    הערה: הלחצן הזה זמין רק אם לפחות אפשרות אחת של תווית הגיעה לדיוק של 50%.

    לחלופין, אם כבר הגדרתם יישום אוטומטי, בקטע קבצים שמסומנים בתווית AI, לוחצים על עריכת היישום האוטומטי.

  5. מסמנים את התיבות שלצד אפשרויות התוויות שרוצים לאפשר למודל ה-AI להחיל באופן אוטומטי.
  6. כדי לבחור יחידות ארגוניות או קבוצות שהן הבעלים של הקבצים שהמודל צריך להחיל עליהם תוויות באופן אוטומטי, לוחצים על שמירה והמשך. הגדרת ברירת המחדל היא הארגון הראשי ברמה העליונה.

    אפשר גם ללחוץ על שמירה כדי לבחור משתמשים מאוחר יותר.

  7. אם בחרתם באפשרות 'בחירת משתמשים', בצד, בוחרים יחידה ארגונית או קבוצת משתמשים.

    הגדרות של קבוצות מבטלות את ההגדרות של היחידות הארגוניות. מידע נוסף

  8. לוחצים על מופעל – התווית מוחלת באופן אוטומטי עם אחת מהאפשרויות שלמטה.
  9. לוחצים על שמירה.

    בדף פרטי המודל, הסטטוס של החלה אוטומטית נוכחית של הכלל הוא מופעל.

הערה: אפשר לעקוב אחרי סיווג קבצים בעזרת AI באמצעות יומן האירועים של Drive. פרטים נוספים זמינים בקטע מעקב אחרי אירועים של סיווג קבצים בעזרת AI בהמשך הדף.

כשסיווג קבצים בעזרת AI סורק קבצים

אחרי שמפעילים את היישום האוטומטי לקבצים שבבעלות משתמשים ולתיקיות ב-Drive שמשותפות עם כולם, סיווג ה-AI סורק את הקבצים (במצב מנוחה) לפחות פעם אחת תוך שבוע עד שבועיים. סיווג ה-AI סורק גם קבצים בכל פעם שהם מועלים או משתנים, ויכול לשנות את התווית שהוחלה אם התוכן של הקובץ משתנה.

איך המערכת מטפלת בסתירות בין כללים שמוחלים באופן אוטומטי

כללי הגנה על נתונים

ערכי התוויות שמוגדרים על ידי כללים להגנה על נתונים מקבלים עדיפות על פני סיווג קבצים בעזרת AI, ושניהם מקבלים עדיפות על פני סיווג ברירת מחדל.

מספר כללים

אם שני כללים מאותו סוג או יותר מנסים להחיל אפשרויות שונות של תוויות על אותו קובץ, האפשרות שמופיעה גבוה יותר ברשימת האפשרויות של התווית היא זו שתחול. לדוגמה, יכול להיות שיש לכם תווית עם שדה שכולל 3 אפשרויות במנהל התוויות:

  1. סודי
  2. פנימי
  3. גלוי לכולם

אם כלל 1 מנסה להגדיר את התווית כסודית וכלל 2 מנסה להגדיר את התווית כציבורית לאותו קובץ, התווית סודית תוחל. לפני שמגדירים כללים, חשוב לוודא שאפשרויות השדה של התווית מופיעות בסדר העדיפות המועדף.

תוויות שהמשתמשים מוסיפים

לתוויות שמשתמשים מחילים על קבצים יש עדיפות על פני תוויות שהוחלו על ידי AI – כלומר, סיווג קבצים בעזרת AI לא משנה תוויות שמשתמש הגדיר בעבר.

מעקב אחרי המודל

אפשר לקבל פרטים על האופן שבו סיווג קבצים בעזרת AI מתייג קבצים ביומן האירועים של Drive. לכל אפשרות של תווית, ביומן מוצג מספר הקבצים שסווגו באמצעות החלה אוטומטית ומספר המשתמשים שאישרו את התווית שהוחלה אוטומטית או שינו אותה. למשתמשים צריכות להיות הרשאות לביצוע פעולות על תוויות שהוחלו אוטומטית.

ההרשאות שנדרשות למשתמשים כדי ליצור אינטראקציה עם תוויות שמוחלות באופן אוטומטי

כדי שהמשתמשים יוכלו לעבוד עם תוויות שמוחלות אוטומטית, הם צריכים הרשאות לקבצים ולתוויות. אפשר להגדיר הרשאות לתווית הסיווג במנהל התוויות. פרטים נוספים זמינים במאמר יצירת תוויות סיווג לארגון.

  • כדי לראות תוויות שנוספו אוטומטית, המשתמשים צריכים לקבל את ההרשאה אפשר לראות את התווית הזו לתווית הסיווג.
  • כדי לאשר ולשנות תוויות שנוספו באופן אוטומטי, המשתמשים צריכים לקבל את ההרשאה אפשרות להוסיף תוויות ולהגדיר בהן ערכים לתווית הסיווג, וצריכה להיות להם הרשאת עריכה או בעלות על הקובץ.

הצגת אירועי סיווג קבצים בעזרת AI ביומן האירועים של Drive

  1. במסוף Google Admin, נכנסים לתפריט ואז אבטחה ואז שליטה בגישה ובנתונים ואז סיווג נתונים לקטגוריות.

    כדי לעשות את זה צריך הרשאות אדמין לצפייה בכללי DLP וניהול כללי DLP.

  2. בקטע סיווג קבצים בעזרת AI, לוחצים על הצגת nn מודלים.
  3. בדף פרטי המודל, בקטע קבצים עם תוויות שנוצרו על ידי AI, בוחרים באפשרות הצגת קבצים של אפשרות התווית שרוצים לראות את האירועים שלה.

    הכלי לחקירת אבטחה נפתח בכרטיסייה חדשה, ומוצגות בו תוצאות חיפוש ביומן האירועים של Drive לגבי שני אירועים שקשורים לסיווג באמצעות AI: הוחלה תווית והערך של שדה התווית השתנה.

  4. לוחצים על תיאור האירוע כדי לקבל פרטים נוספים, כמו:
    • השם והסוג של המסמך שסומן
    • הערך של שדה התווית שהוקצה למסמך (לדוגמה, סודי או מוגבל)

ניהול המודל

השבתת ההוספה האוטומטית של תווית סיווג

כדי להשבית את ההחלה האוטומטית לכל האפשרויות של התוויות או רק לאפשרויות ספציפיות:

  1. במסוף Google Admin, נכנסים לתפריט ואז אבטחה ואז שליטה בגישה ובנתונים ואז סיווג נתונים לקטגוריות.

    כדי לעשות את זה צריך הרשאות אדמין לצפייה בכללי DLP וניהול כללי DLP.

  2. בקטע סיווג קבצים בעזרת AI, לוחצים על הצגת nn מודלים.
  3. בדף פרטי המודל, בקטע פעולות שמתחת למודל, בוחרים באפשרות הצגת פרטים.
  4. בקטע קבצים עם תוויות שנוצרו על ידי AI, לוחצים על עריכת ההחלה האוטומטית.
  5. מבטלים את הסימון בתיבות של אפשרויות התוויות שרוצים להשבית את ההוספה האוטומטית שלהן.

    כדי להשהות לחלוטין את ההוספה האוטומטית, מבטלים את הסימון של כל האפשרויות.

כדי להשבית לחלוטין את ההחלה האוטומטית ביחידות ארגוניות או בקבוצות ספציפיות:

אפשר להשבית לגמרי את היישום האוטומטי של תוויות לתוכן בבעלות משתמשים ביחידות ארגוניות או בקבוצות ספציפיות.

  1. במסוף Google Admin, נכנסים לתפריט ואז אבטחה ואז שליטה בגישה ובנתונים ואז סיווג נתונים לקטגוריות.

    כדי לעשות את זה צריך הרשאות אדמין לצפייה בכללי DLP וניהול כללי DLP.

  2. בקטע סיווג קבצים בעזרת AI, לוחצים על הצגת nn מודלים.
  3. בדף פרטי המודל, בקטע פעולות שמתחת למודל, בוחרים באפשרות הצגת פרטים.
  4. בתפריט פעולות נוספות בראש הדף, לוחצים על ניהול של יישום אוטומטי ואז עדכון של יחידות ארגוניות או קבוצות שמופעלות.
  5. בצד ימין, לוחצים על יחידה ארגונית או קבוצה כדי לבחור אותה.
  6. בוחרים באפשרות מושבת – התווית לא מוחלת באופן אוטומטי.
  7. לוחצים על שמירה.

מחיקת מודל

יכול להיות שתצטרכו למחוק מודל – למשל, אם רמת הדיוק של המודל לא משתפרת. אם מוחקים מודל, כל הגדרות סיווג ה-AI שלו מוסרות באופן סופי. הערה:

  • התוויות שנעשה בהן שימוש רק במודל הזה יוסרו מהגדרות הסיווג, וכל הגרסאות של המודל יימחקו.
  • תוויות האימון נשארות בקבצים. אחרי מחיקת המודל, אפשר להגדיר מודל חדש שישתמש באותה תווית אימון (או בתווית אחרת).
  • כל החלת תוויות אוטומטית שהפעלת למודל הזה תופסק מיד, אבל תוויות שכבר הוחלו באופן אוטומטי יישארו בקבצים.
  • אם משאירים את תווית האימון וקובצי האימון הקיימים, תוצאות המודל יהיו דומות.
  • אם יוצרים מחדש את אותה תווית סיווג עבור מודל חדש, תכונת סיווג קבצים בעזרת AI מתעלמת מהסיווגים של מודלים קודמים ומחליפה אותם. כך אפשר לבצע 'עיבוד מחדש' של קבצים ב-Drive של הארגון. זה יכול להיות שימושי אם ביצעתם שיפורים משמעותיים באיכות המודל מאז הפריסה הראשונית.

כדי למחוק מודל:

  1. במסוף Google Admin, נכנסים לתפריט ואז אבטחה ואז שליטה בגישה ובנתונים ואז סיווג נתונים לקטגוריות.

    כדי לעשות את זה צריך הרשאות אדמין לצפייה בכללי DLP וניהול כללי DLP.

  2. בקטע סיווג קבצים בעזרת AI, לוחצים על הצגת nn מודלים.
  3. בדף פרטי המודל, בקטע פעולות שמתחת למודל, בוחרים באפשרות הצגת פרטים.
  4. בדף פרטי המודל, בקטע פעולות בצד שמאל, לוחצים על מחיקת המודל.

    בתיבת הדו-שיח מחיקת המודל מפורטים ההשפעות של מחיקת המודל.

  5. כדי להמשיך, לוחצים על מחיקת המודל.

שאלות נפוצות

תוויות אימון וסיווג

מהן הדרישות לתוויות האימון והסיווג?

גם תווית הסיווג וגם תווית האימון צריכות לעמוד בקריטריונים הבאים:

  • צריך להוסיף לפחות 2 אפשרויות ולא יותר מ-7 אפשרויות.
  • האפשרויות שלהם צריכות להיות באותו סדר.

    לדוגמה, אם לתווית הסיווג יש אפשרויות בסדר הזה:

    1. אפשרות 1
    2. אפשרות 2
    3. אפשרות 3

    אי אפשר לסדר את האפשרויות של תווית האימון באופן הבא:

    1. אפשרות 2
    2. אפשרות 1
    3. אפשרות 3
  • חובה לפרסם את האפליקציה.
  • להשתמש בתוויות עם הרשאות גישה שונות. תווית האימון צריכה להיות זמינה רק למתייגים ייעודיים שיכולים לאמן את המודל. יכול להיות שלתווית הסיווג תהיה גישה רחבה יותר.

איך יוצרים תווית אימון באופן ידני?

מומלץ ליצור את תווית האימון באופן אוטומטי כשמגדירים את המודל, אבל אפשר גם ליצור אותה באופן ידני במרכז ניהול התוויות. כדי לעשות את זה, צריך לפעול לפי ההנחיות הבאות:
  • מוודאים שהתווית עומדת בקריטריונים הנדרשים לתווית.
  • כדי שהמתייגים הייעודיים יוכלו לזהות את תווית האימון ולהחיל אותה בקלות כשיוצרים את מערך נתוני האימון, כדאי להוסיף לתווית את המילה train או training.
  • מוסיפים שדה תיאור לתווית האימון כדי לעזור עוד יותר למי שמוגדרים לתייג להבין את המטרה שלה.
  • חשוב להגדיר את הרשאות התווית לרק המתייגים הייעודיים – כלומר, אלה שיזהו קבצים לאימון המודל – באמצעות הגדרות לקבוצת משתמשים שיצרתם למתייגים. המתייגים צריכים את ההרשאה יכולים להוסיף תוויות ולהגדיר ערכים. פרטים נוספים זמינים במאמר בנושא יצירת תוויות סיווג לארגון.

האם אפשר להשתמש בתווית הסיווג כתווית אימון?

לא, תווית הסיווג ותווית האימון חייבות להיות שונות. התווית שבוחרים כתווית סיווג לא זמינה כתווית אימון.

מערכי נתונים לאימון

אילו קבצים מתאימים לאימון המודל?

כדי לקבל את התוצאות הטובות ביותר באימון המודל, האנשים בארגון שיכולים להוסיף תוויות צריכים לפעול לפי ההנחיות הבאות:

  • חשוב לוודא שכל קובץ מכיל לפחות 500 תווים.
  • בוחרים קבצים שמייצגים תוכן שהמשתמשים יוצרים, משתפים ומשתמשים בו בארגון.
  • מומלץ להוסיף תווית למספר דומה של קבצים לכל אפשרות של תווית, עם מינימום של 100 קבצים לכל אפשרות. כך המודל יכול להבין את הנתונים בצורה מקיפה ולשפר את הציונים.
  • צריך לכלול מגוון מייצג של קבצים לכל סוג אפשרות. לדוגמה, אם חוזים הם גם סוג נפוץ של קובץ סודי ביותר בארגון, אל תסמנו 100 קורות חיים כקבוצה הכוללת של קבצים לדוגמה לסיווג סודי ביותר.
  • החלת התווית של ההדרכה רק על קבצים שנמצאים בבעלות הארגון, כלומר קבצים שנמצאים בבעלות ישירה של משתמשים או קבצים שמאוחסנים בתיקיות אחסון שיתופי. סיווג קבצים בעזרת AI לא מעבד קבצים שנמצאים בבעלות של משתמשים חיצוניים או קבצים שנמצאים באחסון שיתופי חיצוני.

האם אפשר לאמן את המודל על קבצים שכבר סומנו?

בשלב הזה, אי אפשר לאמן את המודל על קבצים שסומנו בעבר. כדי שהמודל יוכל להחיל תווית באופן אוטומטי על קבצים, צריך להגדיר תווית אימון שהיא העתק של התווית הזו, אבל אי אפשר להשתמש באותה תווית.

האם אפשר לאמן את המודל בכמה שפות?

המודל תומך בכמה שפות, אבל צריך לכלול בנתוני האימון מדגם מייצג של קבצים לכל סוג אפשרות ושפה. כך גדל מספר הקבצים שנדרשים כדי לאמן את המודל בהצלחה. המודל תומך רק בשפות שמבוססות על אותיות לטיניות.

איך הציונים מחושבים במהלך ההדרכה?

במהלך האימון, מודל ה-AI משתמש ב-75% מנתוני הקלט כדי לאמן את עצמו איך לתייג קבצים, ושומר 25% מהנתונים כדי לבדוק מעת לעת את הביצועים שלו. במילים אחרות, לגבי 25% מהקבצים המתויגים, המודל מנתח את הקבצים האלה כאילו הוא לא יודע איזו תווית הוחלה עליהם. לאחר מכן, מודל ה-AI בוחר תווית משלו ומשווה את הבחירה הזו לתווית בפועל שהוחלה על ידי המתייג הייעודי. הציונים מראים את שיעור הקבצים השמורים שהמודל הקצה להם נכון את התווית הנכונה.

אחרי שאני מאמן מודל, האם אפשר "להקפיא" אותו כדי להפסיק את האימון מחדש באופן אוטומטי?

מודלים של סיווג קבצים בעזרת AI מתאמנים באמצעות קבצים ב-Drive. כשקבצים כאלה נמחקים (לרוב לפי לוחות זמנים לשמירת נתונים דרך Google Vault), צריך למחוק גם את המודל כדי לוודא שהתוכן של הקבצים לא יישמר בצורה כלשהי. לכן, אימון מחדש של המודל מתבצע בלולאה רציפה ואי אפשר להשהות אותו.

האם משתמשים יכולים לשנות או לתקן תוויות וערכים בשדות?

משתמשים עם הרשאה יכולים לעדכן תווית או ערך בשדה, אבל סיווג קבצים בעזרת AI לא משנה את מודל הסיווג על סמך השינוי הזה. אם שמתם לב שהמודל הוסיף תוויות וערכי שדות בצורה שגויה, אתם יכולים לבקש מהמתייגים הייעודיים להקצות לקבצים את תווית האימון הנכונה. לאחר מכן, סיווג קבצים בעזרת AI משלב את הנתונים האלה במחזור הבא של אימון עצמי של המודל.

הוספה אוטומטית

האם סיווג קבצים בעזרת AI יכול להעריך תמונות, סרטונים וקובצי אודיו?

סיווג קבצים בעזרת AI משתמש באותו עיבוד של טקסט שניתן לאינדוקס כמו ב-DLP ב-Drive. אפשר להעריך כל קובץ ש-Drive יכול לחלץ ממנו טקסט שניתן לאינדוקס, כדי להחיל עליו תוויות סיווג באמצעות AI. היא כוללת זיהוי תווים אופטי (OCR) לחילוץ טקסט מתמונות. עם זאת, סיווג קבצים בעזרת AI לא בודק קובצי וידאו או אודיו.

האם סיווג קבצים בעזרת AI פועל רק כדי להוסיף תוויות לתוכן רגיש?

התכונה 'סיווג קבצים בעזרת AI' מתמקדת בעיקר בתוכן רגיש, אבל אפשר לאמן כל תווית עם עד 4 אפשרויות לתיוג אוטומטי. תוויות סיווג משמשות גם לביקורת, לאיתור ולניהול שמירה.

האם סיווג קבצים בעזרת AI פועל כשההצפנה מצד הלקוח (CSE) מופעלת?

מכיוון ש-Google לא יכולה לפענח קבצים שהוצפנו באמצעות CSE (רק מפתח ההצפנה הפרטי שלכם יכול), סיווג קבצים בעזרת AI לא יכול להתאמן על קבצים שהוצפנו באמצעות CSE ולא יכול להחיל תוויות על הקבצים האלה באופן אוטומטי.

איך ומתי סיווג קבצים בעזרת AI משנה את התוויות שנוספו אוטומטית?

אחרי שמפעילים את ההחלה האוטומטית, סיווג קבצים בעזרת AI סורק ומסווג את כל הקבצים במצב מנוחה שמהם הוא יכול לחלץ מספיק טקסט. הקבצים האלה נסרקים לפחות פעם אחת.

סיווג קבצים בעזרת AI מעבד מחדש קבצים באופן תקופתי כשהתוכן משתנה. שינויים בתוכן עשויים להוביל לחיזוי שונה לגבי קובץ. כשהסיווג קבצים בעזרת AI כולל גם אפשרות ישנה וגם אפשרות חדשה לגבי קובץ, הוא ייתן עדיפות לאפשרות שמופיעה גבוה יותר ברשימת האפשרויות. לדוגמה, אם בשדה מסוים מופיעות שלוש אפשרויות במנהל התוויות:

  • סודי
  • פנימי
  • גלוי לכולם

נניח שסיווג קבצים בעזרת AI מסווג קובץ כפנימי, והתוכן משתנה כך שמודל סיווג ה-AI חוזה סודי. במקרה כזה, הסיווג של הקובץ משתנה לסודי. עם זאת, אם מודל סיווג ה-AI חוזה ציבורי, הסיווג של הקובץ נשאר פנימי.

סיווג קבצים בעזרת AI לא משנה תוויות שהוחלו אוטומטית וערכים בשדות שנבדקו או שונו על ידי משתמשים.

אם המודל משתנה, האם המודל מעריך מחדש קבצים קיימים באופן אוטומטי?

הקבצים שלכם עוברים עיבוד על ידי המודל העדכני ביותר כשהם נוצרים או משתנים. קבצים קיימים לא עוברים עיבוד מחדש באופן אוטומטי כשגרסה חדשה של המודל מתפרסמת. עם זאת, יכול להיות שהמודל יעבד מחדש את כל הקבצים שלכם מעת לעת באמצעות הגרסה העדכנית ביותר, ללא קשר לעדכונים ספציפיים של המודל או לאימון מחדש.

האם סיווג קבצים בעזרת AI מקבל עדיפות על פני שיטות סיווג אחרות כשיש כמה שיטות פעילות?

אפשר לבטל את סיווג הנתונים. סיווג הנתונים מתבצע לפי הסדר הבא:
  1. כלל DLP ללא החלפה של משתמש
  2. סיווג ידני
  3. כלל DLP עם החלפה של משתמש
  4. סיווג קבצים בעזרת AI
  5. סיווג ברירת המחדל
הסרה של תווית או שדה מאפשרת למנגנון סיווג ברמה נמוכה יותר לפעול. לדוגמה, אם משתמש מסיר תווית מקובץ, יכול להיות שסיווג קבצים בעזרת AI יוסיף את אותה תווית לקובץ מאוחר יותר.

לאילו סוגים של קבצים אפשר להוסיף תוויות סיווג באמצעות AI?

  • סיווג קבצים בעזרת AI משתמש באותו עיבוד של טקסט שניתן להוספה לאינדקס כמו ב-DLP ב-Drive. פרטים נוספים זמינים ברשימת סוגי הקבצים שנסרקים על ידי DLP. קובצי אודיו ווידאו לא נתמכים.
  • כדי שסיווג קבצים בעזרת AI יוסיף תווית לקובץ, הוא צריך להכיל כמות מינימלית של טקסט. כתוצאה מכך, יכול להיות שקבצים מסוימים, כמו מסמכים קצרים מאוד ותמונות עם כמויות קטנות של טקסט, לא יסווגו.

מה קורה כשמשביתים אפשרות להחלה אוטומטית?

במהלך הסריקה, אם יש תחזית שלפיה לקובץ יש אפשרות שההוספה האוטומטית שלה מושבתת, סיווג ה-AI לא מוסיף לקובץ תוויות או ערכים של שדות.

קבצים שסיווג קבצים בעזרת AI הוסיף להם תוויות בעבר ישמרו את התווית ואת ערכי האפשרויות גם אחרי שהאפשרות מושבתת.

האם אפשר לבטל את ההחלה האוטומטית של תוויות?

אי אפשר לבטל את החלת התוויות. מומלץ לחדד ולבדוק את המודלים עם קהל קטן לפני שמבצעים פריסה רחבה. לדוגמה, אתם יכולים לאמן את המודלים עם תווית זמנית. אחרי שהביצועים של המודל יהיו משביעי רצון, תוכלו 'לאפס' את המודל על ידי מחיקתו ויצירת מודל חדש עם אותה תווית אימון (אותו אוסף נתוני אימון), אבל עם התווית הקבועה שלכם.

רישוי

איך התכונה פועלת אצל משתמשים שאין להם רישיון מתאים?

אם לאדמין בארגון שלכם יש רישיון שתומך בסיווג קבצים בעזרת AI, הוא יכול לאמן מודל. למתייגים ייעודיים (המשתמשים שמחילים את תווית האימון) לא צריך להיות רישיון עם סיווג קבצים בעזרת AI.

הבעלות על קבצים עם תווית האימון יכולה להיות של כל משתמש שיש לו רישיון שתומך בתוויות סיווג ב-Drive. עם זאת, סיווג קבצים בעזרת AI מוסיף תוויות רק לקבצים שנמצאים באחסון שיתופי או בבעלות של משתמשים עם רישיונות שתומכים בסיווג קבצים בעזרת AI. קבצים שנמצאים בבעלות משתמשים שאין להם רישיון נתמך לא יעברו עיבוד על ידי סיווג קבצים בעזרת AI.

אם לאף משתמש אין רישיון שתומך בסיווג קבצים בעזרת AI, ההחלה האוטומטית מושבתת ומודל הסיווג נמחק. עם זאת, תוויות אימון ותוויות שהוחלו על ידי סיווג קבצים בעזרת AI נשארות בקבצים.

איך התכונה פועלת עבור משתמשים בארכיון?

משתמשים עם רישיון ל-Google Workspace Enterprise Plus – Archived User יקבלו סיווג של הקבצים שלהם באמצעות AI.

איך מתחילים לעבוד כאדמינים של תוויות ב-Drive